상세정보
미리보기
데이터 사이언스 교과서
- 저자
- 하시모토 히로시,마키노 코오지 공저/권기태 역
- 출판사
- 성안당
- 출판일
- 2020-11-12
- 등록일
- 2021-05-10
- 파일포맷
- PDF
- 파일크기
- 42MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
데이터 사이언스는 ‘데이터를 과학적으로 다루는’ 학문 분야로 데이터를 통해 실제 현상을 이해하고 분석하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으로 정의되기도 한다. 또, 데이터를 채굴하듯이 수많은 데이터 가운데 유용한 정보를 추출해 내고 의사결정에 활용하는 데이터 마이닝(Data Mining)과 유사하게 다양한 형태의 데이터로부터 지식과 인사이트를 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합 분야로 이해되기도 한다. 최근 정보통신 기술의 비약적 발전으로 유무선 인터넷을 통해 얻을 수 있는 데이터의 양이 폭발적으로 증가한 데다 컴퓨터/모바일 기기의 고성능화가 진전되어 지금까지 할 수 없던 빅데이터 처리가 가능해져 한층 더 주목받고 있다.
저자소개
1988년 와세다대학교 대학원 이공학연구과 박사 과정
현재 산업기술대학원 대학창조기술연구과 교수
공학박사(와세다대학교)
주요 저서
- 『도해 컴퓨터 개론 [하드웨어]』(개정 4판), 옴사(2017), 공저
- 『도해 컴퓨터 개론 [소프트웨어·통신 네트워크]』(개정 4판), 옴사(2017), 공저
- 『Scilab로 배우는 시스템 제어의 기초』 옴사(2007), 공저
- 『전기회로교본』 옴사(2001), 그 외 저서 다수
목차
제1장 서론 1.1 데이터 과학 개요1.1.1 읽기 전에1.1.2 데이터 과학이란1.1.3 데이터 과학의 영역과 역할1.1.4 데이터를 보는 안목을 기른다1.2 파이썬과 패키지1.2.1 파이썬(Pyhton)의 도입1.2.2 이 책에서 이용하는 패키지1.3 몇 가지 약속1.3.1 노트북(Notebook)과 스크립트1.3.2 모듈 이름의 생략어1.3.3 파일명의 생략1.3.4 패키지 함수 사용법의 조사 방법1.4 퀵 스타트1.4.1 설치1.4.2 주피터 노트북(Jupyter Notebook)·스크립트의 구현과 실행 방법1.4.3 프로그램과 데이터를 구하는 방법1.5 파이썬을 이용한 한글 처리1.5.1 스크립트에 한글을 기술한다1.5.2 한글을 포함한 데이터 파일 읽기1.5.3 matplotlib로 한글을 표시한다1.6 용어의 차이1.6.1 설명 변수/목적변수, 입력/출력1.6.2 표본과 데이터1.6.3 예측과 추정1.6.4 클래스 분류1.6.5 트레이닝 데이터, 테스트 데이터1.6.6 오버피팅1.6.7 분석 1.6.8 변수1.6.9 상관과 공분산1.7 수학, 수치계산, 물리의 시작1.7.1 수학의 시작1.7.2 수치계산의 문제1.7.3 물리의 시작제2장 데이터 처리와 가시화 2.1 데이터의 종류2.2 데이터의 취득2.3 데이터의 저장2.3.1 numpy.ndarray2.3.2 pandas.DataFrame2.3.3 numpy.ndarray와 pandas.DataFrame의 변환2.4 그래프 작성2.4.1 matplotlib.2.4.2 복수의 그래프2.4.3 Titnic(타이타닉호)의 pandas 그래프 그리기2.4.4 Iris(아이리스)의 seaborn 그래프.2.4.5 Iris 데이터제3장 확률의 기초 3.1 확률이란3.2 기본적인 용어의 설명3.2.1 이산확률 변수3.2.2 연속확률 변수3.2.3 확률밀도 함수, 확률질량 함수와 백분위점55 3.2.4 모집단과 표본3.2.5 평균, 분산, 그 외의 양.3.2.6 이산형의 기댓값과 평균.3.3 정규분포3.3.1 정규분포의 표현3.3.2 확률 변수의 생성3.3.3 중심극한정리3.4 포아송분포3.4.1 포아송분포의 표현3.4.2 포아송분포의 예3,4,3 포아송 도착 모델의 시뮬레이션3.4.4 역 함수를 이용한 난수 생성.3.5 확률분포와 패키지 함수3.5.1 베르누이분포(Bernoulli distribution)3.5.2 이항분포(binomial distribution)3.5.3 포아송분포(Poisson distribution)3.5.4 카이제곱분포(chi-squared distribution)3.5.5 지수분포(exponential distribution)3.5.6 분포( distribution)3.5.7 정규분포(normal distribution)3.5.8 분포( distribution)3.5.9 균일분포(uniform distribution)제4장 통계의 기초 4.1 통계란4.2 추정.4.2.1 점추정4.2.2 구간추정4.2.3 모평균의 신뢰구간4.2.4 모비율의 신뢰구간4.3 가설검정4.3.1 가설검정이란4.3.1 단측검정과 양측검정4.3.3 모평균의 검정4.3.4 모분산의 검정4.3.5 두 표본의 평균 차이에 대한 검정4.3.6 상관, 무상관의 검정제5장 회귀분석 5.1 회귀분석이란5.1.1 회귀의 유래5.1.2 시스템 이론에서 본 회귀분석5.1.3 statsmodels5.2 단순회귀분석5.2.1 단순회귀분석의 의의5.2.2 단순회귀 모델의 통계적 평가5.2.3 가계 동향 조사5.2.4 심슨의 역설5.2.5 수학적 설명5.3 다항식회귀분석5.3.1 다항식 모델5.3.2 R 데이터 세트 cars5.4 중회귀분석5.4.1 검정5.4.2 다중공선성5.4.3 전력과 기온의 관계5.4.4 와인의 품질분석5.4.5 수학적 설명5.5 일반화 선형 모델5.5.1 일반화 선형 모델의 개요5.5.2 포아송 회귀 모델5.5.3 z = β0의 예5.5.4 z = β0 + β0χ1의 예 5.5.5 로지스틱 회귀 모델5.5.6 수학적 설명제6장 패턴 인식 6.1 패턴 인식의 개요6.1.1 패턴 인식이란6.1.2 클래스 분류의 성능 평가6.1.3 홀드아웃과 교차검증6.1.4 이 장에서 다루는 패턴 인식 방법6.2 서포트 벡터 머신(SVM)6.2.1 클래스 분류와 마진의 최대화6.2.2 비선형 분리의 아이디어6.2.3 선형, 원형 데이터의 하드 마진6.2.4 소프트웨어 마진과 홀드아웃6.2.5 교차검증과 그리드 서치6.2.6 멀티클래스 분류6.3 SVM의 수학적 설명6.3.1 마진 최대화6.3.2 커널 함수의 이용6.3.3 소프트 마진6.4 최근접 이웃법(κNN)6.4.1 알고리즘의 논리6.4.2 κNN의 기본적 사용법6.4.3 Iris 데이터6.4.4 sklearn이 제공하는 거리6.5 평균법6.5.1 알고리즘의 논리6.5.2 make_blobs를 이용한 클러스터링6.5.3 도매업자의 고객 데이터6.5.4 수학적 설명6.6 응집형 계층 클러스터링6.6.1 알고리즘의 논리6.6.2 덴드로그램6.6.3 도야마현의 시읍면별 인구 동태제7장 심층학습 7.1 심층학습의 개요와 종류7.1.1 심층학습이란7.1.2 심층학습의 활용 예7.1.3 용어의 설명7.2 Chainer7.2.1 개요와 설치7.2.2. 실행과 평가7.2.3 κNN용 스크립트의 설명7.3 NN(신경망)7.3.1 개요와 계산 방법7.3.2 κNN 스크립트의 변경7.4 DNN(심층 신경망)7.4.1 개요와 실행7.4.2 파일 데이터의 처리 방법7.5 CNN(합성곱 신경망)7.5.1 개요와 계산 방법7.5.2 학습과 검증7.5.3 트레이닝 데이터의 작성법7.6 QL(Q학습)7.6.1 개요와 계산 방법7.6.2 실행 방법7.6.3 병따기 게임7.7 DQN(심층 Q네트워크)7.7.1 개요7.7.2 실행 방법7.7.3 병따기 게임제8장 시계열 데이터 분석 8.1 동적 시스템8.1.1 인과성과 동적 시스템8.1.2 동적 시스템의 선형 모델8.1.3 1차 시스템의 시간응답8.1.4 2차 시스템의 시간응답8.2 이산 시간계8.2.1 이산화8.2.2 샘플링 시간의 선정8.2.3 이산 시간계의 차분형식의 해석8.2.4 지연 연산자 8.2.5 이산 시간 모델 도입의 문제 설정8.3 ARMA 모델8.3.1 ARMA 모델의 표현8.3.2 가식별성과 PE성의 조건8.3.3 입력 신호 후보와 항의 문제8.3.4 ARMA 모델의 안전성과 성질8.3.5 파라미터 추정8.4 모델의 평가8.4.1 모델 차수의 선정과 AIC8.4.2 모델 차수의 선정과 극·영점 소거법8.4.3 잔차 계열의 검정8.5 ARMA 모델을 이용한 예측8.5.1 예측 방법8.6 ARIMA 모델8.6.1 트렌드8.6.2 ARIMA 모델의 표현8.6.3 트렌드를 가진 시계열 데이터 분석8.7 SARIMAX 모델8.7.1 항공사의 승객 수8.7.2 그 외의 계절성 데이터8.8 주가 데이터의 시계열 분석 8.8.1 이동평균8.8.2 볼린저 밴드8.8.3 캔들 차트제9장 스펙트럼 분석 9.1 기본 사항9.1.1 주파수란 소리를 내는 것9.1.2 스펙트럼이란9.2 푸리에 변환9.2.1 푸리에 변환과 푸리에 역변환9.2.2 진폭, 에너지, 파워 스펙트럼9.3 현실의 문제점9.3.1 샘플링 문제9.3.2 엘리어싱9.3.3 유한 장파형의 문제점9.4 이산 푸리에 변환(DFT)9.4.1 DFT의 표현9.4.2 사인파의 DFT 예9.4.3 제로 패딩9.5 윈도우 함수9.5.1 윈도우 함수의 종류9.5.2 윈도우 함수의 사용 예9.5.3 수학적 표현9.6 랜덤 신호의 파워 스펙트럼 밀도9.6.1 파워 스펙트럼 밀도의 표현9.9.2 PSD는 확률 변수제10장 디지털 필터 10.1 필터의 개요10.1.1 필터란10.1.2 필터 특성10.1.3 데시벨 [dB]10.2 아날로그 필터의 설계10.2.1 버터워스 필터10.2.2 체비셰프 필터10.3 디지털 필터의 설계10.3.1 디지털 필터의 도입10.3.2 디지털 필터의 구조10.3.3 FIR 필터10.3.4 IIR 필터10.3.5 정규화 각주파수10.4 FIR 필터의 설계10.4.1 윈도우 함수를 이용한 설계 방법10.4.2 설계 예10.5 IIR 필터의 설계10.5.1 아날로그 필터에 기초한 방법10.5.2 설계 예제11장 이미지 처리 11.1 이미지 처리의 개요11.1.1 색 좌표계11.1.2 수치로서의 표현11.1.3 표본화와 양자화11.1.4 이미지 데이터 입수하기11.1.5 OpenCV의 문서 11.1.6 실행 방법11.2 이미지 처리의 예11.2.1 2진화11.2.2 에지 검출11.2.3 주파수 필터링11.2.4 특징점 추출11.3 기타11.3.1 카메라에서 이미지 불러오기11.3.2 광학 흐름11.3.3 얼굴 인식참고문헌맺음말 색인