상세정보
미리보기
대격변 AI 시대, 데이터로 사고하고 데이터로 리드하라
- 저자
- 알렉스 거트맨,조던 골드마이어 공저/최재원,장진욱 공역
- 출판사
- 책만
- 출판일
- 2024-07-05
- 등록일
- 2024-10-30
- 파일포맷
- EPUB
- 파일크기
- 75MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
먼지 쌓인 데이터, 여러분의 조직은 잘 활용하고 있습니까? 데이터와 통계를 모르고, AI 시대의 기술과 비즈니스를 논할 수 없다!변동성으로 가득한 세상, 그 이면의 패턴을 찾아내자! 데이터 과학 뒤에 감춰진 장막을 걷어내고 “데이터에 대해 비판적으로 사고하고 말하고 이해하고 행동하기 위한 지식과 노하우”를 알려준다. 조직 구성원의 성향을 파악하는 일부터 알고리즘 이면의 수학 원리에 이르기까지, 실무에서 활용되는 데이터와 통계에 관한 모든 것을 한 권에 간추렸다. 이 책에서는 데이터 과학 비즈니스를 잘 헤쳐 나갈 수 있는 분석 도구, 용어, 사고방식을 습득하고 데이터에 관련된 어려운 문제를 조금 더 깊게 이해할 수 있다. 학습을 통해 데이터와 분석 결과에 대해 비판적으로 사고하고 데이터에 관한 모든 일에 대해 똑똑하게 자신의 의견을 말할 수 있게 될 것이다.
저자소개
데이터 과학자, 기업 교육 강사, 공인 전문 통계학자(Accredited Professional Statistician)이며 풀브라이트 전문가(Fulbright Specialist) 프로그램 장학금을 받았다. 전문가와 일반인을 대상으로 데이터 과학에 관한 다양한 주제를 강연하고 있다. 공군기술대학원(Air Force Institute of Technology)에서 응용수학 박사 학위를 취득했고 현재 겸임교수로 재직 중이다.
목차
[1부] 데이터로 사고하고 리드하기 위한 첫 여정 1장 무엇이 문제일까_데이터 리드라면 반드시 물어야 할 질문들___이 문제는 왜 중요한가___이 문제는 누구에게 영향을 미치는가___적절한 데이터가 없을 경우 어떻게 해야 할까___프로젝트는 언제 종료되는가___결과가 만족스럽지 못할 경우 어떻게 해야 할까_데이터 프로젝트는 왜 실패했을까___고객 인식도___생각해 볼 사항_중요한 문제에 집중하자_정리2장 데이터란 무엇인가_데이터 vs 정보___데이터셋 예시_데이터 유형_데이터는 어떻게 수집되고 정형화되는가___관측 데이터 vs 실험 데이터___정형 데이터 vs 비정형 데이터_기본적인 요약 통계량_정리3장 통계적 사고를 위한 준비를 갖추자_질문을 하자_모든 것에는 변동성이 있다___고객 인식도 시나리오(후속편)___사례 연구: 신장암 발병률_확률과 통계___확률 vs 직관___통계학을 활용한 발견_정리[2부] 데이터를 대하는 태도, 확률과 통계 지식 4장 데이터와 논쟁하자_여러분이라면 어떻게 했을까___누락된 데이터가 초래한 재앙_데이터의 근원을 확인하자___누가 데이터를 수집했는가___데이터는 어떤 방식으로 수집됐나_데이터에 대표성이 있는가___표본 추출에 편향이 있었는가___이상값을 어떻게 처리했는가_확인하지 않은 데이터는 무엇인가___어떤 방법으로 결측값을 처리했는가___측정하려는 개념을 측정할 수 있는 데이터인가_크기를 막론하고 모든 데이터와 논쟁하자_정리5장 데이터를 탐색하자_데이터 리드의 탐색적 데이터 분석_탐색적 사고의 필요성__어떤 질문을 해야 할까___가상 시나리오 _데이터는 여러분의 질문에 답할 수 있는가___기대치를 설정하고 상식적으로 생각하자___직관적으로 이해할 수 있는 데이터 값인가___이상값과 결측값을 잘 관리하라_데이터에서 어떤 관계성이 보이는가___상관관계를 이해하자 ___상관관계를 오해하지 않도록 주의하자 ___상관관계가 인과관계를 의미하지는 않는다 _데이터에서 새로운 탐색 기회를 찾았는가_정리6장 확률이란 무엇인가_추측해 보자_게임의 법칙___수학적 표기___조건부 확률과 독립 사건___여러 사건의 발생 확률___동시에 발생하는 두 사건_확률에 대한 사고 실험___확률에 대한 3가지 체크 포인트_사건들이 서로 독립이라 가정할 때는 주의해야 한다 ___도박꾼의 오류에 빠지지 말자_모든 확률은 조건부 확률임을 인지하자___의존 관계를 바꾸지 말자___베이즈 정리_의미가 있는 확률인지를 반드시 확인한다___보정___가능성이 희박해도 사건은 일어난다_정리7장 통계에 도전하자_통계적 추론이란___오차의 여지를 남기자___데이터가 많아질수록 증거도 늘어난다___현재 상황에 의문을 제기하자___현 상황에 반하는 증거가 있는가___판단 오류 균형 잡기_통계적 추론 과정_통계 분석 결과를 검증하기 위해 필요한 질문___어떤 맥락에서 나온 통계 분석 결과인가___표본의 크기는 얼마인가___무엇을 검증하는가___귀무가설은 무엇인가___유의 수준은 얼마인가___얼마나 많이 검증했는가___신뢰 구간을 제시할 수 있는가___실제적으로 의미 있는 결과인가___인과 관계를 가정하고 있는가_정리[3부] 다양한 사례로 다시 배우는 머신러닝, 딥러닝, AI 지식 8장 데이터에 감춰진 패턴과 그룹을 찾는 머신러닝_비지도학습이란_차원 축소___복합 변수 만들기_주성분 분석___운동 능력 데이터의 주성분___주성분 분석 요약 ___주의해야 할 함정_군집분석_k-평균 군집분석___소매점 군집분석___주의해야 할 함정_정리9장 미래를 예측하고 현상을 설명하는 회귀 모델_지도학습_선형 회귀는 무슨 일을 할까___최소 제곱 회귀(단순히 이름만 기발한 것은 아니다)_선형 회귀에서 알 수 있는 것___더 많은 변수를 투입할 때_선형 회귀가 야기하는 혼란___누락된 변수들___다중공선성___데이터 누수___외삽 오류___대부분의 관계는 선형적이지 않다___설명할 것인가, 예측할 것인가___회귀 모델의 성능_그 밖의 회귀 모델_정리10장 판단의 기준을 파악할 수 있는 분류 모델_분류 문제란 무엇일까___분류 모델의 3가지 방법___분류 문제 설정_로지스틱 회귀___로지스틱 회귀의 장점_의사결정나무_앙상블 모델___랜덤 포레스트___그래디언트 부스트 트리___앙상블 모델의 설명력_흔히 빠지기 쉬운 함정에 주의하자___데이터 유형에 맞지 않는 모델 적용___데이터 누수___모델 구축과 테스트를 위한 데이터셋 분할___의사결정을 위한 적절한 임곗값 선택_정확도에 대한 오해___혼동 행렬_정리11장 글 속에 담긴 주제와 감성을 찾아내는 텍스트 분석_텍스트 분석에 대한 기대_텍스트를 숫자로 바꾸는 방법___단어 가방___N그램___단어 임베딩_토픽 모델링_텍스트 분류___나이브 베이즈___감성 분석_텍스트 분석에서 고려해야 할 실용적인 문제___빅테크 기업의 기술적 우위_정리12장 데이터 리드라면 알아야 할 딥러닝과 AI_신경망 모델___신경망은 어떤 면에서 사람의 뇌와 비슷할까___간단한 신경망 모델___신경망이 학습하는 방법___조금 더 복잡한 신경망_딥러닝 응용 사례___딥러닝의 장점___컴퓨터가 이미지를 ‘보는’ 방법 ___합성곱 신경망___언어 처리와 순차 데이터에 활용되는 딥러닝_딥러닝의 실제 활용 현황___데이터는 충분한가?___데이터가 구조화되어 있는가___신경망은 어떤 모습일까_AI를 대하는 관점___빅테크 기업의 유리한 위치___딥러닝의 윤리적 문제_정리[4부] 프로젝트와 조직의 성공을 위해 데이터 리드가 할 일 13장 호시탐탐 곳곳에 도사린 실패와 함정_데이터의 편향과 기묘한 현상___생존 편향___평균으로의 회귀___심슨의 역설___확증 편향___매몰비용 오류___알고리즘 편향___그 밖의 편향_데이터 프로젝트의 대표적인 함정___통계와 머신러닝 함정___프로젝트 함정_정리14장 조직 구성원의 다양한 성향을 파악하자_의사소통이 중단되는 7가지 상황___사후 약방문___알맹이 없는 발표___부정확한 정보의 확산___수렁 속으로___리얼리티 체크___권력 장악___허풍쟁이.._데이터를 대하는 사람들의 3가지 태도___데이터 맹신자___데이터 비관론자___데이터 리드_정리15장 더 높은 곳을 향해