메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

핸즈온 머신러닝

사이킷런과 텐서플로를 활용한 머신러닝, 딥러닝 실무

한빛미디어

번역서

판매중

  • 저자 : 오렐리앙 제롱(Aurélien Géron)
  • 번역 : 박해선
  • 출간 : 2018-04-27
  • 페이지 : 672 쪽
  • ISBN : 9791162240731
  • 물류코드 :10073
초급 초중급 중급 중고급 고급
4.9점 (10명)
좋아요 : 8

인공지능 분야에 종사한다면 반드시 읽어야 하는 

머신러닝 전문가로 이끄는 최고의 실전 지침서 

 

최근의 눈부신 혁신들로 딥러닝은 머신러닝 분야 전체를 뒤흔들고 있습니다. 이제 이 기술을 거의 모르는 프로그래머도 데이터로부터 학습하는 프로그램을 어렵지 않게 작성할 수 있습니다. 이 책은 그 지름길입니다. 구체적인 예, 핵심 이론, 검증된 두 프레임워크(사이킷런, 텐서플로)를 이용해 지능형 시스템을 구축하는 개념과 방법을 확실하게 알려줍니다. 또한, 각 장의 연습문제는 본문에서 익힌 기법을 실전에 응용하는 데 큰 도움이 될 것입니다.

 

아마존 인공지능 분야 부동의 1위 도서 

이 책의 원서는 출간 직후부터 미국 아마존 인공지능 분야에서 줄곧 1위 자리를 지키고 있습니다. 가장 많은 명저가 경쟁하는 시장에서 이처럼 확고부동한 호응을 얻은 데는 그만한 이유가 있습니다. 이론과 활용을 적절히 섞으면서도 실무에서 확실히 통하도록 구성했고, 나아가 실무자들의 실력을 한층 끌어올려줄 깊이를 담았기 때문이죠.

 

또한, 박해선 역자는 번역서에 많은 노력과 애정을 쏟아붓는 분으로 손꼽힙니다. 모든 것을 직접 해보며 독자가 궁금해할 만한 내용을 꼼꼼히 챙겨, 아마도 책을 읽다 보면 저절로 역자께 감사하는 마음마저 들게 될 것입니다. 게다가 철저한 사후지원까지…

 

이 책 한 권으로 머신러닝과 딥러닝을 통달할 수는 없지만, 인공지능 마스터로 가는 거리를 단축해줄 치트키가 되어줄 것입니다.

 

목적과 접근 방식

 

이 책은 여러분이 머신러닝을 거의 모른다고 가정하고, 데이터로부터 스스로 학습하는 프로그램을 실제로 구현하는 데 필요한 개념, 직관, 도구를 알려주는 것을 목표로 합니다.

 

선형 회귀처럼 가장 단순하고 널리 쓰이는 기법부터 시장을 선도하는 딥러닝 기법까지 다채로운 지식과 경험을 담았고, 당장 제품화에 사용할 수 있는 다음의 두 파이썬 프레임워크를 활용했습니다.

  • 사이킷런(Scikit-Learn)은 다양한 머신러닝 알고리즘을 효율적으로 구현했으며 사용하기도 쉬워 머신러닝을 처음 배우기에 가장 좋은 도구입니다.
  • 텐서플로(TensorFlow)는 수치계산을 데이터 플로 그래프를 이용하여 분산 처리해주는, 더 복잡한 라이브러리입니다. 연산을 수천 대의 GPU 서버에 분배하여 대규모 신경망을 효율적으로 학습시키고 운영할 수 있습니다. 텐서플로는 구글이 만들어 자사의 다양한 대규모 머신러닝 서비스에 활용하고 있으며 2015년에 오픈소스로 공개했습니다.
저자

오렐리앙 제롱(Aurélien Géron)

머신러닝 컨설턴트. 2013년에서 2016년까지 구글에서 유튜브 동영상 분류팀을 이끌었습니다. 2002년에서 2012년까지 프랑스의 모바일 ISP 선두 주자인 Wifirst를 설립하고 CTO로 일했습니다. 2001년에는 Polyconseil을 설립하고 CTO로 일했습니다. 이 회사는 지금 전기차 공유 서비스인 Autolib’을 운영하고 있습니다.

 

그 전에는 재무(JP 모건과 소시에테 제네랄), 방위(캐나다 DOD), 의료(수혈) 등 다양한 분야에서 엔지니어로 일했습니다. C++, WiFi, 인터넷 구조에 대한 몇 권의 기술 서적을 썼으며 한 프랑스 공과대학교에서 컴퓨터 과학을 가르쳤습니다.

 

재미있는 몇 가지 사실: 세 아이에게 손가락으로 이진수 세는 법을 가르쳤습니다(1023까지). 소프트웨어 공학 분야에 들어오기 전에는 미생물학과 진화 유전학을 공부했습니다. 두 번째 점프에서 낙하산이 펼쳐지지 않았습니다.

역자

박해선

CJ E&M MezzoMedia의 시니어 소프트웨어 엔지니어. 홍익대학교 기계공학과를 졸업했고 현대자동차 연구소를 나와 여러 벤처 회사를 거치며 소프트웨어 엔지니어 경력을 쌓았습니다. NHN ACE, 11번가, SK텔레콤, 이베이 코리아, LG전자 등의 프로젝트에서 소프트웨어 설계와 개발에 참여했습니다. 텐서플로 코리아운영진으로 활동했고, 현재 텐서플로 블로그홍대 머신러닝 스터디를 운영하고 있습니다. 한빛미디어에서 [텐서플로 첫걸음](2016)과 [파이썬 라이브러리를 활용한 머신러닝](2017)을 우리말로 옮겼습니다.

 

1부. 머신러닝

 

1장. 한눈에 보는 머신러닝

1.1 머신러닝이란?

1.2 왜 머신러닝을 사용하는가?

1.3 머신러닝 시스템의 종류

1.4 머신러닝의 주요 도전 과제

1.5 테스트와 검증 

1.6 연습문제

 

2장. 머신러닝 프로젝트 처음부터 끝까지

2.1 실제 데이터로 작업하기

2.2 큰 그림 보기 

2.3 데이터 가져오기

2.4 데이터 이해를 위한 탐색과 시각화

2.5 머신러닝 알고리즘을 위한 데이터 준비

2.6 모델 선택과 훈련

2.7 모델 세부 튜닝

2.8 론칭, 모니터링, 그리고 시스템 유지 보수

2.9 직접 해보세요!

2.10 연습문제

 

3장. 분류

3.1 MNIST

3.2 이진 분류기 훈련

3.3 성능 측정

3.4 다중 분류

3.5 에러 분석

3.6 다중 레이블 분류

3.7 다중 출력 분류

3.8 연습문제

 

4장. 모델 훈련

4.1 선형 회귀

4.2 경사 하강법 

4.3 다항 회귀

4.4 학습 곡선

4.5 규제가 있는 선형 모델

4.6 로지스틱 회귀 

4.7 연습문제

 

5장. 서포트 벡터 머신

5.1 선형 SVM 분류

5.2 비선형 SVM 분류

5.3 SVM 회귀

5.4 SVM 이론

5.5 연습문제

 

6장. 결정 트리

6.1 결정 트리 학습과 시각화

6.2 예측하기

6.3 클래스 확률 추정

6.4 CART 훈련 알고리즘

6.5 계산 복잡도 

6.6 지니 불순도 또는 엔트로피?

6.7 규제 매개변수 

6.8 회귀

6.9 불안정성

6.10 연습문제

 

7장. 앙상블 학습과 랜덤 포레스트

7.1 투표 기반 분류기

7.2 배깅과 페이스팅

7.3 랜덤 패치와 랜덤 서브스페이스

7.4 랜덤 포레스트 

7.5 부스팅

7.6 스태킹

7.7 연습문제

 

8장. 차원 축소

8.1 차원의 저주 

8.2 차원 축소를 위한 접근 방법

8.3 PCA

8.4 커널 PCA

8.5 LLE

8.6 다른 차원 축소 기법

8.7 연습문제

 

 

2부. 신경망과 딥러닝

 

9장. 텐서플로 시작하기

9.1 설치

9.2 첫 번째 계산 그래프를 만들어 세션에서 실행하기

9.3 계산 그래프 관리

9.4 노드 값의 생애주기

9.5 텐서플로를 이용한 선형 회귀

9.6 경사 하강법 구현

9.7 훈련 알고리즘에 데이터 주입

9.8 모델 저장과 복원

9.9 텐서보드로 그래프와 학습 곡선 시각화하기

9.10 이름 범위

9.11 모듈화

9.12 변수 공유

9.13 연습문제

 

10장. 인공 신경망 소개

10.1 생물학적 뉴런에서 인공 뉴런까지

10.2 텐서플로의 고수준 API로 다층 퍼셉트론 훈련하기

10.3 텐서플로의 저수준 API로 심층 신경망 훈련하기 

10.4 신경망 하이퍼파라미터 튜닝하기

10.5 연습문제 

 

11장. 심층 신경망 훈련

11.1 그래디언트 소실과 폭주 문제

11.2 미리 훈련된 층 재사용하기

11.3 고속 옵티마이저

11.4 과대적합을 피하기 위한 규제 방법

11.5 실용적 가이드라인

11.6 연습문제 

 

12장. 다중 머신과 장치를 위한 분산 텐서플로

12.1 단일 머신의 다중 장치

12.2 다중 머신의 다중 장치

12.3 텐서플로 클러스터에서 신경망 병렬화하기

12.4 연습문제 

 

13장. 합성곱 신경망

13.1 시각 피질의 구조

13.2 합성곱층 

13.3 풀링층 

13.4 CNN 구조

13.5 연습문제 

 

14장. 순환 신경망

14.1 순환 뉴런

14.2 텐서플로로 기본 RNN 구성하기

14.3 RNN 훈련하기

14.4 심층 RNN

14.5 LSTM 셀

14.6 GRU 셀

14.7 자연어 처리

14.8 연습문제

 

15장. 오토인코더

15.1 효율적인 데이터 표현

15.2 과소완전 선형 오토인코더로 PCA 수행하기

15.3 적층 오토인코더

15.4 적층 오토인코더를 사용한 비지도 사전훈련

15.5 잡음제거 오토인코더

15.6 희소 오토인코더

15.7 변이형 오토인코더

15.8 다른 오토인코더들

15.9 연습문제

 

16장. 강화 학습

16.1 보상을 최적화하기 위한 학습

16.2 정책 탐색

16.3 OpenAI 짐(Gym)

16.4 신경망 정책

16.5 행동 평가: 신용 할당 문제

16.6 정책 그래디언트

16.7 마르코프 결정 과정

16.8 시간차 학습과 Q-러닝

16.9 DQN 알고리즘으로 미스 팩맨 플레이 학습하기

16.10 연습문제 

 

부록 A. 연습문제 정답

부록 B. 머신러닝 프로젝트 체크리스트

부록 C. SVM 쌍대 문제

부록 D. 자동 미분

부록 E. 유명한 다른 인공 신경망 구조

“이 책이 한국에도 출간된다는 소식을 듣고 매우 매우 기대하고 있던 차에 마침 역자인 박해선 님과 인연이 닿아서 추천사까지 쓰게 된 점을 무한한 영광으로 생각합니다. 기하급수적으로 다양하고 많은 데이터가 쌓이고 기술의 발전으로 데이터 저장 비용과 연산 비용이 지속해서 낮아지면서 자연스럽게 다시 주목받게 된 머신러닝 기술은 개발자라면 누구나 알아야 하는 교양필수가 되고 있습니다. 특히 알파고 매치가 보여준 놀라운 결과가 한국 개발자들에게 엄청난 자극과 흥미를 유발하여 업계에 새로운 활력을 불어넣었음을 나날이 체감하고 있습니다.

 

그러한 가운데 이 책의 출간은 그동안 머신러닝을 공부해볼까 생각하던 분들뿐 아니라 이미 공부한 분들에게도 아주 큰 도움이 되리라 확신합니다. 머신러닝을 공부하다 보면 여러 가지 새로운 개념과 용어를 습득하고 그 개념/용어 사이의 관계를 이해하고 정리하는 일이 정말 어렵습니다. 이 책은 머신러닝의 전반적인 이해를 도와주는 내용으로 시작해서 중요한 여러 개념과 이론들을 쉽게 이해시켜 주고, 많이 쓰이는 딥러닝 알고리즘까지 아주 잘 커버했습니다. 또한 개념과 이론 습득에 그치지 않고 직접 실습해볼 수 있는 방법까지 제공하여 독자의 이해를 더욱 효과적으로 돕고 있습니다. 특히나 머신러닝을 처음 접하는 경우 인터넷의 수많은 강좌와 자료에 압도되기 쉬운데, 이렇게 일목요연하게 정리된 책 한 권이 주는 가치와 효용은 매우 클 것입니다.

 

부디 이 책을 통해서 더욱 많은 분이 머신러닝이라는 이 중요한 기술을 잘 습득하여 더 나은 개발자로 거듭나기를 진심으로 기원합니다!”

_권순선, Head of CJK/ANZ Developer Ecosystem, 구글

 

“몇 년 전부터 머신러닝과 딥러닝이 학계는 물론 업계에서도 많은 화제가 되면서 각종 강의와 책이 쏟아져 나왔습니다. 그런데 책 대부분은 비전공자를 위한 입문서이거나 특정 패키지(혹은 오픈소스)를 설명하는 데 치중하여 실전에서 쓰기에는 부족했습니다. 그래서 우리 개발자들은 실전에 쓸 수 있는 수준의, 저자의 경험이 녹아있는 책을 원해왔습니다. 

 

작년에 이러한 갈증을 메워줄 이 책의 원서가 출간되었을 때 커뮤니티와 스터디 그룹에서 많은 관심을 보였고, 저 또한 많은 도움을 받았습니다. 거의 600쪽에 달하는 이 원서는 예제 코드만 많이 나열하거나 이론만을 길게 설명하기보다는, 여러 상황에서 해당 알고리즘을 써야 하는 이유와 저자의 경험을 녹인 코드와 설명으로 실전에서 통하는 내용을 담았습니다. 또한, 모든 코드를 주피터 노트북에서 바로 실행해볼 수 있도록 깃허브에 공개했습니다. 이 코드는 굉장히 깔끔하고 이해하기 쉬우며 실전에 도움 되는 정말 ‘Hands-On’ 자료입니다.

 

또한, 이 번역서의 번역 품질도 굉장히 높습니다. 저자의 의도가 그대로 전달되면서도 설명을 최대한 쉽게 풀어냈습니다. 특히 독자가 이해하기 어려울 만한 부분을 풍부한 옮긴이의 주석이 세심히 메워주며, 도움 될 만한 최신 정보까지 꼼꼼히 알려줍니다. 그래서인지 단순한 1:1 번역이 아니라, 책을 완전히 이해한 다음 새롭게 한글책으로 다시 태어났다는 느낌을 받았습니다.

 

이 책은 빠르게 읽고 소비하는 일회성 책이 아닙니다. 항상 옆에 두고 시간을 더 투자하여 곱씹어 이해하고 공개된 코드를 같이 실습한다면, 다른 책에서 얻지 못하는 깊은 지식과 경험을 얻을 수 있습니다. 이 책이 여러분의 업무 전환이나 실무에 많은 도움이 되었으면 합니다.”

_이상훈, 삼성생명 DA Lab, ‘케라스 코리아’, ‘스파크 사용자 모임’ 운영자

 

“인공지능은 어느덧 우리 삶에 들어와 매우 중요한 위치를 차지하였고, 심지어 이제는 어색하지도 않습니다. 알파고가 세상에 선보인 지 올해로 2년, 우리나라도 유수의 스타트업과 대기업이 AI에 투자하는 등, 1분 1초가 다르게 새로운 AI 기술에 관한 뉴스가 쏟아집니다.

 

AI 열풍과 더불어 관련 서적이 수없이 출간됐습니다. 하지만 이 책처럼 이론과 활용이 유기적으로 연결되는 책은 드물었습니다. 

 

이 책은 머신러닝 이론은 빠삭하게 공부한 거 같은데 어떻게 구현할지가 막막한 순간, 텐서플로 코딩을 하다가 ‘이 코드가 왜 이렇게 흘러가는 거지?’하는 의문이 들 때 길을 밝혀줄, 마치 정석처럼 책꽂이에 한 권씩은 꼭 꽂혀있어야 하는 책이라고 생각합니다. 이제 막 머신러닝의 드넓은 바다로 항해를 시작하신 여러분에게 이 책은 정말 견고한 나침반이 되어줄 것입니다.”

_이준우, MindsLab Brain팀

  • 요즘 '머신러닝', '빅데이터' 가 대세입니다. 어느 서비스든, 어느 IT 뉴스에든 머신러닝 관련 기사는 항상 상위권에 랭크되어 있죠. 하지만 직접 머신러닝 개발을 시작하려니 영 쉽지 않습니다. 알아야 할 것도 많고, 일반 개발과는 조금 성격이 다르기 떄문에 처음부터 시작한다는 생각에 시도조차 어려워요. 하지만 여기 우리의 고민을 간단히 해결해 줄 완벽한 해설서가 있습니다! 머신러닝의 개념부터 분류, 텐서플로 시작까지 모든 내용을 한 권으로 다루는 바로 이 책입니다.



     


    [이 책은]


    단어 우측 상단에 정확한 영문 표기가 기재되어 있어 용어 학습에 좋습니다.

    또 어떤 학습, 작업에 대한 내용을 그림으로 표현해 주어 이해가 쉽습니다.

    각 장 사이사이에 "NOTE" 섹션을 삽입해 심화학습을 도와주고, 재미있는 팁들도 전해주어 책을 읽어내려가기 수월하게 도와 줍니다.




    위에서 언급한 "NOTE" 섹션과 함께 "CAUTION" 섹션이 있습니다.

    이 섹션에서는 학습 가이드, 이해를 위한 팁을 제공하고 있어 책 내용에 대한 이해를 돕고 추가 학습에 대한 의지(?) 를 심어 줍니다.





    이렇게 특정 개념에 대한 내용을 이미지로 한 눈에 파악할 수 있게 표현해 둔 점이 가장 좋습니다.

    이미지로 먼저 설명하고자 하는 내용을 보여주고, 이미지 다음 부분에는 차근차근 자세히 설명된 글이 전개됩니다.

    이미지로 1차적으로 내용을 훑고, 다음으로 따라오는 설명을 읽으면 내용을 완벽히 이해하는 데 큰 도움이 됩니다.


    장의 끝에는 이처럼 연습 문제가 제공됩니다.

    부록에 정답도 제공되니, 문제로 해당 장에서 익힌 내용을 점검하고 정확한 해답으로 한 번 더 확실히 이해한 내용을 짚고 넘어갈 수 있어요!


    이렇게 개념 설명 다음에, 해당 개념을 바탕으로 작성된 코드를 적어 두었습니다.

    덕분에 개념을 코드로 전개하는 법도 익힐 수 있고, 예제 코드를 통한 응용력도 키울 수 있습니다.



    [책을 덮으며]

     

    책의 뒷 표지에는 아주 간단히 책 설명이 되어 있습니다.

    그 밑에는 관련 도서로 이 책과 함께 보면 시너지 효과를 낼 수 있는 책들이 적혀 있습니다. 

    저는 실제로 이 책을 읽은 후 관련 도서를 구매해 읽었는데, 이 책 내용과 완전 밀접한 내용은 아니지만 연관된 내용들을 학습하게 되어 머신러닝의 개념을 조금 더 확실히 이해할 수 있었고 코드로 익힌 내용을 응용하는 능력을 키울 수 있었습니다. 개인적으로는 관련 도서도 함께 보는 것을 추천드립니다. 

    또 하단의 예제 소스 링크에서 예제를 내려받아 직접 개발해 보고, 예제 코드를 활용하여 개발하고자 하는 서비스나 프로그램을 개발할 수 있습니다. 리뷰로 책 내용을 자세히 보여드릴 순 없었지만, 내용이 정말 자세하고 단계별로 이해할 수 있게 구성되어 있어 처음 머신러닝, 텐서플로를 접하는 분들에게는 아주 유용한 입문서가 될 수 있을 거라 생각합니다. 머신러닝과 텐서플로에 관심은 많았지만 생소하고 방대한 개념을 접하기 어려웠던 분들, 실제로 개발에 옮길 엄두를 내지 못 했던 분들에게 강력 추천합니다!


  • (다 읽지는 못한 상황)

     

    장점

     

    관점에 따라 다를 수 있지만 이론과 실습이 잘 조화되었다

     

    알고리즘을 예를 들어 설명하고 구현하는데 초점을 맞췄기 때문에 (비교적) 따라가기 쉽다

     

    역자가 예제를 잘 따라갈 수 있게 설명을 잘 해뒀다

    https://github.com/rickiepark/handson-ml

    물론 요즘 대부분의 프로그래밍 책들이 깃헙을 통해 소스를 공개하고 따라갈 수 있게 하지만, 소스 코드만 올려놓고 설정이나 설치에 대해서는 인색한 경우가 종종 있는데, 이 책의 역자는 그렇지 않았다. 실습을 따라할 수 있는 거의 대부분의 환경을 설명했다

     

    원서의 깃헙은 지금도 활발히 업데이트를 하고 있는데, 내용을 아직 잘 몰라 이해는 못했지만, 최신 경향을 반영하려는 듯 하다

    https://github.com/ageron/handson-ml

     

    단점

     

    나의 이해 능력.... -_-;

     

    기타

     

    기억이 맞다면 역자가 다음 블로그에 이 책의 번역에 대한 이야기를 써 뒀는데, 가보니 왠지 글이 사라졌다

    https://tensorflow.blog/2017/12/30/review-hands-on-machine-learning-with-scikit-learn-tensorflow/

    무슨 이유가 있겠지만, 뭔가 아쉬움

  •  

    •  

     

    머신러닝과 딥러닝이 인기를 끌면서 서점에 굉장히 많은 책들이 나왔습니다. 
    방대한 범위를 다뤄 혼란을 주는 책들도 있고, 수식으로 가득차 저 같은 수포자를 포기하게 만들어버리는 책들도 많습니다.

    책의 도입부에 아래와 같은 말이 적혀있습니다.

    이 책은 여러분이 머신러닝을 거의 모른다고 가정하고, 데이터로부터 스스로 학습하는 프로그램을 실제로 구현하는 데 필요한 개념, 직관, 도구를 알려주는 것을 목표로 합니다.

    실제로 수식을 최대한 줄이고 친절한 이론과 코드로 대부분이 이루어지고 있습니다.
    저처럼 처음 시작하는분들과 어디서부터 시작해야될지 혼란스러운분들이 읽기에 정말 좋은 책인 것 같습니다.

  • 머신러닝/딥러닝 관련 서적이 정말 많이 나오고 있습니다! 

    그만큼 기본서도 많이 접했어요. 당분간 기본서는 보지 말아야지! 라고 생각했으나, 원서로도 유명한 핸즈온 머신러닝을 지나칠 수 없었습니다. 이 책은 정말.. 감동 그 자체입니다. 원서를 볼 때도 감동이었는데, 번역이 되어 있어서 더 감동. 

    개인적으로 ML/DL 분야를 통틀어 1권 추천해야 한다면 이 책을 추천하지 않을까 생각됩니다. 커버 범위가 엄청 넓고, 설명도 괜찮습니다

    단점은 두께.. 650쪽이라 들고 다니기엔 약간 무겁습니다. 2권으로 제본할까 고민중

    빅데이터 동아리 혹은 교내 스터디에서 추천하고 싶은 책. 너무 내용이 많기에 혼자 하는것보단 함께 하는 것을 추천하고 싶네요. 요새 ML 기초부분 보고 있는데, 이 책과 함께할 것 같아요

    정리하자면
    - ML/DL 전체를 커버하는 범위, 깔끔한 정리
    - 각 장에 연습문제가 존재해 지식을 확인할 수 있음
    - 분산 Tensorflow 내용 포함
    - 부록 존재(라그랑주, 프로젝트 체크리스트)

    단점
    - 두께


    자세한 본문 내용이 궁금하시면 http://blog.naver.com/zzsza/221277537814 로 가시면 좋을 것 같습니다 :)

  • 2018년 4월에 나온 따끈따끈한 신간입니다. 책 뒷면의 "아마존 인공지능 분야 부동의 1위 도서"라는 문구가 눈길을 사로잡습니다. 이 책은 머신러닝에 대해 알아야 할 것들을 거의 다 포함하고 있습니다. "핸즈온"이라는 제목처럼 이 책만 마스터하면 머신러닝의 실무를 바로 시작할 수 있을 것만 같습니다.

     

    책의 실습 예제들은 파이썬으로 되어 있고, pyplot, numpy, pandas, sklearn 라이브러리를 사용합니다. 이 책의 1장에서는 머신러닝이란 무엇이고 어떤 종류가 있는지 개요를 다루고,  2장에서 본격적으로 캘리포니아의 부동산 가격 예측 프로젝트 하나를 예시로 들어가며 머신러닝의 절차를 설명합니다. 2장을 따라하면 주피터 노트북을 실행해서 파이썬 코드로 데이터를 불러와서 정제하고 머신러닝을 해볼 수 있습니다.

     

    3장부터 8장까지는 분류, 회귀, SVM, 결정 트리, 앙상블과 랜덤 포레스트, 차원 같은 머신러닝의 대표적인 개념들에 대해서 배우게 됩니다. 예전에 학교에서 데이터마이닝 수업을 들으며 이론만 배웠던 내용들을 코드로 확인해 볼 수 있어서 새로운 경험이었습니다. 이 책을 읽으면서 이론도 알아야 하지만 실제로 활용하려면 실습도 중요하다는 것을 다시 한 번 느끼게 되었습니다.

     

    한 가지 아쉬운 점은 코드의 전체가 아니라 일부만 책에 실려 있다는 점입니다. 전체 코드는 저자가 인터넷에 올려 둔 것을 내려받아서 확인해야 합니다. 그리고 이 책에서 사용하는 데이터 분석 관련 파이썬 라이브러리들의 사용법을 제대로 모르고 있다면, 읽다가 막히는 부분이 생각보다 많습니다. 라이브러리 학습은 따로 시간을 들여서 해야 할 것 같습니다.

     

    2부부터는 텐서플로로 딥러닝을 하는 방법을 다루고 있습니다. 2부는 아직 다 읽지 못하였지만 시간을 들여서 차근차근 읽고 실습을 따라해 보면 많은 지식을 쌓을 수 있을 것 같습니다. 책의 1부만 보아도 얻을 게 많은 책이고 소장가치가 큰 책입니다.

     

    이 책은 머신러닝의 이론과 실습을 적절히 버무려놓은 교과서 같은 책이라고 할 수 있습니다. 전반적인 난이도는 초보자에게는 쉬운 편은 아닙니다. 그래서 쉽게 쓰여진 다른 책부터 먼저 읽어서 워밍업을 하고 난 후에 이 책을 보면 좋을 것 같습니다. 타시크 라시드의 <신경망 첫걸음>, 사이토 고키의 <밑바닥부터 시작하는 딥러닝> 같은 책들을 보면서 파이썬 라이브러리 사용법에 익숙해지고 나면 더 쉽게 이해할 수 있을 것 같습니다.

     

  • 이 책은 정말 머신러닝으로 무언가를 해보려는 분들에게 필요한 책입니다.

    배우기 위한 책은 아니며 새롭게 익히고 싶은 사람들에게는 다른 책을 찾아보시길 바랍니다.

    이 책은 친절한 책이 아니며, 그것을 위한 책또한 아닙니다.

     

    머신러닝을 안다는 가정하게 해결책을 제시하기 위해 만들어진 책처럼 보입니다.

    각각 경우에 쓰이는 공식들을 설명하고 어떻게 쓰는 지 설명되어 있습니다. 

    지극히 간결하여 찾아보기 좋으나, 실제로 이것이 어떤 것을 의미하는 지는 잘 알 수 없어 아쉬웠습니다.

    아무리 간결해도 확률에 대한 설명은 좀 더 친절해도 좋지 않았나 싶었습니다.

     

    무언가 막혀 있을 때, 해법을 줄만한 뭔가가 필요할 때. 도움이 될 책입니다.

    문제를 해결하기 위한 여러가지 방법을 제시하기 때문입니다.

    Python을 이용하고 있지만 사실 Python, 싸이킷런, 이런것들을 설명하고 있다는 점 보다는

    어떤 확률공식이 있는지, 어떻게 사용되고 있는지를 알 수 있다는 점에서 높은 점수를 주고 싶습니다.

    여러분이 머신러닝을 공부를 어느 정도 하였고, 어떻게 쓰이는 지 알고 싶으신 분들에게 추천합니다.

     

    아직 다 읽지는 못하였지만

    읽으면서 느낀 점은 수학공부 확률공부를 해야겠다는 것입니다.

     

  • 현존하는 머신러닝 / 딥러닝 책 중 단언컨대 최고의 책이라고 할 수 있다. 어려운 개념으로 들어가는 도입부에 나오는 적절하게 재밌는 비유는 독자들을 웃게 하며 pandas나 numpy의 "인터넷에 찾아보면 나오는"  API 관련 내용들을 적절히 배제하고 진도를 나감에 있어 잘 짜여진 구조로 이 책은 구성되었다. 2달정도 이 책을 따라하며 예제를 하면 정말 딥러닝의 고수가 될 수 있을것이다! (하지만 오타와 잘못된 설명이 있는게 옥의 티이다. ) 

     

    인상깊은 구절

     

    앙상블 ? 그것은 대중의 지혜!

    무작위로 선택된 수천명의 사람에게 복잡한 질문을 하고 대답을 모은다고 가정합니다. 많은 경우 이렇게 모은 답이 전문가의 답보다 낫습니다. 이를 대중의 지혜라고 합니다. 이와 비슷하게 일련의 예측기로부터 예측을 수집하면 가장 좋은 모델 하나보다 더 좋은 예측을 얻을 수 있을 것입니다. 일련의 예측기를 앙상블이라고 부르기 때문에 이를 앙상블 학습이라고 하며 앙상블 학습 알고리즘을 앙상블 방법이라고 합니다. 

     

    은닉층이 많을수록 ? 우리의 뇌처럼!

    복잡한 개미탑이 개미들의 작은 노력이 모여서 이뤄진 것처럼 매우 복잡한 계산이 단순한 뉴런으로 구성된 거대한 네트워크에 의해 수행될 수 있습니다. 생물학적 신경망의 구조는 여전히 활발히 연구가 진행되는 분야입니다. 뇌의 일부는 그 지도가 그려져 있는데 인간피질처럼 연속된 층으로 조직화되어 있는 것으로 보입니다. 

     

    오토인코더 설명부분

    숙련된 체스플레이어가 체스판을 5초동안만 바라보고도 전체 말의 위치를 외울 수 있다는 것을 알아냈습니다. 대부분의 사람에게는 불가능한 일입니다. 그러나 이는 체스 말들이 무작위로 놓여 있을 때가 아니라 현실적인 위치에 있을 경우에만 그렇습니다. 체스 전문가라 하더라도 우리보다 더 뛰어난 기억력을 가지고 있지는 않습니다. 단지 그 게임에 대한 경험 덕분에 체스 패턴을 더 쉽게 보는 것뿐입니다. 즉 패턴을 찾게 되면 정보를 효율적으로 저장할 수 있습니다. 

     

    레이블

    데이터를 레이블하는 것(예를 들어 귀엽거나 그렇지 않은 이미지를 분류하는 것)은 사람만이 할 수 있습니다. 

     

    * 정말 좋은 비유를 통해 재미있게 들어간다. 

     

    partial

    이 함수는 어떤 함수를 감싼 래퍼 함수를 생성하며 매개변수의 기본값을 지정할 수 있도록 도와줍니다.  

     

     

    오타 

    88쪽 ceil 함수를 사용하여 반올림 > 올림이 되어야 한다. 

     

     

     

    305쪽 scaled_housing_data_plus_bias 부분 코드와 설명이 빠짐

  •  O`reilly 사에 뉴스레터를 신청하면 가끔 신규 책을 준다면서 설문조사를 요청할 때가 있다. 그때 받은 책중 하나가 바로 이거였다.

     사실 내가 선택할 수 있는 책중 가장 관심있는 분야여서 선택한 것도 있지만, 책에 담겨져 있는 이론적인 내용이나 실무적인 내용에 대한 설명이 굉장히 잘 되어 있었다. 알고보니 현재도 amazon에서는 Natural Language Processing 분야에서 Best Seller 1위에 랭크되어 있었다. 

      방대한 량만큼이나 최근의 트랜드를 잘 담고 있던 책이라 언제쯤 한국에 번역되려나 싶었는데, 원서가 출시된지 거의 1년만에 번역서로 출시되었다. 이 책에 대한 리뷰를 간단히 해보고자 한다.

     항상 내가 갈구하고 바랬던 머신러닝 관련 책들은 수식이나 원리에 대한 설명이 잘되어 있고, 그 내용을 바탕으로 실제의 예제를 살펴볼 수 있으면 좋겠다고 생각했었고, 시중에 머신러닝 책들이 나오면 그런 트랜드가 반영되어 있나 살펴보는 편이었다. 그런데 어느 책도 그 둘다를 만족하는 책이 사실 잘 없었던 것 같다. 사실 이런 분야가 그렇지만 머신러닝이나 딥러닝을 공부하게 되면 반드시 통계 관련 내용을 다뤄야 되고, 그러려면 책의 두께가 두꺼워지거나 실습을 할 수 있는 여지가 줄어들게 된다.(그나마 스티븐 마슬랜드의 "알고리즘 중심의 머신러닝 가이드" 책이 생각한 것과 유사했는데 책의 주제가 머신러닝 알고리즘에 한정되어 있어, 딥러닝이나 강화학습 관련 내용이 담겨있지 않아 아쉬운 부분이 있다.)

     일단 내가 소개하는 "핸즈온 머신러닝" 책은 내가 지금까지 읽은 책중 가장 내가 바라던 대로 이론과 실제 예제가 적절히 버무러진 책이었다. 장장 660여 페이지안에 저자는 머신러닝과 딥러닝, 강화학습과 관련된 내용을 최대한 담고자 노력한 흔적들이 보인다. 위의 이미지속에 소개된 내용은 Regulation을 고려한 Linear Regression인 Ridge regression과 Lasso Regression의 편향에 대한 소개 내용인데, 수식과 그림, 그리고 scikit-learn내에서 사용하는 방법에 대해서 기술되어있다. 물론 몇몇 알고리즘들은 본편에서 자세하게 다루지 않고, 부록의 후반부에서 간략하게 다뤄져있다. 그래도 끝까지 보면서 " 아 그래도 이 책을 보면서 머신러닝/딥러닝/강화학습은 어느정도 훑어봤구나" 하는 느낌이 들 수 있게끔 구성되어 있다. 또 큰 주제 속에서도 고려해야 될 내용이나, 참고할 수 있는 문헌에 대해서 중간중간 소개하고 있어 놓치기 쉬운 내용을 한꺼번에 다뤘다는 느낌을 받았다. 

     참 실습 환경은 대부분의 머신러닝의 책들이 그러하듯이 Jupyter 환경 위에서 머신러닝 패키지인 scikit-learn과 구글에서 만든 딥러닝 엔진인 tensorflow를 기반으로 진행된다. 머신러닝은 scikit-learn, 딥러닝/강화학습 파트는 tensorflow를 활용하여 실제로 관련 API를 쓰면서 실습을 수행하게 된다. 참고로 나도 최근에 회사에서 강화학습과 관련하여 업무를 맡게 되어 몇가지 코드는 응용해서 좀 써보려고 노력했다. 다뤄지는 코드가 막 복잡하거나 그런게 아니라, 책의 원리를 설명하는 부분에서 소개된 내용이라 글의 흐름이나 코드에 대한 설명이 적절하게 어울렸다. (물론 모든 코드를 다 실행해본 건 아니지만, 책과 코드만 읽고서라도 왜 그렇게 코드가 작성이 되고 결과가 나왔는지를 알 수 있던 형태로 되어 있었다.)

     그래서 그런지 생각보다 나도 인터넷 강의나 다른 책들을 통해서 새로운 개념이나 scikit-learn/tensorflow API들에 대해서 좀 알수 있던 기회였다. 정말 나도 머신러닝에 관심에 많아서 왠만한 머신러닝/딥러닝 책들이 나오면 서점가서 꼭 읽어보고 그랬었는데, 여타 책들보다도 넓은 범위에서 이정도 내용을 담은 내용을 담고 있다는 게 이 책만이 가지는 장점이 아닐까 싶다. 조금 아쉬운 점은 상대적으로 머신러닝에 할당된 부분에 비해서 딥러닝 부분을 설명한 파트가 상대적으로 적어, 해당 부분을 중점적으로 살펴보고자 하는 독자한테는 조금 부족함을 느낄 수 있을 듯한 생각이 잠시 든다. 그렇다고 딥러닝 쪽에 설명된 부분이 부족하거나 그런건 절대 아니다.

    사실 요 몇년 사이에 Oreilly 사에서 나온 번역책들을 많이 읽어볼 수 있는 기회를 가졌었던 것 같다. 분명 몇년전만 해도 데이터 분석이라고 나온 책들이 어느새 책에 머신러닝/딥러닝 이라는 타이틀을 가지고 나오고 있는데, 그만큼 기술의 발전도 진행되면서, scikit-learn이나 tensorflow같은 라이브러리의 도움을 많이 받을 수 있는 지금에까지 이르렀다. 이럴 때에 직접 다룰 수 있는 실습과 이를 뒷받침하는 이론들이 잘 섞여있는 이 책을 한번 보면 어떨까 싶다. 정말 근래 읽었던 관련 분야 책중에는 가장 괜찮았던 것 같다.

    참고할 만한 링크:
     - 원서 github : https://github.com/ageron/handson-ml
       (github 내용을 보니까 최근까지 저자가 계속 업데이트 하고 있는 듯 하다.)
     - 역자 github : https://github.com/rickiepark/handson-ml
       (역자분께서 원서 notebook까지 번역해서 올려주셨다.)

    <이 글에 나오는 "핸즈온 머신러닝" 은 한빛미디어의 지원을 받고 이에 대한 리뷰를 작성한 것임을 알려드립니다.>



    출처: http://talkingaboutme.tistory.com/881 [자신에 대한 고찰]

  • 이 책은 아마존 도서 인공지능 분야 1위 어쩌구 저쩌구! 하는 현란한 카피와 함께 

    페이스북 피드에 겁나 자주 보이는, 요즘 한빛미디어가 엄청 밀고 있는 책이다. 'ㅅ') 

    마치 x이버 댓글 매크로 돌린 것 마냥 폭발적인 수의 댓글이 그 피드에 달리고 있는 요즘 핫한 그 도서.

    본인은 데이터 과학, 통계, 머신러닝에 이제 막 관심이 생겨 두루두루 관련 지식들을 둘러 보고 있는 Front-end 개발자이다. 

    지난 몇 주간 통계 관련 도서를 살펴 보면서 분산, 표준편차, 공분산, 상관계수 등의 용어들과 공식을 익혀가는 도중에 이 책을 접하게 된거임. 'ㅅ') 

     

    undefined

     

    이 도서에서 소개하고 있는 사이킷런은 다양한 알고리즘을 구현하고 있는 라이브러리라고 하는데, 본인도 이 도서를 살펴보면서 처음 알게 되었다. 

    '파이썬 라이브러리를 활용한  머신러닝' 도서에서도 사이킷런 라이브러리를 다루고 있다고 하니, 

    관심자 분들은 이 도서도 참고해보시는게 좋을 듯. // 'ㅅ') 알고보니 두 책을 번역하신 분이 동일 인물.

    본인 같은 데이터 과학, 머신러닝 입문자 입장에서는 2장의 내용이 신의 한수이다. 'ㅅ')!
    이 장의 내용만으로도 이 책의 구매 가치는 충분하다. 

    데이터셋에서 시작해서, 데이터 편집, 시각화, 학습, 검증, 튜닝 등의 전체 프로세스 구축을 위한 흐름을 보여준다. 

    // 당신이 후라이드/양념 반반 치킨 2마리를 먹을 돈이면, 이 책을 얻을 수 있는 것이다. 당신은 치킨이 고픈가 지식이 고픈가 'ㅅ') 물론 나는 둘 다 고픔.

    전반적으로 파이썬 언어를 사용하는 프로그래밍 환경에서 실습할 수 있는 코드들을 소개하며, 

    part 1 에서는 지도, 비지도, 준지도 학습의 알고리즘 중 몇 가지를 (매우) 세부적으로 다루고, 

    이 과정에서 사이킷런 라이브러리의 사용법을 소개하고 있다. 

    part 2 에서는 텐서플로와 인공 신경망에 관해 다루고 있는데, 펜서플로 자체에 대한 설명은 길지 않으나 

    12장의 주제인  '다중 머신과 장치를 위한 분산 텐서플로' 는 다른 도서에서 찾아 보기 어려운 내용을 소개하고 있다. 

    또한, 신경망 자체에 대해서는 이론부터 사이킷런과 텐서플로를 이용하여 그를 다루는 방법들을 자세히 설명하고 있는데, 

    당신은 분명히 이 챕터에서 등장하는 수학 공식 난무를 맞고 처참히 쓰러져가는 자신의 모자란 수학 능력에 자괴하게 될 것이다. 

    // 수학 능력 시험과 아무런 관련도 없고 말이지 'ㅅ')a 긁적.

    이 책은 671p 에 달하는 볼륨으로, 단시간에 소화할 수는 없는 책이다. 
    딥러닝, 머신러닝 입문자가 계속해서 참고하며 살펴보는, 

    마치 수학의 정석 책 마냥 한번 구입해서 책장에 꽂아두고 마르고 닳도록 꺼내 보는 그러한 책인 것이다. 

     

    .

     

  • 제가 얼마전 <딥러닝의 정석> 이란 책을 읽었었는데요...


    딥러닝에 관심이 많은 저에게 한빛미디어에서 준 선물이었거든요...


    아직은 딥러닝 공부가 미약해서 책에서 주는 정보의 10프로도 소화를 못하고 있는것 같아서 많이 아쉽기는 하지만...


    여러번 읽다 보면 딥러닝이 무엇인지 감을 좀 잡을 수 있지 않을까 하는 느낌으로 머리맡에 두고 자기전 조금씩 다시 한번씩 읽어 보게 되네요.


    그것이 계기가 되어서 이번에는 <핸즈온 머신러닝> 이라는 책을 리뷰 한다길래 신청을 했는데...

    이번에 선물이 도착했네요.^^




    <핸즈온 머신러닝> 과 <딥러닝의 정석>은 구조가 좀 틀리네요...

    아무래도 <핸즈온 머신러닝> 이 중급자용 책이라는 설명이 있어서 신청을 하고 나서 살짝 걱정이 되었거든요...


    괜히 아무것도 이해하지 못하면서 덜컥 신청해서 다른 사람에게 갈 기회를 한번 뺏은것은 아닐까? 라는 생각같은게 들었어요.


    긴장을 하면서 책을 펼쳤는데...

    <딥러닝의 정석> 같은 경우에는 처음에 인공지능에서 사용하는 신경망 부터 전방향 신경망 학습 과 같이 딱딱한 용어들이 등장하면서 사실 살짝 경직되게 만들더라구요. 

    그런데 <핸즈온 머신러닝> 은 책이 두꺼워서 그런지는 모르겠지만 처음에 설명 나오는 것이 머신러닝이란? 이었네요.



    Part1 에서 만나는 머신러닝은 기존에 제가 많이 들어 보고 대충은 알고 있던 내용들로 접근을 하다 보니...

    오히려 책을 읽는데 훨씬 더 부드러워지네요.


    책의 내용을 살펴 보면 위와 같이 일반 사람들도 보기 좋은 형태의 도식이 저 같은 사람들이 딱 읽기 좋게 되어 있더라구요...

    하나 하나 차근 차근 읽어 가다 보면 선형대수와 같은 수학적 지식을 갖추고 있지 않더라도 지식을 쉽게 받아 들일수 있게 딱딱하지 않게 구성이 되어 있었습니다.


    한 Chapter 가 끝날때 마다 이렇게 연습문제를 두어서...

    앞에서 설명한 부분의 중요한 부분을 한번씩 체크 하고 넘어 갈 수 있게 되어 있어서...

    중요한 이론에 대해 다시 한번 생각하게 해 주더라구요.



     


    Chapter1 에서 가장 좋았던 부분은 위와 같이 실제 데이터를 가지고 직접 연구 조사 하여 부동산의 방의 갯수와 부동산 가격의 상관 관계 등을 구현해 볼 수 있다는 것이 상당히 인상이 깊게 남았어요.



    Part1 에서는 사이킷런을 가지고 주로 실습을 해보게 되는데요

     

    위와 같이 직접 파이썬을 가지고 사이킷런 모듈을 활용해서 실습을 할 수 있게 구성이 되어 있습니다.




    Part2 에서는 요즘 많이 사용하고 있는 텐서플로 라이브러리를 이용해서 신경망과 딥러닝에 대해서 공부를 하게 되네요.

    텐서플로 설치 부터 Part1 에서 배운 선형회귀, 경사하강법 등을 직접 실습을 해 볼 수 있습니다.



    핸즈온머신러닝에 대한 자세한 내용은 http://www.hanbit.co.kr/store/books/look.php?p_code=B9267655530 에서 확인 할 수가 있구요.

    미리보기도 가능하기 때문에 미리 확인해 보시면 될것 같아요.


    이 책을 읽으면서 중급용 교재라고 해서 약간 긴장을 했었는데요...

    <딥러닝의 정석> 보다 훨씬 입문자용으로 접근하기가 너무 좋은 책이라는 생각이 들었어요.


    책의 구성에서도 직접 실습을 해 보면서 배운 이론을 눈으로 확인을 해 볼 수 있게 되어 있는 형태로 되어 있어서 너무 좋았던것 같습니다.


    그리고 가장 많이 사용되는 사이킷런이나 텐스플로를 이용한 딥러닝의 이론을 풀어 나가기 때문에 이 책 한권만으로도 딥러닝이란 무엇인가 감을 잡을것 같더라구요.


    이 책을 읽으면서 연신 감탄을 했던 것은...

    제가 이 나이가 되면서 이러한 알고리즘을 몰랐던것이 아쉬웠고... 또한 이러한 알고리즘 기법들을 깨달았다고 해도 이러한 모듈을 만들 수 있었을까? 라고 생각해도 절대 아닙니다. 라는 말이 나오더라구요...


    정말 다행스러운 것은 구글이나 이렇게 큰 기업에서 이러한 딥러닝 라이브러리를 만들어서 공개함으로써 많은 사람들이 이 라이브러리를 이용해서 새로운 딥러닝 시스템을 만들어 낼 수 있다는 것...


    이러한 딥러닝의 이론만을 공부해서도 충분히 활용하여 새로운 인공지능 프로그래밍을 할 수 있다는 것에 정말 감사한 마음이 들었습니다.


    우리 아이들도 이러한 기법들을 이해하고 이러한 것을 활용하여 새로운 서비스를 충분히 만들어 낼 수 있을것이라는 기대를 만들게 하는 책이었네요.

부록/예제소스
자료명 등록일 다운로드
예제소스 2018-04-25 다운로드
결재하기
• 문화비 소득공제 가능
• 배송료 : 0원배송료란?

배송료 안내

  • 책, 아이템 등 상품을 3만원 이상 구매시 무료배송
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
핸즈온 머신러닝
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
핸즈온 머신러닝
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
핸즈온 머신러닝
구입처*
구입일*
부가기호*
부가기호 안내

* 회원가입후 도서인증을 하시면 마일리지 500점을 드립니다.

* 한빛 웹사이트에서 구입한 도서는 자동 인증됩니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한됩니다.

* 절판도서, eBook 등 일부 도서는 도서인증이 제한됩니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실