핸즈온 머신러닝

younh***l2018-08-31

요즘 '머신러닝', '빅데이터' 가 대세입니다. 어느 서비스든, 어느 IT 뉴스에든 머신러닝 관련 기사는 항상 상위권에 랭크되어 있죠. 하지만 직접 머신러닝 개발을 시작하려니 영 쉽지 않습니다. 알아야 할 것도 많고, 일반 개발과는 조금 성격이 다르기 떄문에 처음부터 시작한다는 생각에 시도조차 어려워요. 하지만 여기 우리의 고민을 간단히 해결해 줄 완벽한 해설서가 있습니다! 머신러닝의 개념부터 분류, 텐서플로 시작까지 모든 내용을 한 권으로 다루는 바로 이 책입니다.

[이 책은]

단어 우측 상단에 정확한 영문 표기가 기재되어 있어 용어 학습에 좋습니다.

또 어떤 학습, 작업에 대한 내용을 그림으로 표현해 주어 이해가 쉽습니다.

각 장 사이사이에 "NOTE" 섹션을 삽입해 심화학습을 도와주고, 재미있는 팁들도 전해주어 책을 읽어내려가기 수월하게 도와 줍니다.

위에서 언급한 "NOTE" 섹션과 함께 "CAUTION" 섹션이 있습니다.

이 섹션에서는 학습 가이드, 이해를 위한 팁을 제공하고 있어 책 내용에 대한 이해를 돕고 추가 학습에 대한 의지(?) 를 심어 줍니다.

이렇게 특정 개념에 대한 내용을 이미지로 한 눈에 파악할 수 있게 표현해 둔 점이 가장 좋습니다.

이미지로 먼저 설명하고자 하는 내용을 보여주고, 이미지 다음 부분에는 차근차근 자세히 설명된 글이 전개됩니다.

이미지로 1차적으로 내용을 훑고, 다음으로 따라오는 설명을 읽으면 내용을 완벽히 이해하는 데 큰 도움이 됩니다.

장의 끝에는 이처럼 연습 문제가 제공됩니다.

부록에 정답도 제공되니, 문제로 해당 장에서 익힌 내용을 점검하고 정확한 해답으로 한 번 더 확실히 이해한 내용을 짚고 넘어갈 수 있어요!

이렇게 개념 설명 다음에, 해당 개념을 바탕으로 작성된 코드를 적어 두었습니다.

덕분에 개념을 코드로 전개하는 법도 익힐 수 있고, 예제 코드를 통한 응용력도 키울 수 있습니다.

[책을 덮으며]

책의 뒷 표지에는 아주 간단히 책 설명이 되어 있습니다.

그 밑에는 관련 도서로 이 책과 함께 보면 시너지 효과를 낼 수 있는 책들이 적혀 있습니다.

저는 실제로 이 책을 읽은 후 관련 도서를 구매해 읽었는데, 이 책 내용과 완전 밀접한 내용은 아니지만 연관된 내용들을 학습하게 되어 머신러닝의 개념을 조금 더 확실히 이해할 수 있었고 코드로 익힌 내용을 응용하는 능력을 키울 수 있었습니다. 개인적으로는 관련 도서도 함께 보는 것을 추천드립니다.

또 하단의 예제 소스 링크에서 예제를 내려받아 직접 개발해 보고, 예제 코드를 활용하여 개발하고자 하는 서비스나 프로그램을 개발할 수 있습니다. 리뷰로 책 내용을 자세히 보여드릴 순 없었지만, 내용이 정말 자세하고 단계별로 이해할 수 있게 구성되어 있어 처음 머신러닝, 텐서플로를 접하는 분들에게는 아주 유용한 입문서가 될 수 있을 거라 생각합니다. 머신러닝과 텐서플로에 관심은 많았지만 생소하고 방대한 개념을 접하기 어려웠던 분들, 실제로 개발에 옮길 엄두를 내지 못 했던 분들에게 강력 추천합니다!

love***l2018-05-25

핸즈온 머신러닝 - 사이킷런과 텐서플로를 활용한 머신러닝, 딥러닝 실무

(다 읽지는 못한 상황)

장점

관점에 따라 다를 수 있지만 이론과 실습이 잘 조화되었다

알고리즘을 예를 들어 설명하고 구현하는데 초점을 맞췄기 때문에 (비교적) 따라가기 쉽다

역자가 예제를 잘 따라갈 수 있게 설명을 잘 해뒀다

https://github.com/rickiepark/handson-ml

물론 요즘 대부분의 프로그래밍 책들이 깃헙을 통해 소스를 공개하고 따라갈 수 있게 하지만, 소스 코드만 올려놓고 설정이나 설치에 대해서는 인색한 경우가 종종 있는데, 이 책의 역자는 그렇지 않았다. 실습을 따라할 수 있는 거의 대부분의 환경을 설명했다

원서의 깃헙은 지금도 활발히 업데이트를 하고 있는데, 내용을 아직 잘 몰라 이해는 못했지만, 최신 경향을 반영하려는 듯 하다

https://github.com/ageron/handson-ml

단점

나의 이해 능력.... -_-;

기타

기억이 맞다면 역자가 다음 블로그에 이 책의 번역에 대한 이야기를 써 뒀는데, 가보니 왠지 글이 사라졌다

https://tensorflow.blog/2017/12/30/review-hands-on-machine-learning-with-scikit-learn-tensorflow/

무슨 이유가 있겠지만, 뭔가 아쉬움

tjrwls0***l2018-05-20

입문자에게 짱짱 좋은책 !!

머신러닝과 딥러닝이 인기를 끌면서 서점에 굉장히 많은 책들이 나왔습니다.
방대한 범위를 다뤄 혼란을 주는 책들도 있고, 수식으로 가득차 저 같은 수포자를 포기하게 만들어버리는 책들도 많습니다.

책의 도입부에 아래와 같은 말이 적혀있습니다.

이 책은 여러분이 머신러닝을 거의 모른다고 가정하고, 데이터로부터 스스로 학습하는 프로그램을 실제로 구현하는 데 필요한 개념, 직관, 도구를 알려주는 것을 목표로 합니다.

실제로 수식을 최대한 줄이고 친절한 이론과 코드로 대부분이 이루어지고 있습니다.
저처럼 처음 시작하는분들과 어디서부터 시작해야될지 혼란스러운분들이 읽기에 정말 좋은 책인 것 같습니다.

zz***l2018-05-17

머신러닝/딥러닝계의 바이블이라고 생각합니다!

머신러닝/딥러닝 관련 서적이 정말 많이 나오고 있습니다!

그만큼 기본서도 많이 접했어요. 당분간 기본서는 보지 말아야지! 라고 생각했으나, 원서로도 유명한 핸즈온 머신러닝을 지나칠 수 없었습니다. 이 책은 정말.. 감동 그 자체입니다. 원서를 볼 때도 감동이었는데, 번역이 되어 있어서 더 감동.

개인적으로 ML/DL 분야를 통틀어 1권 추천해야 한다면 이 책을 추천하지 않을까 생각됩니다. 커버 범위가 엄청 넓고, 설명도 괜찮습니다

단점은 두께.. 650쪽이라 들고 다니기엔 약간 무겁습니다. 2권으로 제본할까 고민중

빅데이터 동아리 혹은 교내 스터디에서 추천하고 싶은 책. 너무 내용이 많기에 혼자 하는것보단 함께 하는 것을 추천하고 싶네요. 요새 ML 기초부분 보고 있는데, 이 책과 함께할 것 같아요

정리하자면
- ML/DL 전체를 커버하는 범위, 깔끔한 정리
- 각 장에 연습문제가 존재해 지식을 확인할 수 있음
- 분산 Tensorflow 내용 포함
- 부록 존재(라그랑주, 프로젝트 체크리스트)

단점
- 두께

자세한 본문 내용이 궁금하시면 http://blog.naver.com/zzsza/221277537814 로 가시면 좋을 것 같습니다 :)

hb***l2018-05-16

머신러닝의 이론과 실습을 적절히 버무려놓은 교과서 같은 책

2018년 4월에 나온 따끈따끈한 신간입니다. 책 뒷면의 "아마존 인공지능 분야 부동의 1위 도서"라는 문구가 눈길을 사로잡습니다. 이 책은 머신러닝에 대해 알아야 할 것들을 거의 다 포함하고 있습니다. "핸즈온"이라는 제목처럼 이 책만 마스터하면 머신러닝의 실무를 바로 시작할 수 있을 것만 같습니다.

책의 실습 예제들은 파이썬으로 되어 있고, pyplot, numpy, pandas, sklearn 라이브러리를 사용합니다. 이 책의 1장에서는 머신러닝이란 무엇이고 어떤 종류가 있는지 개요를 다루고, 2장에서 본격적으로 캘리포니아의 부동산 가격 예측 프로젝트 하나를 예시로 들어가며 머신러닝의 절차를 설명합니다. 2장을 따라하면 주피터 노트북을 실행해서 파이썬 코드로 데이터를 불러와서 정제하고 머신러닝을 해볼 수 있습니다.

3장부터 8장까지는 분류, 회귀, SVM, 결정 트리, 앙상블과 랜덤 포레스트, 차원 같은 머신러닝의 대표적인 개념들에 대해서 배우게 됩니다. 예전에 학교에서 데이터마이닝 수업을 들으며 이론만 배웠던 내용들을 코드로 확인해 볼 수 있어서 새로운 경험이었습니다. 이 책을 읽으면서 이론도 알아야 하지만 실제로 활용하려면 실습도 중요하다는 것을 다시 한 번 느끼게 되었습니다.

한 가지 아쉬운 점은 코드의 전체가 아니라 일부만 책에 실려 있다는 점입니다. 전체 코드는 저자가 인터넷에 올려 둔 것을 내려받아서 확인해야 합니다. 그리고 이 책에서 사용하는 데이터 분석 관련 파이썬 라이브러리들의 사용법을 제대로 모르고 있다면, 읽다가 막히는 부분이 생각보다 많습니다. 라이브러리 학습은 따로 시간을 들여서 해야 할 것 같습니다.

2부부터는 텐서플로로 딥러닝을 하는 방법을 다루고 있습니다. 2부는 아직 다 읽지 못하였지만 시간을 들여서 차근차근 읽고 실습을 따라해 보면 많은 지식을 쌓을 수 있을 것 같습니다. 책의 1부만 보아도 얻을 게 많은 책이고 소장가치가 큰 책입니다.

이 책은 머신러닝의 이론과 실습을 적절히 버무려놓은 교과서 같은 책이라고 할 수 있습니다. 전반적인 난이도는 초보자에게는 쉬운 편은 아닙니다. 그래서 쉽게 쓰여진 다른 책부터 먼저 읽어서 워밍업을 하고 난 후에 이 책을 보면 좋을 것 같습니다. 타시크 라시드의 <신경망 첫걸음>, 사이토 고키의 <밑바닥부터 시작하는 딥러닝> 같은 책들을 보면서 파이썬 라이브러리 사용법에 익숙해지고 나면 더 쉽게 이해할 수 있을 것 같습니다.

ssisks***l2018-05-15

머신러닝을 간결하게 정리한 [핸드온 머신러닝]을 읽고

이 책은 정말 머신러닝으로 무언가를 해보려는 분들에게 필요한 책입니다.

배우기 위한 책은 아니며 새롭게 익히고 싶은 사람들에게는 다른 책을 찾아보시길 바랍니다.

이 책은 친절한 책이 아니며, 그것을 위한 책또한 아닙니다.

머신러닝을 안다는 가정하게 해결책을 제시하기 위해 만들어진 책처럼 보입니다.

각각 경우에 쓰이는 공식들을 설명하고 어떻게 쓰는 지 설명되어 있습니다.

지극히 간결하여 찾아보기 좋으나, 실제로 이것이 어떤 것을 의미하는 지는 잘 알 수 없어 아쉬웠습니다.

아무리 간결해도 확률에 대한 설명은 좀 더 친절해도 좋지 않았나 싶었습니다.

무언가 막혀 있을 때, 해법을 줄만한 뭔가가 필요할 때. 도움이 될 책입니다.

문제를 해결하기 위한 여러가지 방법을 제시하기 때문입니다.

Python을 이용하고 있지만 사실 Python, 싸이킷런, 이런것들을 설명하고 있다는 점 보다는

어떤 확률공식이 있는지, 어떻게 사용되고 있는지를 알 수 있다는 점에서 높은 점수를 주고 싶습니다.

여러분이 머신러닝을 공부를 어느 정도 하였고, 어떻게 쓰이는 지 알고 싶으신 분들에게 추천합니다.

아직 다 읽지는 못하였지만

읽으면서 느낀 점은 수학공부 확률공부를 해야겠다는 것입니다.

wnghdc***l2018-05-13

현존하는 머신러닝 책 중 제일 좋은 책.

현존하는 머신러닝 / 딥러닝 책 중 단언컨대 최고의 책이라고 할 수 있다. 어려운 개념으로 들어가는 도입부에 나오는 적절하게 재밌는 비유는 독자들을 웃게 하며 pandas나 numpy의 "인터넷에 찾아보면 나오는" API 관련 내용들을 적절히 배제하고 진도를 나감에 있어 잘 짜여진 구조로 이 책은 구성되었다. 2달정도 이 책을 따라하며 예제를 하면 정말 딥러닝의 고수가 될 수 있을것이다! (하지만 오타와 잘못된 설명이 있는게 옥의 티이다. )

인상깊은 구절

앙상블 ? 그것은 대중의 지혜!

무작위로 선택된 수천명의 사람에게 복잡한 질문을 하고 대답을 모은다고 가정합니다. 많은 경우 이렇게 모은 답이 전문가의 답보다 낫습니다. 이를 대중의 지혜라고 합니다. 이와 비슷하게 일련의 예측기로부터 예측을 수집하면 가장 좋은 모델 하나보다 더 좋은 예측을 얻을 수 있을 것입니다. 일련의 예측기를 앙상블이라고 부르기 때문에 이를 앙상블 학습이라고 하며 앙상블 학습 알고리즘을 앙상블 방법이라고 합니다.

은닉층이 많을수록 ? 우리의 뇌처럼!

복잡한 개미탑이 개미들의 작은 노력이 모여서 이뤄진 것처럼 매우 복잡한 계산이 단순한 뉴런으로 구성된 거대한 네트워크에 의해 수행될 수 있습니다. 생물학적 신경망의 구조는 여전히 활발히 연구가 진행되는 분야입니다. 뇌의 일부는 그 지도가 그려져 있는데 인간피질처럼 연속된 층으로 조직화되어 있는 것으로 보입니다.

오토인코더 설명부분

숙련된 체스플레이어가 체스판을 5초동안만 바라보고도 전체 말의 위치를 외울 수 있다는 것을 알아냈습니다. 대부분의 사람에게는 불가능한 일입니다. 그러나 이는 체스 말들이 무작위로 놓여 있을 때가 아니라 현실적인 위치에 있을 경우에만 그렇습니다. 체스 전문가라 하더라도 우리보다 더 뛰어난 기억력을 가지고 있지는 않습니다. 단지 그 게임에 대한 경험 덕분에 체스 패턴을 더 쉽게 보는 것뿐입니다. 즉 패턴을 찾게 되면 정보를 효율적으로 저장할 수 있습니다.

레이블

데이터를 레이블하는 것(예를 들어 귀엽거나 그렇지 않은 이미지를 분류하는 것)은 사람만이 할 수 있습니다.

* 정말 좋은 비유를 통해 재미있게 들어간다.

partial

이 함수는 어떤 함수를 감싼 래퍼 함수를 생성하며 매개변수의 기본값을 지정할 수 있도록 도와줍니다.

오타

88쪽 ceil 함수를 사용하여 반올림 > 올림이 되어야 한다.

305쪽 scaled_housing_data_plus_bias 부분 코드와 설명이 빠짐

kcsgood***l2018-05-13

머신러닝과 딥러닝, 인공지능이 잘 섞인 "핸즈온 머신러닝"

O`reilly 사에 뉴스레터를 신청하면 가끔 신규 책을 준다면서 설문조사를 요청할 때가 있다. 그때 받은 책중 하나가 바로 이거였다.

사실 내가 선택할 수 있는 책중 가장 관심있는 분야여서 선택한 것도 있지만, 책에 담겨져 있는 이론적인 내용이나 실무적인 내용에 대한 설명이 굉장히 잘 되어 있었다. 알고보니 현재도 amazon에서는 Natural Language Processing 분야에서 Best Seller 1위에 랭크되어 있었다.

방대한 량만큼이나 최근의 트랜드를 잘 담고 있던 책이라 언제쯤 한국에 번역되려나 싶었는데, 원서가 출시된지 거의 1년만에 번역서로 출시되었다. 이 책에 대한 리뷰를 간단히 해보고자 한다.

항상 내가 갈구하고 바랬던 머신러닝 관련 책들은 수식이나 원리에 대한 설명이 잘되어 있고, 그 내용을 바탕으로 실제의 예제를 살펴볼 수 있으면 좋겠다고 생각했었고, 시중에 머신러닝 책들이 나오면 그런 트랜드가 반영되어 있나 살펴보는 편이었다. 그런데 어느 책도 그 둘다를 만족하는 책이 사실 잘 없었던 것 같다. 사실 이런 분야가 그렇지만 머신러닝이나 딥러닝을 공부하게 되면 반드시 통계 관련 내용을 다뤄야 되고, 그러려면 책의 두께가 두꺼워지거나 실습을 할 수 있는 여지가 줄어들게 된다.(그나마 스티븐 마슬랜드의 "알고리즘 중심의 머신러닝 가이드" 책이 생각한 것과 유사했는데 책의 주제가 머신러닝 알고리즘에 한정되어 있어, 딥러닝이나 강화학습 관련 내용이 담겨있지 않아 아쉬운 부분이 있다.)

일단 내가 소개하는 "핸즈온 머신러닝" 책은 내가 지금까지 읽은 책중 가장 내가 바라던 대로 이론과 실제 예제가 적절히 버무러진 책이었다. 장장 660여 페이지안에 저자는 머신러닝과 딥러닝, 강화학습과 관련된 내용을 최대한 담고자 노력한 흔적들이 보인다. 위의 이미지속에 소개된 내용은 Regulation을 고려한 Linear Regression인 Ridge regression과 Lasso Regression의 편향에 대한 소개 내용인데, 수식과 그림, 그리고 scikit-learn내에서 사용하는 방법에 대해서 기술되어있다. 물론 몇몇 알고리즘들은 본편에서 자세하게 다루지 않고, 부록의 후반부에서 간략하게 다뤄져있다. 그래도 끝까지 보면서 " 아 그래도 이 책을 보면서 머신러닝/딥러닝/강화학습은 어느정도 훑어봤구나" 하는 느낌이 들 수 있게끔 구성되어 있다. 또 큰 주제 속에서도 고려해야 될 내용이나, 참고할 수 있는 문헌에 대해서 중간중간 소개하고 있어 놓치기 쉬운 내용을 한꺼번에 다뤘다는 느낌을 받았다.

참 실습 환경은 대부분의 머신러닝의 책들이 그러하듯이 Jupyter 환경 위에서 머신러닝 패키지인 scikit-learn과 구글에서 만든 딥러닝 엔진인 tensorflow를 기반으로 진행된다. 머신러닝은 scikit-learn, 딥러닝/강화학습 파트는 tensorflow를 활용하여 실제로 관련 API를 쓰면서 실습을 수행하게 된다. 참고로 나도 최근에 회사에서 강화학습과 관련하여 업무를 맡게 되어 몇가지 코드는 응용해서 좀 써보려고 노력했다. 다뤄지는 코드가 막 복잡하거나 그런게 아니라, 책의 원리를 설명하는 부분에서 소개된 내용이라 글의 흐름이나 코드에 대한 설명이 적절하게 어울렸다. (물론 모든 코드를 다 실행해본 건 아니지만, 책과 코드만 읽고서라도 왜 그렇게 코드가 작성이 되고 결과가 나왔는지를 알 수 있던 형태로 되어 있었다.)

그래서 그런지 생각보다 나도 인터넷 강의나 다른 책들을 통해서 새로운 개념이나 scikit-learn/tensorflow API들에 대해서 좀 알수 있던 기회였다. 정말 나도 머신러닝에 관심에 많아서 왠만한 머신러닝/딥러닝 책들이 나오면 서점가서 꼭 읽어보고 그랬었는데, 여타 책들보다도 넓은 범위에서 이정도 내용을 담은 내용을 담고 있다는 게 이 책만이 가지는 장점이 아닐까 싶다. 조금 아쉬운 점은 상대적으로 머신러닝에 할당된 부분에 비해서 딥러닝 부분을 설명한 파트가 상대적으로 적어, 해당 부분을 중점적으로 살펴보고자 하는 독자한테는 조금 부족함을 느낄 수 있을 듯한 생각이 잠시 든다. 그렇다고 딥러닝 쪽에 설명된 부분이 부족하거나 그런건 절대 아니다.

사실 요 몇년 사이에 Oreilly 사에서 나온 번역책들을 많이 읽어볼 수 있는 기회를 가졌었던 것 같다. 분명 몇년전만 해도 데이터 분석이라고 나온 책들이 어느새 책에 머신러닝/딥러닝 이라는 타이틀을 가지고 나오고 있는데, 그만큼 기술의 발전도 진행되면서, scikit-learn이나 tensorflow같은 라이브러리의 도움을 많이 받을 수 있는 지금에까지 이르렀다. 이럴 때에 직접 다룰 수 있는 실습과 이를 뒷받침하는 이론들이 잘 섞여있는 이 책을 한번 보면 어떨까 싶다. 정말 근래 읽었던 관련 분야 책중에는 가장 괜찮았던 것 같다.

참고할 만한 링크:
- 원서 github : https://github.com/ageron/handson-ml
(github 내용을 보니까 최근까지 저자가 계속 업데이트 하고 있는 듯 하다.)
- 역자 github : https://github.com/rickiepark/handson-ml
(역자분께서 원서 notebook까지 번역해서 올려주셨다.)

<이 글에 나오는 "핸즈온 머신러닝" 은 한빛미디어의 지원을 받고 이에 대한 리뷰를 작성한 것임을 알려드립니다.>

출처: http://talkingaboutme.tistory.com/881 [자신에 대한 고찰]

dragm***l2018-05-08

2장의 내용만으로도, 이 책을 구입할만한 가치가 있다. 'ㅅ')

이 책은 아마존 도서 인공지능 분야 1위 어쩌구 저쩌구! 하는 현란한 카피와 함께

페이스북 피드에 겁나 자주 보이는, 요즘 한빛미디어가 엄청 밀고 있는 책이다. 'ㅅ')

마치 x이버 댓글 매크로 돌린 것 마냥 폭발적인 수의 댓글이 그 피드에 달리고 있는 요즘 핫한 그 도서.

본인은 데이터 과학, 통계, 머신러닝에 이제 막 관심이 생겨 두루두루 관련 지식들을 둘러 보고 있는 Front-end 개발자이다.

지난 몇 주간 통계 관련 도서를 살펴 보면서 분산, 표준편차, 공분산, 상관계수 등의 용어들과 공식을 익혀가는 도중에 이 책을 접하게 된거임. 'ㅅ')

undefined

이 도서에서 소개하고 있는 사이킷런은 다양한 알고리즘을 구현하고 있는 라이브러리라고 하는데, 본인도 이 도서를 살펴보면서 처음 알게 되었다.

'파이썬 라이브러리를 활용한 머신러닝' 도서에서도 사이킷런 라이브러리를 다루고 있다고 하니,

관심자 분들은 이 도서도 참고해보시는게 좋을 듯. // 'ㅅ') 알고보니 두 책을 번역하신 분이 동일 인물.

본인 같은 데이터 과학, 머신러닝 입문자 입장에서는 2장의 내용이 신의 한수이다. 'ㅅ')!
이 장의 내용만으로도 이 책의 구매 가치는 충분하다.

데이터셋에서 시작해서, 데이터 편집, 시각화, 학습, 검증, 튜닝 등의 전체 프로세스 구축을 위한 흐름을 보여준다.

// 당신이 후라이드/양념 반반 치킨 2마리를 먹을 돈이면, 이 책을 얻을 수 있는 것이다. 당신은 치킨이 고픈가 지식이 고픈가 'ㅅ') 물론 나는 둘 다 고픔.

전반적으로 파이썬 언어를 사용하는 프로그래밍 환경에서 실습할 수 있는 코드들을 소개하며,

part 1 에서는 지도, 비지도, 준지도 학습의 알고리즘 중 몇 가지를 (매우) 세부적으로 다루고,

이 과정에서 사이킷런 라이브러리의 사용법을 소개하고 있다.

part 2 에서는 텐서플로와 인공 신경망에 관해 다루고 있는데, 펜서플로 자체에 대한 설명은 길지 않으나

12장의 주제인 '다중 머신과 장치를 위한 분산 텐서플로' 는 다른 도서에서 찾아 보기 어려운 내용을 소개하고 있다.

또한, 신경망 자체에 대해서는 이론부터 사이킷런과 텐서플로를 이용하여 그를 다루는 방법들을 자세히 설명하고 있는데,

당신은 분명히 이 챕터에서 등장하는 수학 공식 난무를 맞고 처참히 쓰러져가는 자신의 모자란 수학 능력에 자괴하게 될 것이다.

// 수학 능력 시험과 아무런 관련도 없고 말이지 'ㅅ')a 긁적.

이 책은 671p 에 달하는 볼륨으로, 단시간에 소화할 수는 없는 책이다.
딥러닝, 머신러닝 입문자가 계속해서 참고하며 살펴보는,

마치 수학의 정석 책 마냥 한번 구입해서 책장에 꽂아두고 마르고 닳도록 꺼내 보는 그러한 책인 것이다.

.

icon***l2018-05-07

사이킷런과 텐서플로로 배우는 딥러닝 교재 - 핸즈온 머신러닝

제가 얼마전 <딥러닝의 정석> 이란 책을 읽었었는데요...

딥러닝에 관심이 많은 저에게 한빛미디어에서 준 선물이었거든요...

아직은 딥러닝 공부가 미약해서 책에서 주는 정보의 10프로도 소화를 못하고 있는것 같아서 많이 아쉽기는 하지만...

여러번 읽다 보면 딥러닝이 무엇인지 감을 좀 잡을 수 있지 않을까 하는 느낌으로 머리맡에 두고 자기전 조금씩 다시 한번씩 읽어 보게 되네요.

그것이 계기가 되어서 이번에는 <핸즈온 머신러닝> 이라는 책을 리뷰 한다길래 신청을 했는데...

이번에 선물이 도착했네요.^^

<핸즈온 머신러닝> 과 <딥러닝의 정석>은 구조가 좀 틀리네요...

아무래도 <핸즈온 머신러닝> 이 중급자용 책이라는 설명이 있어서 신청을 하고 나서 살짝 걱정이 되었거든요...

괜히 아무것도 이해하지 못하면서 덜컥 신청해서 다른 사람에게 갈 기회를 한번 뺏은것은 아닐까? 라는 생각같은게 들었어요.

긴장을 하면서 책을 펼쳤는데...

<딥러닝의 정석> 같은 경우에는 처음에 인공지능에서 사용하는 신경망 부터 전방향 신경망 학습 과 같이 딱딱한 용어들이 등장하면서 사실 살짝 경직되게 만들더라구요.

그런데 <핸즈온 머신러닝> 은 책이 두꺼워서 그런지는 모르겠지만 처음에 설명 나오는 것이 머신러닝이란? 이었네요.

Part1 에서 만나는 머신러닝은 기존에 제가 많이 들어 보고 대충은 알고 있던 내용들로 접근을 하다 보니...

오히려 책을 읽는데 훨씬 더 부드러워지네요.

책의 내용을 살펴 보면 위와 같이 일반 사람들도 보기 좋은 형태의 도식이 저 같은 사람들이 딱 읽기 좋게 되어 있더라구요...

하나 하나 차근 차근 읽어 가다 보면 선형대수와 같은 수학적 지식을 갖추고 있지 않더라도 지식을 쉽게 받아 들일수 있게 딱딱하지 않게 구성이 되어 있었습니다.

한 Chapter 가 끝날때 마다 이렇게 연습문제를 두어서...

앞에서 설명한 부분의 중요한 부분을 한번씩 체크 하고 넘어 갈 수 있게 되어 있어서...

중요한 이론에 대해 다시 한번 생각하게 해 주더라구요.

Chapter1 에서 가장 좋았던 부분은 위와 같이 실제 데이터를 가지고 직접 연구 조사 하여 부동산의 방의 갯수와 부동산 가격의 상관 관계 등을 구현해 볼 수 있다는 것이 상당히 인상이 깊게 남았어요.

Part1 에서는 사이킷런을 가지고 주로 실습을 해보게 되는데요

위와 같이 직접 파이썬을 가지고 사이킷런 모듈을 활용해서 실습을 할 수 있게 구성이 되어 있습니다.

Part2 에서는 요즘 많이 사용하고 있는 텐서플로 라이브러리를 이용해서 신경망과 딥러닝에 대해서 공부를 하게 되네요.

텐서플로 설치 부터 Part1 에서 배운 선형회귀, 경사하강법 등을 직접 실습을 해 볼 수 있습니다.

핸즈온머신러닝에 대한 자세한 내용은 http://www.hanbit.co.kr/store/books/look.php?p_code=B9267655530 에서 확인 할 수가 있구요.

미리보기도 가능하기 때문에 미리 확인해 보시면 될것 같아요.

이 책을 읽으면서 중급용 교재라고 해서 약간 긴장을 했었는데요...

<딥러닝의 정석> 보다 훨씬 입문자용으로 접근하기가 너무 좋은 책이라는 생각이 들었어요.

책의 구성에서도 직접 실습을 해 보면서 배운 이론을 눈으로 확인을 해 볼 수 있게 되어 있는 형태로 되어 있어서 너무 좋았던것 같습니다.

그리고 가장 많이 사용되는 사이킷런이나 텐스플로를 이용한 딥러닝의 이론을 풀어 나가기 때문에 이 책 한권만으로도 딥러닝이란 무엇인가 감을 잡을것 같더라구요.

이 책을 읽으면서 연신 감탄을 했던 것은...

제가 이 나이가 되면서 이러한 알고리즘을 몰랐던것이 아쉬웠고... 또한 이러한 알고리즘 기법들을 깨달았다고 해도 이러한 모듈을 만들 수 있었을까? 라고 생각해도 절대 아닙니다. 라는 말이 나오더라구요...

정말 다행스러운 것은 구글이나 이렇게 큰 기업에서 이러한 딥러닝 라이브러리를 만들어서 공개함으로써 많은 사람들이 이 라이브러리를 이용해서 새로운 딥러닝 시스템을 만들어 낼 수 있다는 것...

이러한 딥러닝의 이론만을 공부해서도 충분히 활용하여 새로운 인공지능 프로그래밍을 할 수 있다는 것에 정말 감사한 마음이 들었습니다.

우리 아이들도 이러한 기법들을 이해하고 이러한 것을 활용하여 새로운 서비스를 충분히 만들어 낼 수 있을것이라는 기대를 만들게 하는 책이었네요.

핸즈온 머신러닝

자료 다운로드시 유의사항

▶ 부록/자료 관련 FAQ