Learning & Reasoning/Python - Scikit-learn_Tensorflow

ISLR - Introduction to Statiscal Learning with application in R - 에 부쳐

이현봉 2016. 10. 21. 13:34

어느새 4년이 되었다.  2013년 지금은 기억이 안나는 어디선가 좋은 책이 나왔다고 해서 읽기 시작한 것이 ISLR (Introduction to Statiscal Learning with application in R) 이다. 

1983년 Duda & Hart의 "Pattern Classification and Scene Analysis"와 Tou & Gonzalez의 "Pattern Recognition Principles" 를 읽기 시작한 이후 꽤 많은 패턴인식이나 머신러닝책들을 보았다. 4년전 당시 막 익힌 R을 이용하면 머신러닝(데이터사이언스)을 이공계 출신이 아닌 사람들도 쉽게 사용할 수 있어 그에 맞는 책을 찾아보고 있었다. 쉽고 친절하면서도 내용을 우스개거리로 만들지 않으며 핵심을 집는 그런 책. 내가 읽은 책들은 적합하지 않았다. 

그러던 중 ISRL 초안을 구해 읽기 시작한 날 책을 놓지 못해 밤새도록 거의 반을 읽었다. Linear Regression을 그 이전에 말은 들었지만 그 내용이 무엇인지 몰랐으니 Linear Regression은 ISLR로 그 날 배웠다.  전공관련 책을 이렇게 읽은 적은 내가 학생인 적 이후 처음이었다. 내가 원했던 모든 것을 갖추었다. 신경망, Gradient Descent, Bayesian 접근/알고리즘, Frequency-Domain/Wavelet 분석들 얘기가 있었으면 했지만 그 건 정말 욕심인 것이 저자들이 명확히 ISLR은 비이공계 학생이나 그 출신들을 위함이라 했다. 이럴진대, 머신러닝, 데이터사이언스 이런 류의 일을 한다는 사람이 (영업, 마케팅 제외) 이 책의 이론 내용, 실습, 연습 문제 정도는 베이스라인으로 갖춰야 한다. 그렇지 않으면 그냥 가짜, 사기꾼, fake다.  더 이상 말이 필요없다.  

3년 째 ISLR을 사용해 강의하고 있다.  작년에 ISLR의 R 내용을 Python으로 하고 싶은 생각이 들어 일을 시작했다.  금년엔 ISL-Python으로 강의하고 있는데 진도가 잘 안나간다.  내년에 다시 이 강의를 하게 되면 또 다시 고민할 지도...