ISLR Chapter 8 - Tree 기반 방법 (Random Forest, Gradient Boosting) Introduction to Statistical Learning8장 내용인 Tree기반 Supervised Learning: Decision Tree (의사결정 트리)Random ForestGradient BoostingRegression, Classification 사용과 Cross-Validation 또는 Train/Test split을 통해 Test Performance 추정 및 패러미터 튜닝을 익힌다.pdf Learning & Reasoning/Python - Scikit-learn_Tensorflow 2016.11.20
데이터를 어떻게 보아야 하나? 데이터사이언티스트는 통계를 알아야 한다기에 통계책을 보았다. 그러고 보면 내가 공부하고 다뤘던 거의 모든 것이 데이터인데 그럼 데이터사이언티스트는 또 무엇인지 좀 헷갈리기는 하다. 통계책을 보면서 어려웠던 것은 어떤 것들은 정말 납득이 그냥 안되는 것이었다. 수학적인 테크닉은 쉽다. 헌데, 가설이나 Null hypothesis를 세우고, p value나 그런 통계치를 계산하고, 그 수치가 의미가 있는 지 테스트를 하고, 우리가 얻은 데이터가 가설에 부응하냐 아닌가 따지고, 그런 것들이 정말 다가오지 않았다. 왜 가설이 필요한지, 그런 틀이 왜 있어야 하는지, 그런 틀에 왜 맞춰보아야 하는지, 작위적이란 생각이 들었다. 다른 사람들이 쓴다고 하기에 하지만 공부할 맛이 나지 않았다. 내가 배운 stochas.. Learning & Reasoning 2013.10.24
random forest random forest를 이용한 연습참고 :http://stat-www.berkeley.edu/users/breiman/RandomForests/http://cran.r-project.org/web/packages/randomForest/randomForest.pdfhttp://en.wikipedia.org/wiki/Random_forest-------------------------------------------------------------------------------------------------- 우선 random forest를 담을 environment 만듬> weatherRF evalq({ + data evalq({ + modelRF class(weatherRF$modelRF) [1.. Learning & Reasoning/R 2013.01.28