Learning & Reasoning/R 21

6.3.2 Extended Example: Extracting a Subtable "The Art of R Programming"

> cttab # is a two dimensional table Voted.For.X.Last.Time # "Voted.For.X.Last.Time" dimension has 2 levels Vote.for.X No Yes # "Vote.for.X" dimension also has 2 levels (No, Yes) No 2 0 Not Sure 0 1 Yes 1 1 > class(cttab) # cttab is a class of table [1] "table" We would like to have a function "subtable" that does ; > st = subtable(cttab,list(Vote.for.X=c("No","Yes"), + Voted.for.X.Last.Time=c("..

vector라 불리는 R 자료구조

R에는 보통 다른 언어에 있는 " int i = 10 " 에서 i 같은 scalar 데이터 타입이 없다. R에서 쓰는 모든 값 또는 변수는 자료구조 (data structure) 의 특정 값이던가 또는 자료구조를 reference한다. 또한 R의 모든 자료구조는 어떤 클래스이다. 즉, R에서 모든 data type (R에서는 mode라고)은 자료구조로 되었있으며, 모든 값을 지닌 변수는 object이다. 그 중 가장 단순한 것이 vector이다. vector는 동일한 데이터 타입으로 된 element들의 일차원 배열이다. vector 내의 element들은 순서(index)를 갖는다. R의 index는 C/JAVA와 달리 '1' 부터 시작한다. 우리가 R에서 vector 변수를 치면 나오는 [x] 응답 ..

rpart 패키지를 이용해 decision tree 만들기

> library(rpart) # rpart 패키지 로드> library(rattle) # rattle 패키지를 이용 > weatherDS = new.env() # decision tree를 담을 environment 생성> class(weatherDS) [1] "environment weather dataset을 읽음. "weather.csv" 파일이 e: 드라이브에 있다고 가정 > weather = read.csv("e:/weather.csv") > dim(weather) # weather : decision tree 적용 대상 dataset [1] 366 24 > names(weather) [1] "Date" "Location" "MinTemp" "MaxTemp" "Rainfall" "Evapora..

R 데이터 cleaning

R로 로딩한 데이터를 깨끗이 정리하는 연습.앞서 로딩한 데이터를 "data"로 명명해서 햇갈리니 이름을 바꾸자.> weatherData = data # dim(weatherData) [1] 20 22 # 즉 row/record/observation 이 20개이고, column/field/variable 이 22개> class(weatherData) [1] "data.frame" # weatherData는 data.frame 즉 dataset 임. > names(weatherData) // weatherData data.frame이 아래 22개의 variable로 구성됨 [1] "" "Date" [3] "Minimum temperature (캜)" "Maximum temperature (캜)" [5] "R..

연습할 데이터 만들기

R을 이용해 어떤 데이터에 대해 통계작업을 하거나 데이터 마이닝을 하려면 그 작업 대상인 데이터가 당연히 있어야한다. 이 테이터를 data set이라 한다. R을 설치하면 퍽 많은 data set들이 함께 따라와 그것들을 이용해 R 연습을 할 수 있다. 또한 패키지를 깔면 함께 data set들이 따라 오는 경우도 많다. 그렇지만 실제 환경에서 R을 활용함은 실제 data set을 대상으로 하고 이것들을 R로 갖고와야 한다. 외부에서 데이터를 갖고오기를 연습해보자. 이런 데이터 import/export 설명 자료는 R 사이트 (http://www.r-project.org)의 Manuals/R Data Import/Export 에 가서 구한다.> today today [1] "201301"> dataSou..