Learning & Reasoning 64

R datatype 간단 정리

R 에서 쓰이는 데이터 타입들이 조금씩 헷갈린다. 다시 vector 부터 bottom-up 으로 정리해 보자.1. vector일련의 연속된 순서를 갖는 element 들로 만들어진 데이터 구조. 다른 언어에서 1차원 array를 연상하면 됨. 역시 마찬가지로 vector 내의 element들은 모두 같은 mode(data type) 이어야 함.R은 scalar 타입이 없으므로 R에서 scalar 같이 쓰인 것은 실제로 one-element 벡터임.> v str(v) int [1:12] 1 2 3 4 5 6 7 8 9 10 ... 위의 벡터 v의 모드는 integer이다. 벡터는 그 element들의 모드에 따라 integer, numeric(실수), character(string), logical(Boo..

6.3.2 Extended Example: Extracting a Subtable "The Art of R Programming"

> cttab # is a two dimensional table Voted.For.X.Last.Time # "Voted.For.X.Last.Time" dimension has 2 levels Vote.for.X No Yes # "Vote.for.X" dimension also has 2 levels (No, Yes) No 2 0 Not Sure 0 1 Yes 1 1 > class(cttab) # cttab is a class of table [1] "table" We would like to have a function "subtable" that does ; > st = subtable(cttab,list(Vote.for.X=c("No","Yes"), + Voted.for.X.Last.Time=c("..

vector라 불리는 R 자료구조

R에는 보통 다른 언어에 있는 " int i = 10 " 에서 i 같은 scalar 데이터 타입이 없다. R에서 쓰는 모든 값 또는 변수는 자료구조 (data structure) 의 특정 값이던가 또는 자료구조를 reference한다. 또한 R의 모든 자료구조는 어떤 클래스이다. 즉, R에서 모든 data type (R에서는 mode라고)은 자료구조로 되었있으며, 모든 값을 지닌 변수는 object이다. 그 중 가장 단순한 것이 vector이다. vector는 동일한 데이터 타입으로 된 element들의 일차원 배열이다. vector 내의 element들은 순서(index)를 갖는다. R의 index는 C/JAVA와 달리 '1' 부터 시작한다. 우리가 R에서 vector 변수를 치면 나오는 [x] 응답 ..

Simpler AdaBoost -1

* 찾아보니 우리나라에서도 R을 이용한 시도들이 있고 좋은 글 (참고-1, 참고-2, 참고-3) 도 많다. 나는 R에 관해 초보라 별로 보탤 것이 없지만 조그만 좌충우돌을 이곳에 남겨 나같은 초보들에게 도움이 되었으면 하고... AdaBoost를 설명/분석한 좋은 글들이 많지만 그 중에 가장 쉽게 설명되었다고 느낀 것을 더 쉽게 시도하려 한다. 쉽게 얘기하는 것도 좋은 능력이기에 이 또한 배워야 함을 느낀다. 아직 영어로 기술 글을 쓰는 것이 편리하기에 일단 영어로 써보자. This note is a modest effort to provide a gentler introduction on AdaBoost algorithm than already very accessible Raúl Rojas note...