전체 글 255

노래 제목으로 Hurt

아는 목사님이 설교 중에 Johnny Cash의 "Hurt"를 언급한다. 원래 Nine Inch Nails 노래였는데 자니 캐시가 말년에 다시 불러 무척 사랑받았다. 음울한 노래인데, 자니가 부르니 음울하고 비관적인 감상이 회한끝의 용서, 회개의 느낌으로 다가온다. "갖고싶으면 다 가져가, 먼지로 이루워진 내 제국을. 너를 실망시킬거야. 넌 상처받을 거야" Holy Shit. Nine Inch Nails Just, Don't look back in anger

음악 2013.03.24

빨리 진도 나가야 하는데...

"The art of R programming"은 뚝닥 읽었는데 하루에 한 장씩 읽으려고 한 "Data Mining with R - learning with case studies" 진도가 늦어진다. 뭐가 이리 많노? 밤에 읽으면서 연습하다 이마로 키보드 두드리니... Time series, SNA, igraph 패키지 사용도 더 연습해야 하는데... 오랜만에 stochastic differential equation을 본다. 논문 쓸 때 한참 이것으로 모델링을 했다. Numerical Recipe를 보면서 C로 모델 만들고 Matlab으로 그래프 그린 것이 어제 같은데.. 아니 좀 됐다. R 생태계 참 대단하다.

R datatype 간단 정리

R 에서 쓰이는 데이터 타입들이 조금씩 헷갈린다. 다시 vector 부터 bottom-up 으로 정리해 보자.1. vector일련의 연속된 순서를 갖는 element 들로 만들어진 데이터 구조. 다른 언어에서 1차원 array를 연상하면 됨. 역시 마찬가지로 vector 내의 element들은 모두 같은 mode(data type) 이어야 함.R은 scalar 타입이 없으므로 R에서 scalar 같이 쓰인 것은 실제로 one-element 벡터임.> v str(v) int [1:12] 1 2 3 4 5 6 7 8 9 10 ... 위의 벡터 v의 모드는 integer이다. 벡터는 그 element들의 모드에 따라 integer, numeric(실수), character(string), logical(Boo..

6.3.2 Extended Example: Extracting a Subtable "The Art of R Programming"

> cttab # is a two dimensional table Voted.For.X.Last.Time # "Voted.For.X.Last.Time" dimension has 2 levels Vote.for.X No Yes # "Vote.for.X" dimension also has 2 levels (No, Yes) No 2 0 Not Sure 0 1 Yes 1 1 > class(cttab) # cttab is a class of table [1] "table" We would like to have a function "subtable" that does ; > st = subtable(cttab,list(Vote.for.X=c("No","Yes"), + Voted.for.X.Last.Time=c("..

vector라 불리는 R 자료구조

R에는 보통 다른 언어에 있는 " int i = 10 " 에서 i 같은 scalar 데이터 타입이 없다. R에서 쓰는 모든 값 또는 변수는 자료구조 (data structure) 의 특정 값이던가 또는 자료구조를 reference한다. 또한 R의 모든 자료구조는 어떤 클래스이다. 즉, R에서 모든 data type (R에서는 mode라고)은 자료구조로 되었있으며, 모든 값을 지닌 변수는 object이다. 그 중 가장 단순한 것이 vector이다. vector는 동일한 데이터 타입으로 된 element들의 일차원 배열이다. vector 내의 element들은 순서(index)를 갖는다. R의 index는 C/JAVA와 달리 '1' 부터 시작한다. 우리가 R에서 vector 변수를 치면 나오는 [x] 응답 ..

Simpler AdaBoost -1

* 찾아보니 우리나라에서도 R을 이용한 시도들이 있고 좋은 글 (참고-1, 참고-2, 참고-3) 도 많다. 나는 R에 관해 초보라 별로 보탤 것이 없지만 조그만 좌충우돌을 이곳에 남겨 나같은 초보들에게 도움이 되었으면 하고... AdaBoost를 설명/분석한 좋은 글들이 많지만 그 중에 가장 쉽게 설명되었다고 느낀 것을 더 쉽게 시도하려 한다. 쉽게 얘기하는 것도 좋은 능력이기에 이 또한 배워야 함을 느낀다. 아직 영어로 기술 글을 쓰는 것이 편리하기에 일단 영어로 써보자. This note is a modest effort to provide a gentler introduction on AdaBoost algorithm than already very accessible Raúl Rojas note...