전체 글 255

Financial Time Series Import

Financial 시계열 구하기 1. Reading the financial time series data from the local CSV file ‘quantmod’ package loads xts & zoo package internally 이 경우 local file은 zoo 시계열로 읽기에 적절한 형태로 되어 있어야 함. library(quantmod) ## Warning: package 'quantmod' was built under R version 3.2.2 ## Loading required package: xts ## Loading required package: zoo ## ## Attaching package: 'zoo' ## ## The following objects are ma..

인공지능 선언

포크레인이 커다란 바위를 쑥 집더니, 이리 저리 돌리고 아귀를 맞쳐가며 옹벽을 쌓는다. 적당하게 경사를 주면서, 쌓고 난 것이 미적 감도 보인다. 땅을 긁으면서 평평하고 고르고, 거꾸러 바가지를 뒤집더니 툭툭 다지기까지 한다. 예술이다. 기사님의 솜씨도 한 몫 했겠지만 저 포크레인 한 녀석이 수십명 일을 불평도 않고 혼자 한다. 19세기 초 증기기계가 수십명의 사람들이 하던 일을 대체해 산업혁명과 함께 자기 노동력이 유일한 상품인 수많은 사람들에게 불행도 딸려 주었다. 이젠 기계와 같이 사는 데 익숙해졌다. 소프트웨어가 구글, 아마존, 이베이, 페이스북을 있게 해 세상을 변화했다. 우버, 에어비엔비, 카카오택시가 오프라인 세상를 흔든다. 그래도 이 것들은 앞으로 SW가 할 수 있는 것들에 비하면 새발의 ..

R로 Lasso regression 연습

Lasso_LAR_with_LARS_Package Lasso Regression with RHyun Bong Lee 2015년 10월 5일 LARS 패키지를 이용한 LASSO, LAR examples, by HBLEE 특히 HTF의 “The Elements of Statistical Learning” 에 언급된 Regression의 Shrinkage Method 중 하나인 LASSO (L1 Norm: Sum of Absolute values, PENALTY/CONSTRAINT-BASED VARIABLE SELECTION)에 집중 Regularized Regression으로 Ridge Regression도 있으나, LASSO가 더 유용하리라 판단 Reference : - CRAN LARS 패키지 매뉴얼 :..

Python Noobie

이번 달부터 Python을 심각하게 익히고 있다. 그동안 시스템 프로그래밍, 웹, 분석 등 여러 목적에 두루 쓰면서 너무 복잡하지 않는 언어를 찾다가 Python으로 삼기로 했다. C, JAVA, R 언어와도 어렵지 않게 연결될 수 있다고 하고. 혼자서도 여러 목적의 쓰임새를 숙달할 수 있을 것 같다. 익숙해지지 않는 PHP+HTML 섞기, SQL이 프로그램처럼 구는 것을 않보며 살면 좋겠다. R vs. Python : Data Science에 R이 낫나 Python이 나은가? 웹에 많은 말들이 있는데 다 맞다. 각자의 경험, 배경, 그리고 앞으로의 목적에 따라 의견이 다를 것이다. 내 경험으론 R의 강점은 빨리 익혀 사용할 수가 있다는 것과 많은 library에 있다. R의 상대적 단점이자 Python..

Data Science는 막장?

Data Science Is Dead 에서 데이터 사이언스는 과학이 아닐 뿐더러, 데이터 사이언스는 새로운 효용보다는 현란한 구라빨이 주 무기고 따라서 데이터 사이언티스트는 막장으로 통하는 길이라 한다. 이 주장대로 풀어보면. "뒤에 과학(Science) 이란 단어가 붙은 분야치고 과학인 것은 없다" 라는 말이 있다. Computer Science도 들어간다. 이 기준으로 보면 Data Science는 전혀 과학이 아니다. 데이타는 앞으로 엄청나게 생기고 모으게 될 것이다. 그렇지만 정말로 그런 데이타 중 열심히 모델을 만들고 분석을 해서 의미있는 정보를 생성할 수 있을 가능성은 얼마나 될까? 해보기 전에는 모른다? 때문에 데이터 사이언티스트 (실제로는 구라꾼이 말로 꼬시겠지만)가 데이터에 생명을 불어넣..

Signal and time series seen from eight miles high cloud - DFT & Simple digital filtering

Discrete Fourier Transform과 단순한 주파수 도메인 필터링 DFT_exHyun Bong Lee DFT_ex DFT_ex A simplified view of Discrete Fourier Transform, and grossly naive take on filtering. Key Words : Fourier Series, Signal, Discrete Fourier Transform, Spectrum, Digital Sampling Nyquist Frequency, Frequency Domain Analysis Some say Fourier Transform is one of the 10(17) equations that changed the world(from googling). I..

Signal and time series seen from eight miles high cloud

20, 30대 읽던 글들을 이젠 이해하기가 어렵다. 산만한 정신에 빠른 지름길을 찾으려고만 하니. 졸업할 때 signal ensemble을 다루는 일을 직업으로 할 기회가 있었는데, 그 길을 가지 않았다. 그 길을 택했으면 지금보다 더 나은 사람이 되었을 것인가는 불분명하지만, 지금보다 훨씬 더 나은 사정에 있었을 것이다. 이제 그 때보다 능력은 훨씬 못하고, 주위에 동료는 없으나, 나 자신을 위한 것이니 아예 못하기 전 정리를 시작해 보자. main Purpose of this exercise : Get to know how multivariate signal/TS can be represented. Good/Bad component classification based on multiple multi..

오래된 헤드폰 수리

헤드폰이 20년이 되니 이어패드와 헤드패드의 쿠션이 완전히 짜부콩이 되어버린다. 안에 있는 스폰지가 완전히 삭아버렸다. 요 몇년간 아예 쓰지 못했다. 역시 또 오래된 내 오디오가 전보다 작은 방으로 들어오게 되어 아무래도 녀석보다는 헤드폰을 좀 더 쓰려고 한다. Sennheiser HD580 이어패드, 헤드패드 교체를 알아보니 생각보다 비싸다. 직접 해결해 볼까... 웹에서 찾아보니 꽤 나와 같은 사람들이 있는 모양. 그런데, 방법이 좀 힘들다. 더 간단한 방법은 없을까? 1. 슈퍼에 가서 1500원 주고 스폰지 하나 구입. 2. 이어패드를 끄집어 내다. 오래 된 것은 내 것처럼 찢겨져 나옴. 3. 헤드폰 청소. 가운데 얇은 스폰지도 제거. 조심하여. 4. 스폰지를 헤드폰 내경에 맞게 재단. 커터칼로 해..

음악 2015.02.01

Supervised Learning with R

지난 주에 7주에 걸쳐 하던 일반인 대상 예측분석과정을 끝냈다. 10명이 안되는 수강생들과 오붓하게 했다. 이 과정 역시 내가 해보고 싶어 연 것이었다. 올 초에 하려 했는데 들을 사람이 없어 못하다가 내가 3명만 되면 하고 싶다고 해서 열었다. 학원은 재정적으로 별로 좋은 과정이 아니었겠다. 내가 재미있었듯이 수강생들에게도 유익했으면 좋겠다. 작년부터 이런 과정을 하고 싶던 중 책을 찾아보았는데 내 맘에 드는 것이 없었다. 책은 많은데 어떤 것은 수강생들에게 너무 어렵고, 또 어떤 것들은 지나치게 피상적이어서 자칫 헛바람만 주입시킬 것 같다는 생각이 들어 거의 포기하던 중 "An Introduction to Statistical Learning" 의 draft를 접하곤 희망을 품을 수 있었다. 잘 쓴 ..