빅데이터를 보통 기존의 DBMS나 파일 방식으로 처리하기 곤란한 매우 크고 복잡한 데이터를 처리하는 IT 방식이라 말한다. Tera, Peta 바이트 규모를 넘어 Exa 레벨의 데이터처리도 생각하고 있다 한다.
필요도 공감되고 더욱 좋은 기술이나 방법도 나올 것이라 생각한다. 하지만 빅데이터라는 낱말은 여전히 어색하게 들린다. 마케팅과 세일즈 필요에 의해 이 단어을 만들었다고 이해하려고 해도 그렇다. 컴퓨터가 원래 대용량 데이터를 처리하기 위해 탄생했고 지금껏 IT 발전의 가장 큰 동기가 더 크고 복잡한 데이터처리를 가능하게 함에 있었는데 새삼 빅테이터는 무슨 뒷북 치는 말인지. 낱말의 뜻 자체부터 오리무중이다.
Teradata는 30년 전에 생겼고 구글은 Googol을 생각하다 Google이 되었는데. 이 두 회사는 모두 "대용량데이터==빅데이터"를 염두에 두었지만 테라데이터는 데이터웨어하우스였고 구글은 대용량 검색엔진이었다. 이들의 대용량데이터의 처리 목적/어플리케이션이 다르다. 대용량데이터를 "무슨 목적을 갖고 어떻게 처리해서 어디에 적용할 수 있는 지"에 따라 얘기가 되면 좋겠다. Big Mining, Big Warehouse, Big Modeling, Big Analytics 같이 하면 될까? 적어 보니 멍청한 단어들이다. Warehouse 자체가 큰 것을 내포하고 있는데. 에이, 그냥 쓰자.
'소프트웨어 이야기' 카테고리의 다른 글
빅데이터와 하둡 사이의 적정 거리는? (0) | 2013.02.01 |
---|---|
오픈소스와 명품과의 거리 (0) | 2013.01.23 |
어떤 메소드 (0) | 2012.11.21 |
멀티스레딩 (0) | 2012.09.07 |
윈도우즈 시스템 분석 도구 (0) | 2012.03.07 |