Learning & Reasoning

데이터 사이언스 공부하기에 수학 지식은?

이현봉 2013. 5. 31. 23:46

데이터 사이언스 공부를 시작하려는 사람들이 궁금하게 여길 것이 얼마나 수학적 지식이나 프로그래밍 기술이 필요할까 인가가 아닐까 생각합니다. 많은 곳에서 데이터 사이언티스트가 되려면 머신러닝, 수학, 데이터마이닝, 통계학 같은 지식이 있어야 한다고 말하죠. 맞는 말입니다. 그런데 머신러닝 같은 것은 대부분 학부에서 제공되지 않습니다. 그러면 학부만 졸업한 사람이 필요한 수학적 지식은 얼마나 되면 좋을까요?

물론 많이 알수록 좋겠지만 대학 공업 수학 정도면 적당하다고 생각합니다. 그 이상되면 수확체감이 급격해 질 것 같습니다. 미적분을 바탕으로 선형대수학, 확률통계, vector calculus까지 다 맛을 보게 되니까요. 실제로 머신러닝 교과서에는 이런 지식들이 다 동원되죠.

그런데, 희랍문자만 나오면 멘붕이 되는 사람들은 어떻게 해야 하나요. 그래도 문제없다고 하면 그건 사기치는 얘기죠. 그렇지만 이렇게 풀릴 수는 있습니다. R 같은 언어로, 가장 쉬운 책으로 하나씩 연습해 보면서 거기에 있는 수학적 표현들을 이해해 보도록 하고, 그러면서 수학 정석과도 친해지고요. 다행인 것은 미적분 문제 풀이에 능통해져야 할 필요는 없다는 것입니다. 수식으로 표현된 것을 이해하는 것이 중요하거든요. 그나마 수식으로 표현하는 것이 가장 이해하기 쉽죠.