Vision Statement
기계는 어떻게 스스로 학습하는가(그리고 우리가 택해야 할 영리한 활용법은?)
‘머신러닝Machine Learning’[1]은 한번쯤 들어봤을 법한 용어다. 그래서 누군가 머신러닝의 중요성을 역설하면, 사실은 그 정의와 작동 원리에 대해 잘 모르면서도 고개를 끄덕이는 경우가 많을 것이다. 데이터 과학자에게 설명해달라고 요청하면 포크forks, 잎 노드leaf nodes, 스플릿 포인트split points, 재귀 알고리즘recursions 등 홍수처럼 쏟아지는 전문 용어 때문에 더 혼란스러워질 수 있다. 복잡한 전문지식은 잊고 머신러닝의 핵심만 알아두자. 이미 보유하고 있는 데이터에 통계학 모델을 적용해 보유하고 있지 않은 데이터를 최대한 정확히 예측하는 것이라는 사실만 알면 된다.
이러한 예측을 통해 잡음 사이에서 신호를 찾고, 수집 중인 데이터 전체에서 가치를 추출할 수 있다. 머신러닝을 활용할 때의 장점이자 필수적인 요소는 속도와 강력함이다. 아무리 뛰어난 애널리스트일지라도 단 몇 분, 몇 초 사이에 감히 모방할 수 없는 방식으로 방대한 양의 데이터를 파헤쳐 패턴을 찾아내고, 예측 작업을 하는 것이다. 머신러닝은 다양한 경우에 활용되는데, 특히 발작이 일어날 가능성이 있는 환자를 미리 찾아내는 데 유용하게 쓰이고 있다.
무엇보다도 머신러닝의 주체인 컴퓨터는 인간 학생과 달리 아무리 많은 데이터가 주어져도 지치거나 지루해하지 않는다. 머신러닝의 기본적인 작동 프로세스는 다음과 같다.
[1]기계학습 · 인공지능의 한 분야로, 컴퓨터가 빅데이터를 분석해 스스로 학습하고 미래를 예측하는 기술. ‘딥러닝’이라고도 불린다 - 편집자 주
[2]온라인 동영상 스트리밍 서비스. 영화나 드라마 등 다양한 콘텐츠에 접근할 수 있는 대표적인 서비스들 – 역주
[3]신뢰구간에서 벗어나는 이상치 – 편집자 주