헤더 바로가기 메뉴 바로가기 푸터 바로가기
데이터 사이언스

자연어 처리 기술 활용법

디지털
2022. 6. 8.
Apr22_19_722235443

최근까지는 AI가 데이터 주도형 의사결정에서는 인간보다 우수할 수 있어도 인지와 창의성에서는 열세라는 것이 일반적인 인식이었다. 하지만 지난 2년간 언어 기반 AI가 보여준 놀라운 진보와 도약으로 이러한 인식에도 변화가 생겼다.

특히 ‘자연어 처리(natural language processing, NLP)’ 영역의 기술이 가장 진보했다. 자연어 처리는 AI의 한 갈래다. 컴퓨터가 인간과 비슷한 방식으로 언어를 처리하는 방식에 초점을 맞추고 있다. 가디언(The Guardian) 지의 기사를 작성한 AI의 사례가 있으며, AI가 작성한 블로그 게시물이 바이럴 마케팅에 활용된 경우도 있었다. 이는 몇 년 전까지만 해도 불가능한 일들이었다. 프로그래밍에서도 AI의 약진이 두드러진다. 이제는 사람의 지시에 따라 단순한 비디오 게임을 위한 프로그램을 구현하는 수준까지 이르렀다.

이렇듯 현란한 성과들이 우리의 시선을 사로잡는다. 그런데 AI는 비즈니스에서도 그 효용을 증명할 수 있을까?

자연어 처리는 무엇을 할 수 있는가

가장 잘 알려진 자연어 처리 툴은 오픈AI(OpenAI)사가 만든 3세대 언어 예측 모델 GPT-3이다. GPT-3은 AI와 통계학을 이용해 문장의 한 단어 다음에 올 단어를 예측한다. 자연어 처리 분야에서 이러한 툴은 ‘언어 모델(language model)’이라고 불린다. 문서 분류와 텍스트 내의 감정 분석과 같은 단순한 분석 과제에서부터 질문에 답하기, 보고서 요약과 같은 복잡한 과제까지 수행할 수 있다. 언어 모델은 이미 기존의 텍스트 분석 지형도를 바꾸고 있었지만, GPT-3은 그중에서도 특히 돋보이는 사례다. 공개 당시 이전의 모든 모델보다 10배 더 큰 수준의 용량을 지니고 있었다. 프로그래밍은 물론 고등학교 수준의 수학 문제를 해결하는 고급 과제까지도 수행할 수 있는 최초의 언어 모델이 바로 GPT-3이다. 해당 모델의 최신 버전인 인스트럭트GPT(InstructGPT)는 인간의 가치와 사용자 의도에 훨씬 더 부합하도록 개선된 버전이다. 구글의 최신 모델 역시 언어와 추론과 관련해 더욱 인상적인 성과를 보여주고 있다.

아티클을 끝까지 보시려면
유료 멤버십에 가입하세요.
첫 달은 무료입니다!

최신 매거진

(03187) 서울시 종로구 청계천로 1 동아일보사빌딩 (주)동아일보사
대표자: 김재호 | 등록번호: 종로라00434 | 등록일자: 2014.01.16 | 사업자 등록번호: 102-81-03525
(03737) 서울시 서대문구 충정로 29 동아일보사빌딩 15층 (주)동아미디어엔(온라인비즈니스)
대표이사: 김승환 | 통신판매신고번호: 제 서대문 1,096호 | 사업자 등록번호: 110-81-47558