2017
11-12월(합본호)

인공지능 사용 설명서
에릭 브린졸프슨(Erik Brynjolfsson),앤드루 맥아피(Andrew McAfee)

The Big Idea

인공지능 사용 설명서

 

사람들은 인공지능이 세상을 바꿀 거라고 말한다.

인공지능에 투자해야 한다고 얘기한다.

하지만 방법을 알려주지는 않는다.

이제 제대로 알아보자.

에릭 브린욜프슨, 앤드루 맥아피

 

1112_47_1

커버: 인간은 무엇일까?

 

인공의 기준은 무엇일까? 이번 시리즈를 장식한 이미지들은 인간을 찍은 일련의 사진을 토대로 생성됐다. 왜곡 기법을 썼기 때문에 신체 어느 부분을 나타내는지 알아보기 힘들지도 모른다.

(출처: HBR DESIGN STAFF)

 

인공지능 파헤치기

 

인공지능이 조직을 위해 할 수 있는 일과 할 수 없는 일은 무엇일까?

에릭 브린욜프슨, 앤드루 맥아피

 

지난 250여 년 동안 기술혁신은 경제성장의 원동력이 돼 왔다. 그중에서도 증기기관, 전기, 내연기관처럼 경제학에서 범용기술이라고 부르는 기술혁신이 특히 중요하다. 각 범용기술은 상보적인 혁신과 기회를 잇달아 촉발했다. 이를테면 내연기관 덕분에 승용차, 트럭, 비행기, 전기톱, 잔디 깎는 기계가 나왔다. 대형마트, 쇼핑센터, 크로스도킹 창고[1], 새로운 공급망이 생겨났다. 잘 생각해 보면 교외지역이 등장하는 데도 기여했다. 월마트, UPS, 우버 등 다양한 분야의 기업들은 이런 기술을 활용해 수익성 있는 신규 사업 모델을 구상할 수 있었다.

 

이 시대 가장 중요한 범용기술은 인공지능(AI), 그중에서도 머신러닝(ML)이다. 머신러닝은 주어진 임무를 완수할 방법을 인간이 꼭 일러주지 않아도, 기계가 알아서 꾸준히 성능을 개선하는 능력을 말한다. 요 몇 년 사이 머신러닝의 효율성과 가용성이 크게 높아져서, 기계 스스로가 임무수행 방법과 학습시스템을 만드는 단계까지 이르렀다.

 

머신러닝이 왜 중요할까? 이유는 두 가지다. 첫째, 인간은 자신이 말할 수 있는 것보다 훨씬 많은 걸 알고 있다. 사람의 얼굴을 식별하거나 바둑 대국에서 묘수를 두는 등 수많은 일을 할 수 있지만, 어떻게 그러는지는 정확히 설명하지 못한다. 머신러닝이 나오기 전에는, 이처럼 인간의 지식은 표현 불가능한 것이기 때문에 많은 일을 자동화할 수 없다고 믿었다. 하지만 이제는 가능하다.

 

둘째, 머신러닝 시스템은 대개 뛰어난 학습능력을 지녔다. 부정행위를 적발하고 질병을 진단하는 등 여러 활동을 인간보다 훨씬 능숙하게 해낼 수 있다. 훌륭한 머신러닝이 경제 전반에 배치되고 있고, 그 효과는 엄청날 것이다.

 

조만간 인공지능은 지난날의 범용기술만큼이나 혁신적인 영향을 여러 업계에 끼칠 것으로 보인다. 이미 전 세계 수천 개 기업이 인공지능을 이용하고 있지만, 큰 기회들은 대부분 아직 제대로 활용되지 않았다. 제조, 소매, 운송, 금융, 의료서비스, 법률, 광고, 보험, 엔터테인먼트, 교육 등 거의 모든 업계에서 머신러닝을 활용하려고 핵심 프로세스와 비즈니스 모델을 완전히 뒤엎고 있다. 인공지능의 영향력은 향후 10년 동안 크게 확대될 것이다. 다만 경영과 실행, 비즈니스적 상상력에서의 역량 부족이 걸림돌이 되고 있다.

 

다른 신기술들처럼 인공지능도 갖가지 현실성 없는 기대를 낳았다. 머신러닝, 신경망 등 여러 기술 형태를 장황하게 들먹이는 사업계획서 가운데는, 사업과 기술의 실제 능력과의 연관성이 빈약한 경우가 많다. 이를테면 소개팅 주선 사이트가 단순히인공지능을 활용한다고 해서 다른 사이트보다 특별히 더 뛰어나진 않다. 하지만 이런 홍보문구가 사업자금을 조달하는 데는 도움이 될지도 모른다. 이 글에서는 인공지능의 진정한 잠재력과 실제적 영향, 인공지능이라는 기술을 채택하는 데 방해가 되는 요인에 대해 차별화된 설명을 해보려 한다.

 

인공지능 개발, 어디까지 왔나?

인공지능이라는 용어는 1955년 존 매카시John McCarthy다트머스대 수학과 교수가 만들었다. 매카시 교수는 그 다음해 인공지능의 역사에 큰 획을 그은 콘퍼런스를 꾸리기도 했다. 그때부터 인공지능 분야의 멋진 가능성과 장래성이 점점 과하게 부풀려지기 시작했다. 인공지능이라는 단어에서 풍기는 좋은 느낌도 이런 현상에 일조했을 것이다. 1957년 경제학자 허버트 사이먼Herbert Simon, 향후 10년 안에 컴퓨터가 체스에서 인간을 이길 거라고 예측했다. 하지만 실제로는 40년이 걸렸다. 1967년 인지과학자 마빈 민스키Marvin Minsky인공지능을 실현하는 과제는 앞으로 한 세대 안에 상당 부분 해결될 것이라고 말했다. 사이먼과 민스키는 당대 최고의 지성이었지만, 미래를 잘못 짚어도 한참 잘못 짚었다. 그런 면에서 미래 혁신에 대한 과장된 주장이 회의주의와 짝을 이루는 것도 어느 정도 이해가 된다.

 

우선 오늘날 인공지능의 수준과 발전속도부터 살펴보자. 지금까지 가장 큰 진전을 이룬 분야는 크게 지각perception과 인지cognition. 지각 분야에서는 음성 관련 기술이 사실상 가장 많은 진전을 보였다. 음성인식 기술은 완벽해지려면 아직 갈 길이 멀지만, 이미 수백만 명이 이용하고 있다. 애플의 시리, 아마존의 알렉사, 구글의 어시스턴트를 한번 떠올려 보자. 지금 당신이 읽고 있는 이 글도 처음에 컴퓨터 음성인식 기능을 이용해 받아 적었다. 음성인식 정확도가 꽤 높아서 키보드로 입력할 때보다 훨씬 빨리 글을 쓸 수 있다. 제임스 랜데이James Landay스탠퍼드대 컴퓨터과학과 교수 연구진의 연구결과에 따르면, 현재 음성인식을 통한 텍스트 입력 속도는 휴대전화 키보드 입력 속도보다 평균 세 배나 더 빠르다. 과거 8.5%에 달했던 오류율은 4.9%까지 낮아진 상태다. 놀라운 사실은 이처럼 눈부신 기술의 진전이 10년 동안 서서히 이뤄진 게 아니라, 불과 2016년 여름부터 시작됐다는 점이다.

 

이미지인식 기술도 극적으로 개선됐다. 여러분이 페이스북에 친구 사진을 올렸더니, 애플리케이션이 그들의 이름을 태그해 달라고 요청한 적이 있을지도 모르겠다. 거의 모든 야생조류 종을 인식하는 스마트폰 앱도 있다. 이미지 인식이 기업의 본사 직원들의 신분증을 대체하기까지 한다. 자율주행차에 장착되곤 하는 비전 시스템vision systems, 예전에는 오가는 보행자를 인식할 때 30프레임당 한 번꼴로 실수를 했다.(시스템에 내장된 카메라는 초당 30프레임씩 촬영한다.) 하지만 이제는 3000만 프레임당 한 번 미만으로 실수를 한다. 이미지넷ImageNet이라는 대규모 데이터베이스에는 평범하고, 흐릿하고, 기이한 이미지 수백만 장이 저장돼 있다. 여기서 추출한 이미지를 최고성능의 기계로 인식했을 때 오류율은 2010 30%를 웃돌았지만, 2016년에는 약 4%까지 낮아졌다.(‘강아지인가 머핀인가?’ 참조)

1112_47_4
 

기술의 개선 속도는 초대형 신경망, 신경망에 기반한 새로운 접근방식이 도입되면서 지난 몇 년 새 급격히 빨라졌다. 머신러닝을 활용한 비전 시스템은 여전히 허점이 많다. 하지만 강아지 얼굴을 재빨리 인식 못하거나, 심지어 강아지 얼굴이 없는 이미지에서 강아지 얼굴을 찾아내는 민망한 일은 사람도 흔히 저지르는 실수다.

 

커다란 진전을 보인 두 번째 분야는 인지 및 문제해결과 관련돼 있다. 이미 기계가 포커 챔피언과 바둑 고수를 이겼다. 전문가들이 적어도 10년은 지나야 가능하다고 예측한 성과였다. 구글딥마인드Google DeepMind팀은 인간 전문가가 최적화한 데이터센터의 냉각효율을 머신러닝 시스템을 활용해 15% 이상 추가 개선했다. 사이버 보안업체 딥인스팅트Deep Instinct는 지능형 에이전트를 이용해 악성 소프트웨어를 감지하며, 인터넷 결제 시스템 페이팔PayPal은 돈세탁 방지에 활용하고 있다. 싱가포르의 한 보험사는 IBM 기술에 기초한 시스템으로 보험금 청구 프로세스를 자동화했다. 데이터과학 플랫폼업체 루미데이텀Lumidatum의 시스템은 고객지원 서비스 개선에 필요한 조언을 그때그때 제공해 준다. 월스트리트의 기업 수십 군데가 머신러닝을 활용해 어떤 거래를 맺을지 판단하고 있으며, 신용거래를 결정할 때도 점점 머신러닝의 힘을 빌리는 추세다. 아마존은 머신러닝으로 재고를 최적화한 한편, 고객들에게 더 나은 제품 추천 서비스를 제공하고 있다. 마케팅 예측 및 분석업체 인피니트애널리틱스Infinite Analytics는 사용자가 어떤 특정한 광고를 클릭할지 예측하는 머신러닝 시스템을 개발해, 한 글로벌 소비재 기업의 온라인 광고 배치 전략을 개선했다. 브라질의 어느 온라인 소매기업에는 고객의 제품 검색 및 발견 프로세스를 개선하는 머신러닝 시스템을 개발해 줬다. 덕분에 글로벌 소비재 기업은 광고 투자수익이 세 배 증가했고, 브라질 소매기업은 연 수익이 12500만 달러나 늘었다.

 

머신러닝 시스템은 수많은 애플리케이션의 기존 알고리즘을 대체할 뿐만 아니라, 지난날 인간이 제일 잘했던 많은 일들을 인간보다 훌륭히 해내고 있다. 시스템이 완벽해지기까지 시간이 좀 걸리겠지만, 이미지넷 데이터베이스에서 머신러닝 시스템의 오류율은 이미 인간과 비슷하거나 더 낮다. 음성인식 기술은 시끄러운 곳에서도 인간과 거의 흡사하게 기능한다. 기술이 이 정도 수준에 이르면, 일터와 경제를 완전히 뒤바꿀 만한 어마어마한 가능성이 새로 열리게 된다. 어떤 임무가 주어졌을 때 인공지능 기반 시스템이 인간의 수행능력을 넘어서기 시작하면, 시스템이 급속히 확산될 가능성이 훨씬 높아진다. 일례로 드론 제조업체 앱토노미Aptonomy와 로봇기업 샌봇Sanbot은 개선된 비전 시스템을 이용해 경비업무 대부분을 자동화하고 있다. 소프트웨어 업체 어펙티바Affectiva의 경우 소비자그룹의 얼굴에서 기쁨, 놀람, 분노 같은 감정을 읽어내는 데 사용한다. 딥러닝 스타트업 엔리틱Enlitic은 의학 영상정보를 분석해 암 진단을 돕는 데 비전 시스템을 활용하고 있다.

 

모두 대단한 성과다. 하지만 인공지능에 기반한 시스템이 적용되는 범위는 여전히 좁은 편이다. 예컨대 인공지능 시스템은 이미지 수백만 개가 저장된 이미지넷 데이터베이스에서는 놀라운 수행능력을 보이지만 채광 조건, 각도, 이미지 해상도, 사정이 전혀 다른자연 환경에서는 그만큼의 인식률을 보장하기 어렵다. 보다 근본적으로는, 중국어를 알아듣고 영어로 번역해 주는 시스템이 매우 경이롭기는 해도 베이징 시내 맛집을 찾아주기는커녕 특정 한자의 뜻조차 모를 것이다. 어떤 사람이 한 가지 작업을 잘해내면 관련한 다른 일도 어지간히 할거라고 짐작할 수 있다. 반면 머신러닝 시스템은 몇몇 특정한 작업만 수행하도록 훈련받았기 때문에 지식을 일반화할 수가 없다. 컴퓨터의 편협한 지식이 더 넓은 이해를 암시한다고 믿는 오류야말로 인공지능이 진보하는 데 혼란과 과장된 주장을 불러오는 최대 주범인지도 모른다. 다양한 분야에서 일반지능general intelligence을 발휘하는 기계를 개발하는 일은 아직 요원하다.

 

1112_47_6

[1] 입고된 상품을 그대로 보관하는 게 아니라, 분류나 재포장 과정을 거쳐 곧바로 소매점포로 배송하는 물류 시스템을 갖춘 창고

 

 

머신러닝 이해하기

 

머신러닝을 이해하려면 먼저, 머신러닝이 전혀 다른 방식으로 소프트웨어를 개발한다는 점을 알아야 한다. 머신러닝은 특정한 결과를 산출하도록 프로그래밍되지 않고 수많은 사례를 통해 학습한다. 바로 이 부분이 그간의 소프트웨어 개발 관행과 가장 큰 차이점이다. 정보기술 및 응용은 지난 50년간 대부분을 기존 지식과 절차를 체계화해 기계에 탑재하는 데 초점을 맞춰 진보해 왔다. 사실코딩coding은 개발자 머릿속에 있는 지식을 기계가 이해하고 작업을 수행할 수 있는 형태로 바꾸는 고생스러운 과정을 뜻한다. 그런데 이런 접근법에는 본질적인 약점이 하나 있다. 인간의 지식은 대개 암묵적이라서 말로는 완벽히 설명할 수 없다는 점이다. 자전거 타는 법이나 친구 얼굴 알아보는 법을 기술한 설명서를 작성한 뒤, 다른 사람이 이 설명서에만 의지해 자전거를 타고 친구의 얼굴을 인식하도록 만드는 일은 거의 불가능하다.

 

다시 말해 우리는 표현 가능한 범위보다 훨씬 더 많은 지식을 갖고 있다. 이 사실이 몹시 중요해서 지칭하는 용어까지 생겼다. 바로 폴라니의 역설Polanyi’s Paradox이다. 1964년 철학자이자 지식인인 마이클 폴라니Michael Polanyi, 우리가 남에게 설명할 수 있는 영역은 한계가 있을뿐더러, 기계에 지능을 부여하는 인간의 능력에도 근본적인 제약이 있음을 역사적 맥락에서 보여주었다. 폴라니의 역설은 오랫동안 경제에서 기계가 생산적으로 수행할 수 있는 활동범위를 제한해 왔다.

 

머신러닝은 이런 한계를 극복한다. 2차 기계시대의 두 번째 물결에서는 인간이 만든 기계가 사례를 이용해 학습하고, 구조화된 피드백을 통해 폴라니가 예시한 얼굴인식 같은 해묵은 과제를 스스로 해결한다.

 

1112_47_7

각양각색의 머신러닝

 

인공지능과 머신러닝의 종류는 매우 다양하다. 그중 최근 몇 년 동안 가장 성과를 보인 분야는 지도학습 시스템supervised learning system으로, 특정 문제에 관한 여러 개의 정답이 입력되는 머신이다. 이런 프로세스에는 거의 늘 입력값 X 그룹에서 출력값 Y의 그룹으로 매핑하는 작업이 뒤따른다. 예를 들어 여러 동물 사진을 입력값으로 하면 올바른 출력값은 개, 고양이, 말과 같은 동물들의 라벨이 될 것이다. 음성녹음 파형이 입력값이 될 수도 있다. 이런 경우에는’ ‘아니오’ ‘안녕하세요’ ‘잘가요같은 단어들이 출력값이 된다.(‘지도학습 시스템참조)

 

1112_47_5_800

 

성공한 시스템들은 대개 수천 개, 심지어 수백만 개 사례를 훈련 데이터 세트로 활용한다. 각 사례에는 정답 라벨이 붙는다. 그 다음에는 시스템이 자체로 새로운 사례를 찾는다. 훈련이 잘 진행된다면 이 시스템은 상당히 정확하게 정답을 예측할 수 있게 된다.

 

이런 성공을 주도한 알고리즘들은 신경망을 활용한 딥 러닝이라는 접근방식에 기댄다. 딥 러닝 알고리즘은 이전 세대 머신러닝 알고리즘보다 장점이 월등히 많다. 더 큰 데이터 세트를 훨씬 잘 활용할 수 있기 때문이다. 기존 시스템은 훈련용 데이터 사례를 늘릴수록 성능이 강화되지만, 어느 정도가 되면 아무리 사례를 추가해도 시스템의 예측력이 더 이상 향상되지 않았다. 이 분야의 권위자 앤드루 응Andrew Ng에 따르면, 딥 신경망은 이런 정체 없이 데이터를 쌓는 만큼 계속해서 예측력을 높일 수 있다.

 

몇몇 초대형 시스템은 3600만 개 이상의 사례를 활용해 훈련하고 있다. 물론 엄청난 크기의 데이터 세트를 다루려면 더 뛰어난 처리능력이 필요하다. 그런 이유로 초대형 시스템들은 대개 슈퍼컴퓨터나 특수컴퓨터 아키텍처를 이용한다.

 

소비자 행동 관련 데이터를 다수 보유한 상태에서 특정한 결과를 예측하고자 한다면, 지도학습 시스템 적용 여부를 고려해볼 만하다. 아마존 소비자사업부문 CEO 제프 윌크Jeff Wilke, 고객에게 개인맞춤형 상품 추천 서비스를 제공하는 데 썼던 메모리 기반 필터링 알고리즘을 거의 지도학습 시스템으로 바꿨다고 말한다. 재고수준을 결정하고 공급망을 최적화하는 데 활용했던 전통적 알고리즘이, 보다 효율적이고 강력한 머신러닝 기반 시스템으로 대체된 경우도 있다. 미국의 투자전문기관 JP모건체이스는 상업대출 계약심사 시스템을 도입했는데, 그 결과 대출 담당자들이 36만 시간 동안 매달려야 했던 일을 단 몇 초 만에 끝낼 수 있게 됐다. 지도학습 시스템은 피부암 진단에 활용되기도 한다. 응용 사례는 이 밖에도 셀 수 없이 많다.

 

일련의 데이터를 라벨링하고, 이를 활용해 지도학습 기계를 훈련시키는 일은 비교적 간단하다. 지도 머신러닝 시스템이 비지도 머신러닝 시스템보다 아직까지 더 보편적으로 쓰이는 이유다. 비지도학습 시스템Unsupervised learning system은 스스로 학습한다. 뛰어난 비지도 학습자인 우리 인간은, 라벨링 된 데이터를 거의 활용하지 않고도 나무를 인식하는 방법 등 세상의 지식들을 익힌다. 하지만 이런 식으로 작동하는 머신러닝 시스템을 개발하는 일은 매우 어렵다.

 

인간이 강력한 비지도학습 기계를 만드는 법을 배울 수 있고 실제로 배우게 된다면, 흥미진진한 가능성이 눈앞에 펼쳐질 것이다. 이런 기계들은 복잡한 문제를 새로운 시각으로 바라보고 질병 확산, 시장 내 증권가격 변동, 고객의 구매행동 등 미지의 패턴들을 찾도록 도울 수 있다. 이런 가능성 때문에 페이스북 인공지능연구소장이자 뉴욕대 교수 얀 르쿤Yann LeCun, 지도학습 시스템이 케이크에 입힌 설탕이라면 비지도학습 시스템은 케이크 자체라고 비견한다.

 

이 분야에서 작지만 발전하는 또 다른 영역은 강화학습reinforcement learning이다. 이 접근법은 아타리Atari 비디오게임과 바둑 같은 보드게임을 마스터한 시스템에 적용되고 있다. 강화학습은 데이터센터의 전력 사용을 최적화하고 주식시장에서 거래 전략을 개발하는 데 도움을 주기도 한다. 로봇기업 킨드레드Kindred가 개발한 로봇들은 머신러닝을 활용해 처음 본 물체들을 파악하고 분류하는 법을 학습해서, 소비재 물류센터의픽 앤드 플레이스pick and place’작업을 보다 빨리 처리할 수 있게 해 준다. 강화학습 시스템에서는 프로그래머가 시스템의 현재 상태와 목표를 자세히 명시하고, 허용되는 조치들을 목록화하고, 각 조치의 결과를 제한하는 환경 요소들을 알려준다. 시스템은 허용된 조치들을 활용해 목표에 가장 근접할 방법을 알아내야 한다. 이런 시스템은 인간이 목표를 명시하긴 하지만 방법을 정확히 알려줄 필요는 없는 경우에 유용하다. 이를테면 마이크로소프트는 강화학습으로 시스템이 엠에스엔닷컴MSN.com에 올라가는 뉴스의 헤드라인을 직접 고르게 하고, 방문자가 더 많이 클릭하는 기사 링크에 더 높은 점수를 주는보상방식을 적용했다. 시스템은 설계자가 부여한 규칙들을 토대로 최대한 높은 점수를 받으려고 노력했다. 물론 이 말은 인간이 확실하게 보상해 주는 목표를 이루기 위해 강화학습 시스템이 최적화된다는 뜻이며, 그 목표가 고객 생애 가치lifetime customer value처럼 인간이 정말 중요시하는 것과 반드시 일치하지는 않는다. 따라서 목표를 정확하고 구체적으로 명시해야 한다.

 

머신러닝 실전에 투입하기

 

지금 머신러닝을 사용하고 싶은 조직이라면 반가워할 만한 뉴스 세 가지가 있다. 첫째, 인공지능 기술이 급속히 확산되고 있다. 아직 세상에는 데이터 과학자와 머신러닝 전문가가 부족하지만, 온라인 교육자원과 대학이 수요를 충족시켜 주고 있다. 특히 유다시티Udacity,코세라Coursera, 패스트에이아이fast.ai에서는 입문과정보다 심도 있는 강의를 제공 중이다. 재능과 열정이 있는 학생들은 이곳에서 산업용 머신러닝을 배치할 수 있는 수준까지 배울 수 있다. 머신러닝에 관심 있는 기업이라면 자체 인력교육과 더불어 업워크Upwork, 톱코더Topcoder, 캐글Kaggle같은 온라인 인재 플랫폼에서 공인된 머신러닝 외부 전문가를 찾을 수도 있다.

 

둘째, 현대적인 인공지능이 갖춰야 할 알고리즘과 하드웨어는 필요에 따라 사거나 빌릴 수 있다. 구글, 아마존, 마이크로소프트, 세일스포스 등 여러 기업이 클라우드를 통해 강력한 머신러닝 인프라를 제공하고 있다. 업체들이 서로 치열하게 경쟁하고 있기 때문에, 머신러닝을 실험하거나 한번 써보고 싶은 기업들은 점점 더 낮은 가격에 점점 더 강력한 성능을 누릴 수 있게 될 것이다.

 

어쩌면 가장 흥미가 떨어지는 마지막 뉴스는, 머신러닝을 생산적으로 활용하는 데 그렇게 많은 데이터가 필요하지 않을 수도 있다는 사실이다. 대다수 머신러닝 시스템은 투입하는 데이터 양이 늘수록 성능이 좋아지기 때문에, 데이터를 제일 많이 가진 기업이 당연히승리할 거라고 생각할지도 모르겠다. 이때승리광고 타기팅이나 음성인식 같은 단일 애플리케이션의 글로벌 시장 지배를 뜻한다면 그 생각이 옳을 수 있다. 하지만대폭 향상된 성능을 뜻하는 경우라면 승리하는 데 필요한 데이터 양은 깜짝 놀랄 만큼 적을지도 모른다.

 

유다시티의 공동창업자 서배스천 스런Sebastian Thrun, 사내 영업사원들 가운데 고객 문의를 채팅방에서 처리할 때 다른 직원들보다 효율이 월등히 높은 직원이 있다는 사실을 알아챘다. 스런과 대학원생 자이드 에남Zayd Enam은 이들의 채팅방 로그가 기본적으로 라벨링된 훈련 데이터라는 사실을 깨달았다. 지도학습 시스템에 필요한 바로 그 데이터 말이다. 이에 두 사람은 판매실적으로 이어지는 고객과의 상호작용은 성공으로, 그렇지 않은 상호작용은 실패로 라벨링했다. 자이드는 이 데이터를 활용해서 고객들이 자주 묻는 질문에 성공적인 영업사원들이 어떻게 응답할지 예측해 봤다. 그리고 이 예측 결과를 다른 영업사원들과 공유해서 전 직원이 성과를 높일 수 있도록 유도했다. 이런 훈련을 1000번 거친 결과 피훈련자들의 업무효율이 54% 높아졌고, 같은 시간에 두 배나 더 많은 고객을 응대할 수 있게 됐다.

 

인공지능 스타트업 워크퓨전WorkFusion도 비슷한 접근방식을 썼다. 워크퓨전은 해외 청구서 결제, 금융기관 간 대규모 거래 결제 같은 비영업부서의 업무자동화 수준을 높이고 싶은 기업들과 손잡았다. 비영업부서 업무가 여태 자동화되지 못한 이유는, 일이 복잡하고 관련 정보가 일관되지 않아서다. 이를테면 누군가 돈의 액수를 얘기할 때 대체 어떤 통화를 말하는지 알 수 없다. 어느 정도 인간의 해석과 판단이 필요하다는 점도 문제로 꼽힌다. 워크퓨전의 소프트웨어는 사람들이 작업하는 배경을 관찰하고, 이들의 행동을이 청구서는 달러로 표시돼 있다. 이건 엔이다. 이건 유로다…’와 같이 분류하는 인지작업 훈련 데이터로 활용한다. 시스템의 분류 정확도가 믿을 만한 수준에 이르면 업무를 자동화할 수 있게 될 것이다.

 

머신러닝은 과업 및 직업, 비즈니스 프로세스, 비즈니스 모델 등 세 가지 차원에서 변화를 유도하고 있다. 비전 시스템을 활용해 암세포가 될 가능성이 있는 세포를 찾아내는 것은 과업 및 직업 재설계의 한 사례다. 덕분에 여유로워진 방사선 전문의는 중증환자를 집중적으로 치료하고, 환자들과 소통하고, 다른 의사들과 협력할 수 있게 된다.

 

비즈니스 프로세스 재설계 사례로는, 아마존이 머신러닝에 기초한 로봇과 최적화 알고리즘을 도입해 아마존 주문처리센터[2]의 작업 흐름과 레이아웃을 개선한 경우를 들 수 있다. 고객에 맞춰 음악이나 영화를 추천해주는 머신러닝 시스템을 제대로 활용하려면 비즈니스 모델도 달라져야 한다. 소비자가 선택한 곡을 개별 판매하는 방식보다는, 고객이 설령 모르더라도 좋아할 만한 곡을 예측해서 들려주는 개인 맞춤형 방송 구독 방식이 더 나은 비즈니스 모델일지도 모른다.

 

여기서 머신러닝 시스템이 어떤 작업, 프로세스, 혹은 비즈니스 모델 전체를 대체한 사례는 찾기 힘들다는 사실에 주목해야 한다. 대부분의 시스템은 인간의 활동을 보완해 작업의 가치를 높여준다. ‘모든 과업을 기계에 맡겨서분업의 효율을 극대화할 가능성은 거의 없다. 그 대신 어떤 프로세스를 제대로 완수하는 데 10단계를 거쳐야 한다면, 그중 한두 단계는 자동화할 수 있을지 모른다. 그러면 인간은 나머지 단계에서 더 많은 가치를 창출할 수 있게 된다. 한 예로 유다시티의 채팅방 영업지원 시스템은 모든 채팅 대화를 자동화하는 봇bot을 만드는 대신, 인간 영업사원들에게 성과를 높이는 방법을 조언해줬다. 여전히 업무는 인간이 전담하고 있지만, 기계 덕분에 전보다 훨씬 효과적이고 효율적으로 일할 수 있게 된 것이다. 인간의 일을 다 할 수 있는 기계를 설계하기보다 이런 접근방식을 택하는 편이 대체로 실행 가능성이 훨씬 높다. 이렇게 인간 활동의 효율과 업무만족도가 높아지면, 결국 고객에게도 더 많은 도움이 된다.

 

고객의 니즈를 충족시키기 위해 과학기술과 인간의 기술, 자본과 자산의 새로운 조합방식을 설계하고 실행하는 데는 상당한 창의력과 대대적인 계획 수립이 필요하다. 기계는 이런 일을 그리 잘하지 못한다. 따라서 머신러닝의 시대에는 기업가나 업무 관리자가 사회에서 가장 두둑한 보상을 받는 사람이 될 것이다.

 

위험과 한계

 

2차 기계시대의 두 번째 물결은 새로운 위험을 불러온다. 특히 머신러닝 시스템의해석력interpretability은 대체로 낮은 수준에 머물러 있다. 이는 곧 시스템이 어떤 결정을 내리면서 어떤 과정을 거쳤는지 인간이 이해하기 어렵다는 뜻이다. 딥 신경망에는 수억 개의 연결지점이 있으며, 각 연결지점은 최종 결정에 미미하게 기여한다.

 

따라서 머신러닝 시스템이 한 예측은 단순명료하게 설명하기 힘든 면이 있다. 아직까지 기계는 인간과 달리 이야기에 능하지 않다. 다시 말해 입사지원자들 가운데 어떤 사람은 합격시키고 어떤 사람은 불합격시킨 근거를 늘 설명할 수 없다는 얘기다. 인간이 폴라니의 역설을 조금씩 극복하기 시작한 시점에, 기계가 자신이 아는 모든 걸 설명할 수 없다는 반대 버전의 역설과 마주하다니, 참으로 아이러니하다.

 

머신러닝 시스템이 불러오는 위험은 세 가지다. 첫째, 설계자가 의도하지는 않았지만 시스템 훈련용 데이터에서 비롯된 편견이 기계에 숨어들지도 모른다. 예를 들어 어떤 시스템이 과거에 인간 헤드헌터가 내린 일련의 결정을 토대로 입사지원자들의 면접 여부를 정하는 법을 배운다면, 그 시스템은 인종, 젠더, 민족 등에 관한 다양한 편견을 무심코 학습하게 될 수 있다. 게다가 이런 편견은 뚜렷한 규칙으로 드러나기보다는, 고려 대상이 되는 수천 가지 요소의 미묘한 상호작용 안에 박혀 있을 수 있다.

 

둘째, 분명한 논리법칙에 따라 구축된 전통적인 시스템과 달리, 신경망 시스템은 글자 그대로의 진실보다 통계적 진실을 다룬다. 그 결과 시스템이 모든 상황, 특히 훈련 데이터에 포함되지 않은 상황에서도 작동할 거라고 100% 증명하기가 매우 어려워진다. 검증 가능성이 결여되면 핵발전소 제어처럼 임무수행에 핵심적인 애플리케이션을 사용하는 상황이나, 생사를 가르는 결정을 내려야 할 상황에서 우려를 낳을 수 있다.

 

셋째, 머신러닝 시스템은 대체로 오류가 있고, 실제로 오류를 저지른 경우 원인을 정확히 진단하고 바로잡는 일이 어려울 수 있다. 솔루션을 도출하는 기본 구조는 상상 이상으로 복잡할 수 있으며, 오류가 일어난 상황이 시스템이 훈련을 통해 학습한 상황과 다를 경우에는 도출된 솔루션이 최상의 솔루션과 동떨어져 있을지도 모른다.

 

이 같은 위험들이 실재하는 상황에서 적절한 기준점은, 완벽성이 아니라 최적의 대안이어야 한다. 어쨌든 인간도 편견이 있고, 실수를 저지르고, 어떤 결정에 이르게 된 경위를 솔직히 설명하는 데 애를 먹는다. 반면 기계 기반 시스템은 시간이 갈수록 개선되고, 똑같은 데이터가 주어지면 일관된 답을 내놓는다는 장점이 있다.

 

그렇다면 인공지능과 머신러닝이 할 수 있는 일에는 한계가 없을까? 자동차 운전부터 매출 예상, 채용과 승진 여부를 결정하는 일까지, 지각과 인지는 매우 광범위한 영역을 담당한다. 우리는 인공지능이 머지않아 거의 전 분야에서 인간보다 뛰어난 성과를 낼 가능성이 높다고 본다. 그렇다면 인공지능과 머신러닝이 할 수 없는 일은 무엇일까?

 

우리는인공지능은 감정적이고 교묘하고 은밀하고 모순적인 인간을 절대 이해할 수 없을 것이다. 그러기에는 너무 융통성이 없고 비인격적이다라는 말을 자주 듣는다. 나는 이 의견에 동의하지 않는다. 어펙티바 시스템 같은 머신러닝 시스템은 사람들의 말투나 표정을 토대로 감정 상태를 파악하는 능력이 이미 인간만큼, 혹은 인간을 넘어설 만큼 뛰어나다. 또 어떤 시스템은 포커 규칙 중에서도 복잡하기로 이름난 헤즈업 무제한 텍사스 홀덤Heads-up No-Limit Texas Hold’em규칙에 따라 진행되는 시합에서, 세계적인 포커 고수들이 블러핑을 하는 와중에도 상대의 패를 추론할 수 있다. 사람의 마음을 정확히 읽는 일은 미묘한 작업이지만 마술처럼 신비로운 일은 아니다. 다만 지각과 인지를 동원해야 한다. 이 분야에서 머신러닝이 이미 뛰어난 능력을 보여주고 있고, 시간이 지나면 능력은 더 향상될 것이다.

 

[2]고객의 주문 및 재고 처리를 제시간에 안전하게 할 수 있도록 설계된 아마존의 최첨단 물류 센터. 상품 선별, 포장, 배송 등 모든 과정이 고도의 자동화 시스템으로 처리되며 재고는 철저한 보안 아래 보관된다.

 

 

“하지만 컴퓨터는 쓸모가 없다. 오로지 답만 내놓을 수 있기 때문이다라는 파블로 피카소의 말은 인공지능의 한계를 논의하기에 좋은 출발점이다. 최근 머신러닝의 잇따른 승전보가 일러주듯이, 사실 컴퓨터는 전혀 쓸모없지 않다. 하지만 피카소의 의견은 여전히 중요한 통찰을 안겨준다. 컴퓨터는 질문을 던지는 장치가 아니라 질문에 답하는 장치다. 이런 사실은 다음 해결과제나 기회, 새로운 탐구영역을 찾아내는 기업가와 혁신가, 과학자, 창작가들의 역할이 앞으로도 매우 중요하다는 점을 시사한다.

 

마찬가지로 누군가의 정신상태나 의욕을 수동적으로 평가하는 일과, 이를 적극적으로 바꾸는 일 간에는 큰 차이가 있다. 머신러닝 시스템은 전자에는 꽤 유능하지만 후자의 경우는 인간에 상당히 뒤처져 있다. 인간은 매우 사회적인 종이다. 그래서 사람들을 설득하고, 동기와 영감을 부여하기 위해 연민과 긍지, 연대, 수치심 같은 사회적 욕구를 활용하는 일을 기계보다 더 잘해낸다. 2014년 테드 콘퍼런스TED Conference와 엑스프라이즈 재단XPrize Foundation무대에서 관객들에게 기립박수를 받을 정도로 강렬한 테드 토크TED Talk를 하는 최초의 인공지능에 상을 주겠다고 공표했다. 이 상의 주인이 짧은 시일 안에 나타날 것 같지는 않다.

 

우리는 초강력 머신러닝의 시대에 인간의 지성이 쟁취할 수 있는 가장 크고 중요한 기회는 다음 두 가지의 교차점에 있다고 생각한다. 첫째, 해결 과제를 찾아내는 일과 둘째, 솔루션에 대한 합의를 얻기 위해 많은 사람들을 설득하는 일이다. 이 교차점이 제2차 기계시대에 그 중요성이 가중되고 있는 리더십의 정의라고 봐도 무방할 것이다.

 

인간의 일과 기계의 일을 구분하는 관행은 매우 빠르게 무너지고 있다. 이런 관행을 고집하는 기업은 머신러닝을 활용할 수 있는 영역이라면 어디라도 기꺼이 뛰어들거나 뛰어들 수 있는 기업, 머신러닝의 역량과 인간의 역량을 효과적으로 통합해내는 기업과의 경쟁에서 그 어느 때보다 불리한 위치에 처하게 될 것이다.

 

바야흐로 비즈니스의 세계에 기술의 진보로 인한 지각변동의 시기가 도래했다. 증기력과 전기도 그랬지만, 승자와 패자를 가르는 요인은 신기술이나 최고전문가를 얼마나 보유하고 있느냐가 아니다. 오히려 현재 너머 미래를 내다보고, 지금과 완전히 다른 접근방식을 구상할 수 있을 만큼 열린 사고를 하고, 새로운 접근법을 실행에 옮길 수 있을 만큼 영리한 혁신가들이다. 신세대 비즈니스 리더의 등장은 머신러닝이 남긴 위대한 유산 중 하나가 될 것이다.

 

인공지능, 특히 머신러닝은 이 시대 가장 중요한 범용기술이라고 생각한다. 머신러닝이라는 혁신이 비즈니스와 경제에 미치는 영향은, 머신러닝의 직접적인 기여만이 아니라 오늘날 여러 혁신에 가능성과 영감을 주고 있다는 사실에서도 알 수 있다. 더 나은 비전 시스템, 더 나은 음성인식, 더 나은 지능적 문제 해결 등 머신러닝이 제공하는 다양한 역량 덕분에 새로운 제품과 프로세스가 계속 등장하고 있는 것이다.

 

이보다 더 큰 의미를 두는 전문가들도 있다. 도요타 연구소장 길 프랫Gil Pratt, 현재 인공지능 기술의 물결을 생물종의 다양성이 폭발적으로 증가한 5억 년 전 캄브리아기와 비교한다. 그때나 지금이나 새로운 능력의 핵심 중 하나는 시각이다. 시각을 처음 획득한 동물은 주변 환경을 훨씬 효과적으로 탐색할 수 있었다. 그 결과 포식자, 피식자 할 것 없이 생물 종수가 어마어마하게 증가하고, 생태적 지위ecological niche의 범위를 대폭 확장할 수 있었다. 지금 우리는 다양한 신제품과 서비스, 프로세스, 조직 형태의 등장과 소멸을 앞두고 있다. 예기치 않은 성공사례와 기이한 실패사례들이 반드시 나타날 것이다.

 

어느 기업이 새로운 환경을 지배하게 될지 예측하기는 어렵지만 원칙은 분명하다. 가장 민첩하고 적응력이 뛰어난 기업과 경영진이 잘나갈 것이다. 기회를 빠르게 감지하고 반응하는 조직은 인공지능이 열어주는 가능성의 이점을 제대로 활용할 수 있을 것이다. 따라서 재빨리 실험하고 학습하려는 의지가 있어야만 성공할 수 있다. 머신러닝 분야를 실험하는 데 박차를 가하지 않는 관리자는 일을 제대로 안 하는 사람이다. 향후 10년 동안 인공지능이 관리자의 자리를 대체하는 일은 없겠지만, 인공지능을 활용하는 관리자는 활용하지 않는 관리자를 반드시 대체할 것이다.

 

1112_47_7

ARTICLE

 

머신러닝의 폭발적 발전, 무엇이 주도하나?

인공지능의 발전을 가능하게 만든 세 가지 요인이 있다.

에릭 브린욜프슨, 앤드루 맥아피

 

신러닝 시스템은 1950년대부터 있었다. 그런데 이렇게 다양한 분야에서 갑자기 획기적인 변화들이 생기는 이유는 무엇일까? 여기에는 데이터의 급증, 알고리즘의 대폭적인 개선, 컴퓨터 하드웨어의 놀라운 성능 향상이라는 세 가지 요인이 작용한다. 적용 분야에 따라 다르겠지만 지난 20여 년 동안 데이터 가용성은 1000배나 증가하고, 주요 알고리즘은 10~100배 향상되고, 컴퓨터 하드웨어의 속도는 100배 이상 빨라졌다. 토마소 포지오Tomaso Poggio MIT 교수는, 이런 진보 덕에 자율주행차에 장착되는 보행자 감지 비전 시스템 등 다양한 애플리케이션의 성능이 100만 배까지 향상될 수 있었다고 말한다.

 

이제 세 가지 요인을 하나하나 살펴보자.

데이터.지난 수십 년간 음악 CD, 음악 DVD, 웹페이지는 디지털 방식으로 인코딩된 정보량을 전 세계적으로 늘려왔다. 그런데 요 몇 년 새 이 정보가 폭발적으로 증가했다. 스마트폰과 산업장비에 내장된 센서가 보내는 신호, 디지털 사진과 동영상, 지구 곳곳에서 끊임없이 쏟아내는 소셜미디어 콘텐츠, 그 밖의 다양한 출처에서 전례 없이 엄청나게 많은 정보가 생성되고 있다. 오늘날 전 세계 디지털 데이터의 90%가 최근 2년 동안 만들어졌다. 사물인터넷(IoT)이 급성장해 수십억 개의 신규 디바이스와 이들의 데이터 스트림을 서로 연결할 수 있게 되면서, 향후 10년에는 이전보다 훨씬 더 많은 디지털 데이터를 다룰 것이 분명해 보인다.

 

알고리즘.데이터 급증이 중요한 이유는 기존 알고리즘을 좀더 효과적으로 만들어줄 뿐만 아니라, 더 나은 알고리즘의 개발을 촉진, 지원, 가속화하기 때문이다. 지금 딥 지도학습, 강화학습 등의 분야를 지배하고 있는 알고리즘과 접근방식은, 주어진 훈련 데이터 양이 늘수록 결과가 개선된다는 핵심 특성을 기본으로 공유하고 있다. 보통 어떤 알고리즘의 성능은 특정한 시점에 이르면 더 이상 개선되지 않는다. 이후 아무리 데이터를 추가해도 효과가 미미하거나 전혀 없다. 하지만 현재 널리 사용되고 있는 수많은 알고리즘은 아직 그 시점에 다다르지는 않은 듯하다. 한편, 새로운 알고리즘은 학습한 내용을 다른 식으로 계속 응용하면서 더 적은 사례로도 학습할 수 있게 됐다.

 

컴퓨터 하드웨어. 집적회로의 성능이 18~24개월마다 두 배씩 증가한다는 무어의 법칙Moore’s Law, 법칙 발견 50주년인 2015년까지만 해도 건재했다. 최근 일각에서는 무어의 법칙이 물리학의 한계에 반하기 때문에 향후 몇 년 동안 이 증가 속도는 줄어들거라 예상했다. 실제로 표준 마이크로프로세서의 클록 속도clock speed는 제자리걸음이었다. 그런데 우연히 신경망에 그래픽 프로세싱 유닛(GPU)이라는 컴퓨터 칩을 적용하면 연산속도가 상당히 빨라진다는 사실이 밝혀졌다. 사실 신경망에 기존의 CPU 대신 GPU을 사용하면 속도가 10배 증가한다는 점은 그리 대단한 일이 아니다. GPU가 애초에 컴퓨터 게임 같은 애플리케이션의 그래픽 구현 속도를 높이기 위해 개발됐기 때문이다. GPU는 규모의 경제를 제공하고 제품 단가를 낮춰줬으며, 지금은 점점 많은 GPU가 신경망에 적용되고 있다. 신경망 애플리케이션이 점차 일반화되면서, 많은 기업들이 이 애플리케이션에 최적화된 특수 칩을 개발하기 시작했다. 구글의 텐서 프로세싱 유닛(TPU)이 그중 하나다. 구글딥마인드의 공동창업자 셰인 레그Shane Legg, TPU 한 대가 하루에 할 수 있는 훈련을 1990년 출시된 인텔 80486 프로세서가 했다면 25만 년이 걸렸을 거라고 말한다. 다시 말해 TPU 덕분에 정보 처리 속도가 10배 더 개선됐다.

 

이런 개선이 상호 시너지 작용을 일으켰다. 이를테면 성능이 좋아진 하드웨어 덕에 엔지니어들은 더 발전된 알고리즘을 쉽게 테스트하고 개발할 수 있게 됐다. 기계는 적절한 시간 동안 훨씬 많은 데이터를 처리할 수 있게 됐다. 인간의 음성을 뜻을 담은 텍스트로 변환하는 애플리케이션처럼, 오늘날 개발 중인 몇몇 애플리케이션은 1990년대식 하드웨어에서 돌린다면 말 그대로 수백 년이 걸렸을 것이다. 기술적 성취 덕분에 더 많은 연구 인재들이 이 분야에 뛰어들고 더 많은 투자자와 경영진이 추가 연구에 자금을 대고 있다.

 

이와 같은 시너지 효과를 증폭시키는 데 기여한 기술이 두 가지 더 있다. 바로 글로벌 네트워킹과 클라우드다. 모바일 인터넷 덕분에 사실상 지구상 어디에서도 디지털 기술을 이용할 수 있게 되면서, 수십억 명의 잠재고객이 중대한 인공지능 혁신에 연결될 수 있게 됐다. 현재 많은 스마트폰이 제공하는 인공지능 비서 기능, 대기업들이 전 세계적으로 공유하고 있는 디지털 지식 기반, 똑똑한 개인들이 주요 사용자이자 기여자인 위키피디아와 캐글Kaggle같은 크라우드 소싱 시스템을 한번 떠올려보자.

 

아마도 학습과 확산을 가속할 수 있는 클라우드 기반 인공지능과 로봇 공학의 잠재력이 무엇보다 중요할 것이다. 물체 인식 같은 특정한 작업을 학습하기 위해 애쓰고 있는 로봇을 한번 생각해 보자. 이 로봇이 작업을 완전히 익히면, 호환이 가능한 지식 표현 시스템을 사용하는 다른 로봇들과 그 지식을 공유하기 위해 클라우드에 업로드할 것이다. 미국 리싱크 로보틱스Rethink Robotics가 바로 그런 플랫폼을 개발 중이다. 이 방식을 통하면 각자 일하는 로봇들이 수백, 수천, 수백만 개의 눈과 귀로 생성한 데이터를 효과적으로 수집할 수 있게 된다. 이 정보를 단일 시스템에 통합시키면 로봇들은 더 많은 정보를 훨씬 빨리 습득하고, 그렇게 얻은 통찰을 거의 즉시 다른 로봇들과 공유할 수 있게 된다.

 

 

 

 

THE AUTHORs

에릭 브린욜프슨과 앤드루 맥아피

 

에릭 브린욜프슨Erik Brynjolfsson(@erikbryn) MIT 디지털 이코노미 이니셔티브 소장이자 MIT 슬론경영대학원 경영과학 교수다. 또한 전미경제연구소(NBER) 연구원으로 정보기술이 비즈니스 전략, 생산성과 성과, 디지털 상거래, 무형자산에 미치는 영향을 주로 연구한다. MIT에서는 정보경제학과 애널리틱스 랩 관련 강의를 맡고 있다.

 

IT의 생산성 기여와 조직자본 및 기타 무형자산의 상보적 역할을 평가한 초기 연구자 중 한 명인 브린욜프슨은, 연구를 통해롱 테일로 알려진 온라인 제품 다양성의 가치를 최초로 수량화했다. 정보재의 가격책정 모델 및 번들링 모델을 개발하기도 했다. 하버드대에서 응용수학 및 의사결정 과학을 전공해 문학사와 이학석사 학위를 땄고, 슬론경영대학원에서 관리경제학 박사학위를 받았다.

 

책도 여러 권 썼다. 앤드루 맥아피와는 <Machine, Platform, Crowd: Harnessing Our Digital Future>(2017)와 뉴욕타임스 베스트셀러 <2의 기계시대: 인간과 기계의 공생이 시작된다>(2014)를 공저했다.

 

MIT 책임연구원 앤드루 맥아피Andrew Mcafee(@amcafee)는 디지털 기술이 비즈니스, 경제, 사회를 어떻게 바꾸는지를 연구한다. 저서는 에릭 브린욜프슨과 함께 펴낸 <Machine, Platform, Crowd: Harnessing Our Digital Future> <2의 기계시대: 인간과 기계의 공생이 시작된다>가 있다. 이 중 <2의 기계시대>는 뉴욕타임스 베스트셀러는 물론 파이낸셜타임스/맥킨지 선정올해의 경영서상최종후보에 올랐다. 맥아피는 여러 편의 학술논문을 발표하고, 파이낸셜타임스의 블로그를 운영하며, HBR, 이코노미스트, 월스트리트저널, 뉴욕타임스 등 여러 매체에 글을 기고하고 있다.

토크쇼찰리 로즈’, 시사프로그램 ‘60’, 다보스에서 열린 TED, 아스펜 아이디어 페스티벌 등에서 자신의 연구를 소개한 바 있으며, 그 밖에 다양한 곳에서 강연 활동을 펼치고 있다.

 

하버드대와 MIT에서 학위를 받았고, MIT 디지털 이코노미 이니셔티브를 공동 창립했다.

 

 

1112_47_8

ARTICLE

 

인공지능이 (아직은) 이 글을 쓸 수 없는 이유

기계는 그 어느 때보다 빨리 학습하고 더 진보했지만 여전히 한계가 있다.

월터 프릭

 

직 교수 출신 연구원 로저 섕크Roger Schank는 인공지능이 추구할 참신한 목표를 제안한 적이 있다. 컴퓨터가 영화 <웨스트사이드 스토리>를 보고 거기서 로미오와 줄리엣의 플롯을 인식할 수 있어야 한다는 목표였다. 섕크와 제자들은 이 이야기들이 지능, 추론, 의미의 관점에서 중요하다고 믿었다. 그런데 섕크의 기준에서 볼 때 오늘날의 인공지능은 전혀 지능적이지 않다.

 

HBR.org가 이번에 게재한 특집기사는 아이러니하게도 컴퓨터가 아직 할 수 없는 일들의 사례를 보여주고 있다. 두 명의 전문가가 특정 의제를 구체화하고, 증거를 모으고, 서술방식을 구축해온 지난 수십 년간의 경험을 토대로 이 글을 썼다. 그리고 세 명의 편집자가 5000단어 가까이 되는 원고를 다듬어 탈고했다.

 

소프트웨어가 아직은 이렇게 길고 복잡한 글을 못쓴다는 사실이 인공지능의 패배를 뜻하는 건 아니다. 대변혁을 불러오지 못할 거라는 증거도 될 수 없다. 하지만 이 사실은 머신러닝 기술이 정확이 어떻게 작동하며, 현재 이 기술로 가능한 것과 불가능한 것은 무엇이며, 이 기술이 향후 작문의 도구로서, 혹은 작가로서 어떤 식으로 발전할 것인지를 이해할 수 있게 해준다.

 

긴 글을 쓰기에는 아직 역부족이다

오늘날 인공지능은 주어진 과제를 예측 문제로 조직화한 다음, 통계적 기술과 대량 데이터를 활용해 예측을 내놓는다. 텍스트 기반 예측의 간단한 예로 자동 완성 기능을 들 수 있다. 내가 문자 입력창에그 일은이라고 입력하면 스마트폰은 데이터와 통계적 모델링을 활용해 다음에 나올 단어를 예측한다. 그리고어떻게’ ‘’ ‘언제를 옵션으로 제시한다. 내가 염두에 두었던 옵션어떻게를 선택하면 스마트폰은 그 다음 단어를 예측한다. 이번에는 내가됐어’라는 단어를 고를 걸 100% 확신하고(실제로도 그럴 참이었다) 다른 옵션은 제시하지도 않고 그 다음 단어를 예측하기 시작한다. 이처럼 머신러닝이 예측 문제를 처리하는 활동을 지도학습이라고 한다. 정답을 비롯한 어떤 데이터 집합을 입력하면, 알고리즘은 패턴을 인식하는 방법을 학습한다. 이 경우에는 다량의 완성된 문자 메시지를 입력하면 알고리즘이그 일은뒤에어떻게가 자주 따라붙는다는 패턴을 배우는 것이다.(머신러닝의 또 다른 종류인 비지도학습은 전혀 다른 방식으로 학습한다. 하지만 최근 이 분야의 진보는 대부분 지도학습이 주도했다.)

 

잡지의 특집기사를 작성하는 과정을 예측 문제로 정제하는 일은 결코 쉽지 않다. 아직까지는 그렇다. 샘 보우먼Sam Bowman뉴욕대 교수는 얼마 전 인공지능과 저널리즘을 주제로 열린 콘퍼런스에서대단히 명료한 저널리스트적 글쓰기journalist-specified템플릿 없이 논리 정연한 긴 텍스트를 생성하겠다는 발상이 실현되려면 아직 갈 길이 멀다라고 말했다. 물론 상황을 명확히 설정한 경우에는 머신러닝이 응집력 있는 텍스트를 생성할 수 있다는 사실을 연구자들이 보여주었다고 덧붙였지만, “추상적인 아이디어나 일련의 사실을 장문의 일관된 텍스트로 변환시킬 수 있는 시스템을 구축하는 일은 아직까지 어렵다.”

 

얼마나 어려운 일인지 보여주기 위해 보우먼은 지난해 머신러닝을 이용해 쓴 영화 대본 <선스프링Sunspring>을 언급했다.

<선스프링> SF 영화 대본 수십 편을 머신러닝 알고리즘의 하나인 신경망에 입력해 캐릭터 수준에서 작성된 것이다. 이 말인즉 등장인물 한 명 한 명을 다룬 텍스트가 알고리즘이 학습한 데이터 단위라는 뜻이다. 알고리즘은 이전에 등장한 인물들을 토대로 다음에 어떤 인물이 등장할지 예측하는 법을 학습했다.

 

1112_47_10

위 이미지 클릭 시 유튜브로 넘어갑니다.

 

그 결과물이 바로 앞 페이지의 영상이다. 반드시 유튜브에서 찾아보기를 권한다.

 

<선스프링>을 연기한 배우들의 영상을 보면, 비록 앞뒤는 안 맞더라도 실제 영어 단어를 발화하고 있다는 사실 자체에 감탄을 금할 수 없다. 대본들을읽기전에는 신경망이 영화 대본을 쓰는 법은 고사하고 영어에 대한 지식조차 없었기 때문이다. 신경망은 각 등장인물에게 대사를 배정하고 무대 지시를 포함해야 한다는 대본의 몇 가지 특징들을 학습했다. 다시 말하지만 신경망은 몇십 편의 영화 대본을 읽은 뒤에 이런 정보를 습득했다.

 

그러나 신경망은 이 대본들에서 내러티브 기술은 배우지 못했다. <선스프링>에는 이야기가 없다. 등장인물은 주어진 대사를 읊기 위해 존재할 뿐이다. 이 대본은 머신러닝이 스토리텔링에 통달하기까지, 혹은지능화되기까지 아직도 갈 길이 멀다는 사실을 보여준다. 하지만 알고리즘의 문장 구성 능력과 영화 대본의 특성을 인식하는 능력은 인공지능이 작문의 미래에 어떤 역할을 할 수 있다는 가능성을 시사한다. 그래도 가까운 미래에는 여전히 제약이 많을 것이다.

 



인공지능 생성 요약

 

머신러닝이 쓸 만한 진전을 보인 작문 분야는 요약이다. 어떤 텍스트에서 가장 중요한 부분을 찾아내 요약문을 만드는 작업은 매우 보편적인 작문 작업이다. 언론담당 부서는 그날의 뉴스를짧은 기사로 편집하고, 기자는 과거 진행상황을 요약하면서 새로운 기사를 작성하고, 싱크탱크는 새로운 연구 결과를 요약하고, 출판편집자는 한 챕터를 요약한다. 이런 작업 중 일부는 이제 기계가 대신할 수 있다. 스타트업과 기술 기업들이 요약 기능을 보다 쉽게 이용할 수 있는 툴과 제품을 앞다퉈 개발 중이다.

 

자동 요약 기술은 대개 추출extractive요약과 생성abstractive 요약으로 나뉜다. 추출 요약은 문서 안에서 가장 중요한 문장들을 파악한 다음, 그 문장을 뽑아 엮어 요약문을 만든다. 이 기술의 최신 버전은 상당히 복잡하지만, 1958년 한스 피터 룬Hans Peter Luhn IBM에 도입한 초기 아이디어를 보면 메커니즘을 이해하는 데 도움이 된다. 룬은 어떤 문서에서 ‘the’ 같은 관사와 ‘and’ 같은 접속사를 제외하고 가장 자주 사용되는 단어가 그 문서의 주제를 알려주는 단서라고 생각했다. 따라서 사용빈도가 높은 단어들이 포함된 문장이 이 문서를 대표한다고 봤다. 이런 문장을 추출해서 한 문단으로 엮으면 요약문 비슷한 텍스트가 생성된다.(여기서 나는 룬의 초기 아이디어를 지나치게 단순하게 설명했다. 컬럼비아대 캐시 맥키온Kathy McKeown교수와 펜실베이니아대 아니 넨코바Ani Nenkova 교수가 쓴을 참조하면 이 분야의 훌륭한 역사를 보다 자세히 알 수 있다.)

 

반면 생성 요약은 하나 이상의 문서에 있는 정보를 알고리즘이 자기 나름대로 설명하는 방식이다. 이 접근법은 훨씬 야심적이지만 최근까지도 제대로 된 성과를 내지 못했다. <선스프링> 대본이 보여주듯이 새로운 말을 생성하는 일은 매우 어렵다. 하지만 머신러닝의 한 분야인 딥 러닝이 진전을 보이면서 생성 요약에 대한 관심이 다시 높아지고 있으며, 몇몇 희망적인 성과도 있었다.

 

머신러닝이 할 수 있는 일과 할 수 없는 일을 설명하기 위해 HBR의 인공지능 관련 특집기사를 편집자 요약 버전, 추출 요약 버전, 생성 요약 버전으로 한 번 비교해 보자.(‘인간 편집자의 요약, 추출 요약, 생성 요약참조)

 

 

인간 편집자의 요약, 추출 요약, 생성 요약

이번 호 빅아이디어 기사인공지능 파헤치기를 다음 세 가지 방법으로 요약했다.

에릭 브린욜프슨, 앤드루 맥아피

 

인간 편집자의 요약

 

내연기관 같은 범용기술이 지난 250년 동안 경제성장의 원동력으로 작용해 왔다. 인공지능, 특히 머신러닝은 이 시대에 가장 중요한 범용기술이다. 향후 10년 동안 사실상 거의 모든 업계가 머신러닝을 활용하기 위해 주요 프로세스와 비즈니스 모델을 완전히 뒤바꿀 것이다. 하지만 인공지능에 대한 모든 기대가 실현될 수는 없다. 이 글의 두 저자는 인공지능의 진정한 잠재능력, 인공지능이 미칠 실질적인 영향, 인공지능의 적용을 방해하는 장애 요인에 대해 설명한다.

 

저자들은 오늘날 머신러닝을 활용하려는 조직에 세 가지 희소식을 들려준다.

첫째, 인공지능 기술은 온라인 교육자원과 대학을 통해 빠르게 확산되고 있다.

둘째, 현대적인 인공지능을 구현하기 위해 필요한 알고리즘과 하드웨어는 사거나 빌릴 수 있다. 셋째, 기업들은 그리 많지 않은 데이터로도 머신러닝을 생산적으로 활용할 수 있다.

 

이와 함께 위험 요인 세 가지도 지적한다. 첫째, 기계에 훈련용 데이터에서 습득한 편견이 숨어 있을 가능성이 있다.

둘째, 신경망은 글자 그대로의 진실보다 통계적 진실을 다룬다. 셋째, 시스템 오류를 진단하고 교정하는 일은 대체로 어렵다. 어떤 솔루션의 기본 구조가 상상 이상으로 복잡할 수 있기 때문이다.

 

추출 요약

 

그중에서도 증기기관, 전기, 내연기관처럼 경제학에서 범용기술이라고 부르는 기술의 혁신이 가장 중요하다. 월마트, UPS, 우버 등 다양한 분야의 기업들은 이런 기술을 활용해 수익성 있는 신규 사업 모델을 구상할 수 있었다. 이 시대에 가장 중요한 범용기술은 인공지능, 그중에서도 특히 머신러닝이다. 머신러닝은 인간이 주어진 임무를 완수할 방법을 꼭 일러주지 않아도, 기계가 알아서 꾸준히 성능을 개선하는 능력을 말한다. 조만간 인공지능은 지난날의 범용기술만큼이나 혁신적인 영향을 여러 업계에 끼칠 것으로 보인다. 이미 전 세계 수천 개 기업에서 인공지능을 이용하고 있지만, 큰 기회들은 대부분 아직 제대로 활용되지 않았다. 인공지능 개발, 어디까지 왔나? 인공지능이라는 용어는 존 맥카시 다트머스대 수학과 교수가 1955년에 고안했다. 당시 맥카시 교수는 이듬해 인공지능과 관련해 열리는 중대한 콘퍼런스를 꾸리고 있었다. 컴퓨터의 편협한 지식이 더 넓은 이해를 암시한다고 믿는 오류야말로 인공지능이 진보하는 데 혼란과 과장된 주장을 불러일으키는 최대 주범인지도 모른다.

— 패스트 포워드 랩스

 

생성 요약

 

월마트, UPS, 우버 등 다양한 분야의 기업들은 이런 기술을 활용해 수익성 있는 신규 사업 모델을 구상할 수 있었다. 조만간 인공지능은 지난날의 범용기술만큼이나 혁신적인 영향을 여러 업계에 끼칠 것으로 보인다. 지난 몇 년 새 머신러닝의 효율성과 가용성이 크게 향상됐다.

— 알렉산더 러시 

 

 

 

 

 

 

첫 번째 버전은 HBR 편집자가 썼다. 문법에 오류가 없고 기사의 요점을 잘 담았으며, 3인칭으로 서술했다.

 

두 번째 버전은 리서치업체 패스트 포워드 랩스Fast Forward Labs가 개발한 프로토타입을 이용해 생성한 추출 요약extractive summary이다. 패스트 포워드 랩스는 실제 기사와 어느 웹사이트에서 제시한 추천 도서들을 요약한 글을 활용해, 최종 요약본에 포함될 가능성이 높은 문장에 높은 점수를 주도록 신경망을 훈련시켰다. 그리고 최고점을 받은 문장과 실제 기사에 해당 문장이 나온 순서를 조합해 요약문을 생성했다. HBR 기사를 요약할 때 이 모델이 최고점을 준 문장은 첫머리에 나오는이 시대 가장 중요한 범용기술은 인공지능이다, 이 글의 논지를 설명한다고 할 수 있다.

그런 면에서 추출 요약기는 좋은 요약문을 생성했다. 그러나 상위 일곱 문장이 HBR 기사에 등장한 순서대로 나열되면서, 첫 문장에 포함된 대명사가 무엇을 명시하는지 언급하지 않았다.(이런 시스템에게 특정 대명사가 가리키는 명사를 인식하도록 훈련시키는 일은 매우 까다로우며, 패스트 포워드 랩스의 프로토타입은 그 시도를 하지 않았다.)

 

세 번째 버전은 하버드대 알렉산더 러시Alexander Rush공과대 교수가 제공한 생성 요약abstractive summary이다. 러시는 CNN 기사를 세 문장으로 요약하는 방법을 시스템에 훈련시켰다. 그는 이 시스템이 아직 다 개발되지 않았다고 강조했지만 실험 삼아 HBR 기사의 첫 450단어를 요약해 보기로 했다. “이론적으로 말하자면 이 시스템은 추상적입니다.” 러시의 말이다. “그래서 시스템이 원하는 대로 문장을 생성할 수 있죠. 하지만 실제로는 본래 기사에 있던 문장을 대부분 가져온 듯 보입니다.”

다시 말해 이 시스템은 독창성을 희생하는 대신 <선스프링> 대본처럼 무의미한 문장을 되도록 피하려고 한다는 것이다. 추출 요약과 마찬가지로 생성 요약도 HBR 기사의 주요 주제는 잘 뽑아냈지만, ‘이런 기술이라는 표현을 쓰면서이런이 무엇을 의미하는지는 설명하지 않았다.

 

두 번째와 세 번째 요약본이 인간이 작성한 요약본을 대체할 만큼 완성도가 있을까? 아마 아닐 것이다. 하지만 여기서는 질문 자체가 틀렸다. 인공지능이 작성한 1차 초안이 인간의 요약 속도를 높여줄 수 있는지 없는지를 묻는 게 훨씬 낫다. 그리고 그 답은그렇다일 확률이 상당히 높다.

 

리서치 보조로서 인공지능

 

요약은 작문 과정을 변화시키기에는 너무 폭이 좁은 작업일지도 모른다. 그러나 다른 관련 기술과 결합된다면, 작문 과정에서 매우 중요한 리서치 업무에 인공지능이 기여할 만한 기회가 열린다. 틈새 기술과 과학 분야를 다루는 잡지 싱귤래리티허브SingularityHUB의 데이비드 힐David Hill편집장은 리서치가작가들이 가장 어려워하는 부분이라고 말한다.

 

인공지능 기반 검색 알고리즘을 사용하는 구글은 이미 리서치 프로세스를 크게 바꿔서 작가들의 생산성을 높여줬다. 하지만 구글이 완벽한 리서치 보조는 아니다. 데이비드 힐은 구글 검색이깊이가 없고’ ‘부산스럽다고 표현한다. 복스닷컴Vox.com의 편집자 수재너 로크Susannah Locke모든 검색을 우리가 해야 하기 때문에 지독하게 힘들다라고 말한다. 로크는나 대신 이런 일을 해 줄 수 있는 게 있지 않을까?”라고 생각했다고 한다. IT 매체 아스테크니카ArsTechnica의 팀 리Tim Lee는 자신의마구잡이식읽기 과정을 이렇게 설명했다. “어떤 주제에 관한 논문을 10~15건 정도 찾아서 읽은 다음 메모를 합니다.” 리는 주제와 관련된 자료 1000쪽을 찾아내고 그중 우선 읽어볼 만한 자료 10쪽 정도만 알려주는 툴이 있으면 좋겠다고 말한다.

 

당장 활용할 수 있는 툴이 리서치 과정을 완전히 자동화하지는 못해도, 보다 체계적이고 효율적으로 리서치를 할 수 있게 해준다. 톰슨 로이터 랩Thomson Reuters labs의 데이터 과학자 브라이언 울리크니Brian Ulicny는 이렇게 말한다. “왜 뉴스사이트에서 누군가의 이름을 클릭하면 바로 인물 소개 정보를 보여주지 않는지 모르겠습니다.”(참고로 울리크니의 아내는 내 직장동료다.) 2006년 포털사이트 라이코스Lycos에서 일할 당시 울리크니는 자신의 논문에서정보 융합 엔진information fusion engine에 대해 서술한 바 있다. 정보 융합 엔진은 구글처럼 어떤 이름이나 주제를 입력하면 링크 사이트 목록을 보여주는 대신에, 웹상에 존재하는 콘텐츠를 여러 문단으로 정리해서조리 있는 요약 보고서나 배경 설명을 제공하는 시스템을 말한다. 울리크니는 이를위키피디아 글의 1차 초안과 비슷한 수준의 결과물이라고 설명한다.

 

특정 주제나 뉴스의 개요를 자동으로 생성해 주는 소프트웨어를 제안한 사람은 울리크니만이 아니다. 컴퓨터 과학자들은 15년 넘게 비슷한 시스템을 개발하고 관련 논문을 발표해 왔다. 이런 프로젝트는 기술적으로 복잡하고, 중요한 지점에서 제각기 다르다. 하지만 다 같은 도전과제를 마주하고 있고 유사한 프로세스를 따른다.

 

데이터 과학자이자 패스트 포워드 랩스의 창립자 힐러리 메이슨은, 이 시스템이 해야 할 주요 임무의 개요를 설명해 준다. 첫째, 소스 데이터를 파악해야 한다. 소스 데이터란 뉴스 기사 같은 텍스트 문서를 뜻한다. 그 다음 이들 문서에서 가장 중요한 정보를 파악해 추출해야 한다. 마지막으로 추출한 정보를 최종 사용자에게 제시해야 한다. 많은 시스템이 이런 과정을 거치는 동안, 어느 한 시점에서 추가 단계를 하나 더 거친다. 바로 이야기 구조를 파악하려는 활동이다. 독립된 사건들을 시간순으로 늘어놓은 이야기인가? 어떤 인물의 전기인가? 시스템은 구조를 파악해서 무엇이 중요한 정보인지 결정하고, 최종 사용자에게 제시할 결과물의 윤곽을 만들어낼 수 있다.

 

이런 프로세스는 인간이 간단하게나마 리서치를 하고 글을 쓸 때 취하는 접근법과 닮아 있다. 블룸버그Bloomberg의 해설기사 섹션 퀵테이크QuickTake의 편집자 존 오닐John O’Neil, 예전에 뉴욕타임스 토픽 페이지를 담당한 적이 있다. 오닐은 (이후 구성 방식이 바뀌었지만) 토픽 페이지에 실을 텍스트를 작성할 때 어떤 프로세스틀 거치는지 설명해줬다. 첫째, 해당 주제와 관련된 뉴욕타임스 기사 중 핵심적인 네다섯 꼭지를 찾는다. 둘째, 뉴스 대신 각 이야기의 배경을 설명한 문단을 찾는다. 셋째, 배경 설명 정보를 결합해 요약문을 작성한다. 적어도 토픽 페이지 글을 작성할 때만큼은 인간과 소프트웨어가 똑같은 과정을 따르고 있다.

 



인공지능과 작문의 미래

 

글을 요약해 주는 툴이 불완전하게나마 몇 년 전부터 존재했다면 왜 아직까지 작문에 큰 영향을 미치지 못했을까? 다른 많은 혁신적인 기술처럼 문화가 그 한 원인이다. 한편으로는 작가들이 이런 툴의 필요성을 느끼지 못하고 있다. 또 한편으로는 컴퓨터 과학자들이 자신들의 연구 결과를 사람들이 실제로 어떻게 활용하는지 그다지 신경 쓰지 않는다. 자동 완성 기능을 개발할 당시에도 정확성을 높이는 데만 중점을 두었지, 이 기술을 사람들이 실제로 사용하는 툴에 어떻게 장착할지는 고려하지 않았다고 넨코바는 말한다.

 

자금 문제도 요인으로 작용한다. 이런 툴을 살 만한 재정 여유가 있는 작가나 뉴스룸은 그리 많지 않다. “자연어 처리 분야에서 이룬 대부분의 진보는 증권분석가와 정부가 외신을 모니터링하는 데 관심을 뒀기 때문에 가능했습니다.” 넨코바의 말이다. 넨코바도 미 국방부 방위고등연구계획국(DARPA)의 지원을 받아 박사학위를 받았다. 금융 역시 머신러닝과 자연어 처리의 영향을 받아 온 분야 중 하나다. 재정 지원이 뒷받침됐기에 가능한 진보였다.

 

이런 툴이 작문에 더 많은 영향을 미치지 못한 마지막 이유는, 그저 독자들을 계속 만족시킬 만큼 결과물이 좋지 않았기 때문이다. 울리크니는 논문에서 은퇴한 하키 선수 마리오 르뮤Mario Lemieux의 인물 소개 정보를 자동 생성하는 툴에 대해 설명했다. 이 시스템은게임’ ‘시즌’ ‘피츠버그 펭귄스등 소개 내용에 반드시 들어가야 할 핵심 하위 주제들을 인식했다. 그리고 어찌 보면 관련이 있는 듯도 하지만, 하키 선수의 이력을 서술하는 작가라면 쓸 가능성이 없는얼음이라는 주제도 더했다.

 

이런 상황은 모두 변하고 있다. 기술은 점점 개선되고, 사용성도 강화되는 중이다. 점차 더 많은 작가와 미디어 기업이 스마트 소프트웨어의 효용을 인식하기 시작했다. 머신러닝이 빠른 시일 안에 다양한 유형의 작문 프로세스에서 활용되리라는 사실은 분명해 보이지만, 완결된 기사를 생성할 수 있는 단계까지는 이르지 못 할 듯하다. 다만 저널리스트가 기사를 보다 효율적으로 생산할 수 있도록 보조 역할을 할 것이다.

 

많은 이들이 이런 일을 가능하게 할 툴을 개발하려 애쓰고 있다. 데이비드 힐은 오픈소스 리서치 지원 소프트웨어를 개발하기 위해 연구보조금을 받았다. 보스턴에 근거지를 둔 신생 스타트업 프레이즈Frase도 유사한 프로젝트를 진행 중이다. 다만 프레이즈 창업자들은 콘텐츠 마케터들을 초기 고객으로 확보하는 것을 목표로 삼았다. 구글닥스Google Docs는 진작부터 이런 툴을 제공해 왔지만 활용은 제한적이다.

 

복스Vox는 작가들이 새로운 글을 쓸 때 인용할 만한 지난 글을 보여주는 슬랙Slack이라는 봇을 개발했다. IBM 왓슨은 새로운 이야기들을 요약하고, 타임라인을 생성하고, 주요 인용구에 강조 표시를 해주는 왓슨 앵글스Watson Angles라는 프로토타입을 개발했다. 지난가을 웹에서 삭제된 이 프로토타입에는, 정보 공유 사이트 레딧Reddit의 사용자들이 특정 뉴스 기사에 보인 긍정적인 반응과 부정적인 반응을 감성 분석sentiment analysis한 결과 등 주요 메타데이터도 포함돼 있었다.

 

이 프로젝트들은 단지 시작일 뿐이다. 얼마 전 런던에서 있었던 화재 사고를 다룬 뉴스 기사에서, 화재가 일어난 건물에 사는 친구가 한 시간 전에 자신은 안전하다는 글을 게시했다는 사실까지 언급한다면? 독자의 배경지식 수준에 따라 텍스트가 난이도를 알아서 조절해 준다면? 워드 프로세서에 팩트 체크 기능이 탑재된다면? 관심 있는 독자가 적어서 출판사가 다루기에는 역부족인 틈새 주제를 다루는 토픽 페이지가 있다면? 아니면 100년 전에 작성된 관련기사를 마치 지난주에 나온 기사처럼 빨리 가져올 수 있는 리서치 보조가 있다면?

 

알고리즘은 아직 인간처럼 정교하게 이야기를 구축할 수 없다. 제대로 된 영화 대본을 쓰거나 섕크의 로미오와 줄리엣 테스트를 통과할 수 없다. 알고리즘은 보통 인과관계를 추론할 수 없다. 감동을 주는 산문을 쓸 수도, 공직자에게 어떤 중요한 정책에 대해 공식 입장을 발표해 달라고 설득할 수도 없다. 하지만 할 수 있는 일도 많다. 인공지능이 멋진 이야기를 할 수는 없지만, 우리가 이야기를 더 잘 하도록 도울 수는 있다.

 

번역: 장효선 / 에디팅: 조영주

월터 프릭(Walter Frick) HBR 선임 편집자다. 2016년 하버드대 니먼 펠로십으로 선정돼 머신러닝이 해설 저널리즘에 미칠 영향을 연구했다.

  • 아티클 다운로드
    (PDF)
    5,000원

    담기바로구매

  • 2017년 11-12월(합본호)
    25,000원
    22,500원

    구매하기

  • 디지털서비스
    1년 150,000원

    디지털서비스란

    신청하기

전략 다른 아티클

무료 열람 가능 아티클 수 0/1 회원가입 | 서비스상품안내