2019
1-2월호

데이터과학 그리고 설득의 기술
스콧 베리나토(Scott Berinato)

 

FEATURE ANALYTICS

데이터과학 그리고 설득의 기술

스콧 베리나토

 

 

 

 

 

 

Idea in Brief

문제 

기업들은 애널리틱스 붐analytics boom에 부응해 가능한 한 최고의 데이터과학 전문가를 고용하지만 데이터과학 관련 시도의 대부분은 애초 기대한 만큼의 성과를 내지 못하고 있다.

 

원인

애널리틱스 프로젝트가 성과로 이어지려면 먼저 프로젝트팀의 좋은 질문과 데이터 랭글링, 인사이트 도출이 필요하다. 다음으로 인사이트가 회사에 도움이 될지 파악하고 이를 두고 커뮤니케이션하는 과정이 뒤따라야 한다. 두 가지 모두 가능한 경우는 희박하다. 전자를 훈련받은 데이터과학 전문가는 많아도 후자는 드물다.

 

해법

좋은 데이터과학팀은 6가지 재능을 확보하고 있다. 프로젝트 관리, 데이터 랭글링, 데이터 분석, 분야 전문성, 디자인, 스토리텔링이다. 이렇게 조합하면 애널리틱스에서 목표했던 성과를 이룰 수 있다.

 

 

 

데이터과학 분야가 급성장하고 있다. 많은 기업이 지난 5년 동안 수십억 달러를 들여 가장 우수한 데이터과학 전문가를 영입해 신사업을 시작하고, 제타바이트에 달하는 자료를 축적하고 분석 프로그램을 돌려 무수한 잡음 속에서 의미 있는 신호를 걸러낸다. 몇몇 분야에서는 성과를 거뒀다. 번역, 소매유통, 헬스케어, 농구 같은 분야에서 데이터는 기존 질서를 바꾸기 시작했다.

 

 

성공한 기업도 있지만 아직 많은 기업이 데이터과학의 가치를 온전히 끌어내지 못하고 있다. 심지어 운영을 잘해 탁월한 인사이트를 제공해도 사업 활용에는 실패한 회사도 있다. 의사결정자에게 인사이트를 설명하는 마지막 단계에서 관련 노력이 부족하기 때문이다.

 

데이터과학 플랫폼 캐글Kaggle이 데이터과학 전문가 7000명 이상을 대상으로 진행한 2017년 설문조사에 따르면업무장벽상위 7개 가운데 4개가 기술이 아니라 이러한 마지막 단계에 해당하는 문제였다. 4개로관리 또는 자금 지원 부족’ ‘대답하기 모호한 질문’ ‘분석 결과가 의사결정에 사용되지 않음’ ‘비전문가에게 데이터과학 설명 필요가 있었다. 이는 데이터과학 전문가 휴고 본-앤더슨Hugo Bowne-Anderson이 팟캐스트에서 공개한 데이터과학자 35명의 인터뷰 내용과 겹친다. 앤더슨은 2018 HBR 온라인 아티클에서방송에 출연한 게스트 대부분이 데이터과학 전문가가 갖춰야 하는 필수능력으로일하면서 언제라도 배울 수 있는 것, 비즈니스 질문에 잘 대처할 수 있게 커뮤니케이션을 잘해 복잡한 결과물을 비전문가인 관계자에게 설명할 수 있는 것이라고 답했다고 적었다.

 

대기업에 데이터 시각화와 프레젠테이션 설득력 제고를 주제로 강연과 자문을 제공하면서 데이터과학자와 경영진 양쪽 불만을 접했다. 데이터 팀은 도출해낸 인사이트에 얼마나 막대한 가능성이 담겨 있는지 잘 알지만 경영진을 설득하지 못한다. 경영진이 분석 결과를 잘못 이해하거나 지나치게 단순화하고 모든 질문에 흡족한 답을 제시하는 재주부리기를 원한다며 호소한다. 반면, 경영진은 데이터과학 운영에 막대한 돈이 나가는데 기대한 만큼 의사결정에 도움이 안 된다고 불평한다. 그러나 이미 결과물은 나왔다. 비즈니스 언어로 풀어내지 않아 경영진이 알아보지 못했을 뿐이다.

 

비즈니스와 기술 사이 괴리가 어제오늘 얘기는 아니나 갈수록 커지고 있다. 코딩과 컴퓨터가 나오기 전 시대인 105년 전으로 돌아가 보자. 정보시각화 선구자 윌러드 브린턴Willard Brinton < Graphic Methods for Presentation Facts >라는 기념비적인 책에서 최종 단계에서 발생하는 문제를 묘사했다. 브린턴은아무것도 모르고 오만한 위원이나 간부가 자신의 이견에 반박할 실제 자료를 내놓지 못한다는 이유로 전문가가 자료에 기반해 꼼꼼하게 세운 계획을 좌절시키는 일이 허다하다반석이 대성당을 떠받치듯 자료를 효과적으로 프레젠테이션해 데이터를 떠받쳐야 한다고 말했다.

 

이후 한 세기가 지났지만 변한 것은 없다. 고질적인 문제가 그러하듯 마지막 단계 문제의 원인도 다양하다. 데이터과학 프로그램에 시각화 기능이 탑재된 경우도 있다. 이 때문에 데이터과학 전문가가 프레젠테이션 등 커뮤니케이션까지 담당해야 하는 것이 당연시되기도 한다. 하지만 데이터과학 프로그램으로 만든 기본적인 시각화 작업물은 꼼꼼히 계획하고 정밀하게 디자인한 전문적인 데이터 시각화 작업물과는 비교가 되지 않는다. 데이터 프로그램이 제공하는 시각화 기능 대부분이 데이터 관련 기능에 비해 떨어지기 때문이다. 게다가 데이터과학 전문가가 커뮤니케이션 업무를 수행하고 싶지 않은 경우도 생각해야 한다. 실제 많은 데이터과학자가 데이터 시각화에 대한 부담감을 토로했다. 이렇게 시각화하면 분석 결과가 지나치게 단순해지기 때문이다. 또 모든 과학적 분석은 미묘한 뉘앙스나 모호함을 수반하는데 이것이 왜곡되면서 경영진의 오판으로 이어질 수 있다는 설명이다. 데이터과학 인력 수요 증가로 벌어진 인재 영입전을 보면 기업은 데이터과학 기술 전문성을 우선시하느라 데이터과학 전문가가 비전문가와 커뮤니케이션할 능력이나 의지가 있는지 없는지 고려하지 않는다.

 

기업이 커뮤니케이션 공백을 메우려고 다른 인력을 추가로 고용한다면 문제없겠지만, 그렇게는 하지 않는다. 아직도 데이터과학 전문가가 데이터 랭글링도 하고 사업적, 전략적 맥락 안에서 분석도 하고 차트도 만들고 비전문가에게 프레젠테이션까지 해주기 원한다. 터무니없는 요구다. 그런 만능 사원은 상상 속에나 존재한다.

 

최종 단계 문제를 해결하기 위해서는 상상 속 인재 찾기를 멈추고, 데이터과학을 운영하기 위해 어떤 재능이 필요한가 재고해야 한다. 본 기사에서는 데이터과학을 십분 활용하지 못하는 기업을 대상으로 데이터과학 전문가에게 주어진 짐을 분산하고 대신 팀 구성에 필요한 새 인재 유형을 소개할 예정이다. 핵심은 다양한 재능으로 구성한 융합cross-disciplinary데이터과학팀을 만들고 팀원이 물리적으로 가까운 거리에서 일하는 데 있다. 이런 팀에서는 업무 미루기가 사라지고 협업이 자연스러워진다.

 

팀으로 움직이는 방식(새로운 구성은 아니나 새롭게 적용되는 방식)으로 데이터과학 운영팀은 마지막 단계 문제를 극복해 마침내 인사이트를 활용해 사업 성과를 낼 수 있다.

 

 

왜 이렇게 됐을까?

 

20세기 초, 현대적 경영관리 개척자들은 수준 높은 운영 실력을 발휘해 시각 커뮤니케이션을 통해 데이터를 의사결정에 활용했다. 그들은 팀을 만들었다. 코드 명령어 하나하나를 천공카드에 입력하던 시절에는 천공작업자gang punch operator와 천공된 카드를 목적별로 나누는 선별작업자card sorters, 관리자manager, 설계도면 등을 그리는 (거의 항상 남성이어서) 드래프트맨draftsmen등 상이한 직군이 모여 함께 작업했다. 이 같은 협업 사례는 브린턴의 저서에 다수 실려 있다. 철도회사나 대형 제조업체의 운영체제가 특히 뛰어났다. 이들은 공장을 통해 소재를 보낼 때 가장 효율적인 경로를 찾아 지역 판매실적 목표를 달성했고 심지어 최상의 휴가 스케줄도 짰다.

 

거의 한 세기 동안 이러한 팀 단위 체제가 지속됐다. 메리 엘리너 스피어Mary Eleanor Spear 1969년 자신의 저서 < Practical Charting Techniques >에서 이상적인 팀 구성과 업무 분장에 대해 상술했다. 커뮤니케이션 전문가, 그래픽 분석가, (여전히 대부분 남성이라) 드래프트등 세 명이 협업하기를 적극 추천했다.

 

 

 

그러나 1970년대에 들어서자 갈라지기 시작했다. 데이터를 처리한 공간(컴퓨터 프로그램)에서 데이터 시각화도 할 수 있게 되자 많은 과학자가 이 새 기술로 몰렸다. 이 프로그램으로 만든 시각화 자료는 조잡했지만 짧은 시간 안에 다른 사람 도움 없이 작성할 수 있었다. 컴퓨터가 하는 작업과 드래프터(이 당시에는 마침내 드래프트이 아니다)가 디자인하는 전통적인 작업으로 시각화 세계가 분리되기 시작했다.

 

엑셀계의 혁명 차트마법사Chart Wizard는 두 세계를 이어줄클릭앤드비즈click and viz를 소개했다. 갑자기 누구든 차트를 클릭앤드비즈가 제공하는 기능을 이용해 지나칠 정도로 화려하게 꾸밀 수 있게 됐다. 막대 차트의 3차원 재현이나 파이에서 도넛 차트로의 변경 등이 대표적 기능이다. 이는 정말 엄청난 변화다. 차트 작업이 모든 기업에서 구사하는 국제어lingua franca가 돼 버렸다. 이로 인해 일하면서 데이터를 사용하는 일이 증가했고 결국 데이터과학 부서가 별도 등장했다. 그동안 디자이너가 시각 커뮤니케이션으로 처리하던 제한적인 데이터 양이 많이 늘어난 까닭이다. 무엇보다 업무 구조가 바뀌었다. 디자이너(또는 드래프터) 가치는 낮아져 결국 데이터 분석에서 떨어져 나왔다. 이때 시각화가 데이터 담당자 소관으로 넘어갔는데 문제는 대부분이 시각화 교육을 받은 적도, 학습 의욕도 없었다. 빠르고 편리한 차트마법사로 만든 시각화 자료로 하는 프레젠테이션이 느리고 자원 집약적인 디자인 중심의 시각화 작업을 대체했다. 후자가 더 효과가 높다는 것을 아는데도 전자가 대세로 떠올랐다.

 

데이터과학이 출연하면서 데이터과학 전문가가 필수로 갖춰야 하는 능력이 코딩부터 통계, 알고리즘 모델링 등 광범위해졌는데도, 데이터과학자에게 데이터 업무와 커뮤니케이션 둘 다 요구하는 관행은 여전하다. 데이터과학 전문가가 21세기 가장 성차별이 심한 직업이라는 내용을 다룬 2012 HBR 기사를 보면 데이터과학자가 얼마나 무리한 요구를 받는지 알 수 있다. “데이터과학 전문가로 성공하려면 어떤 능력을 갖춰야 할까? 데이터 해킹, 데이터 분석, 커뮤니케이션, 컨설팅이 전부 가능한 완전체가 되면 된다. 모든 능력을 갖췄으니 다 잘하겠지만 그런 사람은 드물다.”

 

데이터과학 전문가 수요가 높은 상황에서 이처럼 무리한 요구를 한다면 상당수 기업이 필요한 인재 영입에 실패할 것이다. 성공하고 싶다면 다른 방법을 강구할 수밖에 없다. 가장 좋은 방법은 데이터과학 전문가에게만 요구하던 여러 능력을 조정해 팀을 다양한 재능으로 다시 꾸리는 것이다.

 

 

데이터과학 운영 개선하기

 

팀워크에 기반한 효율적인 데이터 운영 시스템은 브린턴과 스피어에게서 이론적 토대를 빌렸지만 방대한 데이터 처리와 자동화 시스템, 시각화 기술 발전 부분 등 현재의 양상을 반영했다. 또 실적같이 표준화한 애널리틱스 데이터를 간결하게 보고하는 일부터 최첨단 머신러닝 알고리즘을 사용한 가장 복잡한 빅데이터 작업까지 다양한 프로젝트 유형을 고려했다.

 

데이터과학 운영에 필요한 4단계는 다음과 같다.

 

 

1. 어떤 팀원이 필요한지가 아니라 어떤 재능이 필요한지 규정한다.

완벽한데이터과학 전문가라는 인재상이 무리였다는 판단이 들면 자연스레 이를 대신하기 위해 누구를 어디에 배치할지 고민할 수 있겠다. 데이터 처리 전문가, 데이터 분석가, 디자이너, 커뮤니케이션 담당자 역할을 나눠 할당하는 것이다.

 

이 방법은 별로 추천하지 않는다. 사람을 역할에 끼워넣기보다는 성공에 필요한 재능이 무엇인지 규정하라. 하나의 재능이 곧 사람 한 명이 아님에 주의하라. 특정 재능 보유자가 한 명 또는 그 이상일 수 있다. 한 명이 여러 재능을 갖춘 사례도 있다. 사람은 셋, 재능은 다섯일 경우도 있다. 구분이 미묘하겠지만 프로젝트의 다양한 단계에서 팀을 민첩하게 설정 또는 재설정하려면 중요하다.(이 부분은 다시 설명하겠다.)

 

회사별로 필요한 핵심 재능이 다르겠지만 이상적인 구성안은 다음 6개를 포함한다.

 

프로젝트 관리.프로젝트 유형에 따른 전환과 원활한 진행 등 애자일한 팀 운영을 위해서는 모든 운영 관련 사항에 스크럼같이 강력한 프로젝트 관리 방법론을 도입해야 한다. 좋은 프로젝트 관리자는 조직 능력이 우수하며 대화로 일을 해결하는 기술이 탁월해 이질적인 재능을 미팅을 열어 한데 모으고 팀원 간 소통을 원활히 해 문화적 간극을 좁힌다.

 

데이터 랭글링.데이터 랭글링에는 시스템 구축 능력이 필요하다. 이는 데이터 검색, 정제, 구성과 알고리즘 및 통계 기반 엔진 개발, 유지와 관련이 있다. 랭글링 재능 보유자들은 운영 간소화에 집중한다. 이를테면 여러 프로젝트에 반복 적용할 프로세스를 정립하고 정보-디자인 과정을 촉진할 수 있게 양질의 범용성 높은 시각화용 템플릿을 만든다.

 

데이터 분석.데이터 분석에서는 가설을 설정 및 검증하고 데이터에서 의미를 도출해 구체적인 사업 맥락에 적용하는 능력이 중요하다. 그렇지만 데이터과학 운영에서 데이터 분석의 중요성은 생각보다 덜 알려져 있다. 어떤 기업은 데이터 랭글링에 큰 비중을 두고는 데이터 분석도 함께 처리해 달라고 한다. 그러나 좋은 데이터 분석은 코딩과 수학을 잘한다고 나오는 게 아니다. 데이터 분석 재능은 컴퓨터과학보다 인문학 출신에게서 자주 나타난다. 소프트웨어업체 타블로Tableau 2018년 애널리틱스 대표 트렌드 중 하나로 인문학과 데이터 분석 융합을 꼽았을 정도다. 비판적 사고와 맥락 설정, 그 밖에 인문학에서 배운 많은 것들은 데이터와 분석 등 여러 부문에서 핵심 능력이다. 타블로의 리서치과학자 마이클 코렐Michael Correl은 이를 주제로 한 온라인 강의에서 데이터과학과 인문학의 융합이 중요한 이유를 설명했다. 코렐은데이터와 사람은 분리할 수 있는 게 아니다라고 주장했다. 코렐은인문학의 눈을 통하면 사안에 한 발자국 더 들어가 맥락을 이해할 수 있다기술 아래 묻혀 있던 사람이 또렷이 드러난다고 말했다.

 

분야 전문성.데이터과학팀은 지하에 틀어박혀 신비스러운 작업을 하다가 회사가 필요로 할 때만 지상으로 올라오는 사람들이라고 여기는 경우가 있다. 이런 이미지를 버려야 할 때다. 데이터과학을 지원 부서로 취급해서는 안 된다. 데이터과학팀에 관리 담당 재능을 둘 필요가 있다. 경영 지식과 전략을 갖춘 이가 프로젝트 디자인과 데이터 분석을 이끌고, 팀원들이 우수한 통계적 모델 개발만이 아니라 경영 성과에도 관심을 가지도록 유도할 수 있다. 페이스북 머신러닝 담당자 호아퀸 칸델라Joaquin Candela는 팀이 실적에 집중하고 데이터과학 발전보다 사업적 성과를 우선할 때 적절한 보상을 주는 등 이런 일에 크게 힘썼다.

 

디자인.디자인을 둘러싼 오해는 광범위하다. 좋은 디자인이란 서체와 색상을 고르거나 미적 감각을 담은 차트를 내보이는 일이 아니다. 그건 스타일링이다. 디자인의 일부이기는 하나 가장 중요한 요소라고 할 수 없다. 디자인 재능 보유자는 효과적인 시각 커뮤니케이션을 위해 시스템을 구축하고 실행하는 일을 한다. 주어진 콘텍스트 안에서 디자인 재능 보유자는 어떻게 관객에 맞춰 시각 자료를 만들어 편집하고 아이디어를 정제할지 파악한다. 정보디자인 재능은 데이터 시각화를 이해하고 손질하는 작업을 강조하기에 정보디자인 데이터과학팀에 꼭 필요하다.

 

스토리텔링.묘사(narrative)는 인류가 가진 강력한 도구이지만 데이터과학에서 가장 활용을 못 하고 있는 기술이다. 데이터 인사이트를 이야기로 풀어내는 능력이야말로 알고리즘과 경영진 사이의 커뮤니케이션 틈을 좁히는 데 다른 어떤 능력보다 도움이 된다. 그런데데이터 스토리텔링Storytelling with data이라는 유행어가 신물 날 정도로 회자되지만 제대로 이해하는 이는 드문 듯하다. 미국의 베스트셀러 작가 스티븐 킹이나 톰 클랜시처럼 프레젠테이션을 하라는 뜻이 아니다. 여기서 스토리텔링이란 내러티브 구조와 기법을 파악해 데이터 시각화와 프레젠테이션에 적용하는 일이다. 

 

 

2. 필요한 재능의 포트폴리오를 충족하도록 인사를 채용하라.

팀에 어떤 재능이 필요한지 파악했다면 이 역할에 맞춰 전부 충원하겠다는 생각은 버려라. 그보다 팀에서 이 재능들을 확실히 이용할 수 있는지 초점을 두라. 경우에 따라 한 사람이 여러 재능을 갖출 수 있다. 디자인과 스토리텔링 재능을 모두 가진 사람이나 데이터 랭글링과 분석 능력을 보유한 사람이 그 예다.

 

때로는 직원이 아니라 하청업체를 이용해 필수 재능을 활용할 수 있다. 필자도 조언자 그룹을 두어 개인적으로 취약한 분야를 보완하고 있다. 정보디자인 기업과 접촉하거나 새 데이터 스트림 정제 및 구성과 관련해 데이터 랭글링 전문가와 계약을 맺을 수 있다.

 

사람과 재능을 분리해서 생각하면 최종 단계 문제 해결이 수월해질 것이다. 데이터과학에 커뮤니케이션 능력도 갖춘 인력을 구하는 수고가 필요 없어지기 때문이다. 디자인 능력자를 영입하면 데이터과학 전문가도 자기 강점을 살리는 일에 몰두할 수 있다. 이는 기존에 크게 환영받지 않던 이에게도 새 기회를 선사한다. 디자인 능력이 우수하지만 코딩 능력은 평균인 이가 팀에 공헌할 수도 있다.

 

 

라이프 에피제너틱스Life Epigenetics 선임 데이터과학이자 겸 레딧Reddit채널 ‘Data is Beautiful’의 큐레이터 랜들 올슨Randal Olson은 과거에는 데이터과학의 기술적인 부분을 두고 누가 얼마나 잘했는지에만 중점을 뒀다고 말했다. 올슨은일을 처음 시작할 때 커뮤니케이션 분야가 중요하다는 생각하지 않았습니다라며대부분 그랬습니다라고 말했다. 하지만 현재 올슨은 경우에 따라서는 과거와 다른 채용과정을 거친다. 올슨은지원자가 들어오면 바로 디스플레이 화면에 모델과 수식을 늘어놓습니다라며데이터과학 전문가끼리 대화하는 방식이죠. 하지만 지금은 간혹 비전공자를 데려와 지원자에게저 화면의 모델을 이 사람에게 설명해 보라라고 시험합니다라고 말했다.

 

 

3. 팀원에게 부족한 재능을 찾아 키워라.

문화적 충돌은 팀원끼리 서로의 이력을 이해하면서 극복할 수 있다. 디자인 재능을 가진 이는 통계나 알고리즘에 노출된 적이 없는 경우가 종종 있다. 디자인 분야에서는 미학적 섬세함과 단순함, 명확성, 내러티브에 초점을 맞춘다. 그래서 데이터 분야의 깊이와 복잡함에 적응하기 힘들어 한다. 반면 하드코어 데이터과학에서는 객관적 가치와 통계적 철저함, 포괄성을 높게 친다. 커뮤니케이션 작업이 낯설고 방해된다고 여길 수 있다. 대형 IT기업 데이터과학 운영팀 매니저는 커뮤니케이션을 가리켜과학자집단 정서와는 안 맞습니다라며저 역시 낯설고 불편했습니다. 10년간 데이터과학 분야에 종사했거든요라고 말했다. 그러면서도팀을 새로 꾸리면서 생각이 달라졌습니다라며데이터과학자가 커뮤니케이션을 조금이라도 배우면 회사에 이로운 일을 더 할 수 있겠구나 싶었습니다라고도 부연했다.

 

팀원에게 다른 팀원이 갖춘 재능의 진면목을 느끼게 하는 방법은 다양하다. 디자이너에게 통계입문 수업을 권해 기초지식을 쌓게 하고 데이터과학 전문가에게는 디자인 기본원칙을 익힐 수 있다. 양자 모두 상대 분야의 전문가로 거듭날 필요는 없다. 단지 진가를 발견할 정도면 충분하다.

 

스탠드업 미팅 등 여러 미팅에도 다양한 재능이 참여해야 한다. 스탠드업 미팅은 대개 기술 부문에서 어떤 발전이 있었는지 갱신하기 위해 열지만 이때도 프레젠테이션을 담당하는 마케터가 참석해야 한다. 랜들 올슨이 일하는 라이프 에피제너틱스에서는 그렇게 하고 있다. 주제전문가SME가 전략미팅에 데이터 랭글링과 데이터 분석 재능을 데려가야 한다. 특별 미팅에서 회사 관계자와 데이터 팀이 문답을 주고받는 시간을 마련하면 서로 간 간극도 많이 줄일 수 있다. 패션에 인공지능을 더한 패션 큐레이션기업 스티치픽스Stich fix의 최고알고리즘경영자Chief algorithms officer·CAO에릭 콜슨Eric Colson(사실 콜슨은 기업 정체성이 데이터과학에 있는 스티치픽스에서 통계와 커뮤니케이션을 전부 담당하고 있는 전설 같은 인재다) 팀원에게 비전문가를 상대로 하는 1분 프레젠테이션을 주문했다. 문제를 어떻게 설명해야 누구나 이해할지 고민하는 훈련이었다. 콜슨은여러분이코코넛이라고 말하면 우리 팀에서는 동료가 씨름하던 특정한 통계 문제를 지칭하는 것임을 알아차린다라며무엇을 하는지 모르는데 사업이 잘될 리 없습니다. 누구든 이해하기 쉽도록 설명하기 위해 애썼습니다라고 말했다. 이 밖에도 데이터과학팀의 한 매니저는 기술과 디자인 부문 용어집을 만들어 팀원들이 상대 분야에 익숙해지도록 했다.

 

사내에 콜슨처럼 데이터 재능과 커뮤니케이션 및 디자인 재능을 동시에 갖춘 팀원들이 있다면 서로 배우라고 권하는 일도 추천한다. 팀원이 팀에 필요하고 자신에게는 없는 능력을 기르고자 한다면 기존 재능과 동떨어진 분야라도 뒷받침해줘야 한다.(가령 데이터 랭글링 전문가인데 디자인을 배우고 싶어 할 수 있다.) 워크숍에서 만난 데이터과학 전문가들은 디자인 혹은 스토리텔링 능력을 개발하고 싶어 했지만 여유가 없었다. 다른 팀원들도 배우라며 환영했지만 프로젝트 초점이 사업적 성과보다 기술적 성취에 있었다.

 

이렇게 상대방 분야에 익숙해지면 팀원 간 공감대를 형성할 수 있다. 공감대는 효과적인 팀워크 필수요소인 신뢰 구축으로 이어질 것이다. 콜슨은 데이터 분석작업을 스토리로 풀어냈던 기억을 떠올렸다. 그는판촉 문제로 프레젠테이션을 한 적이 있는데 접근법 자체가 잘못됐다는 판단이 섰습니다라며설득하려면 판촉과 판매를 공부해야 했습니다라고 말했다. 주장을 강화하기 위해 베타이항 분포 등 여러 통계 개념을 설명하는 대신 단지에서 공을 반복해서 꺼낼 경우 시간이 지남에 따라 단지 안에 든 공의 수와 유형이 어떻게 되는지 이야기했다. 콜슨은사람들이 좋아하더군요라며방을 쭉 둘러봤는데 다들 알겠다는 얼굴을 하고 있었어요. 확신을 줬구나 했습니다. 굳이 수학 개념까지 파고들 필요가 없었습니다. 믿고 맡기더군요라고 말했다.

 

 

 

4. 재능을 중심으로 프로젝트를 구성하라.

팀에 다양한 재능을 확보했다면 이제 목표 달성을 위해 활용할 때다. 어떤 재능이 필요한지, 언제 프로젝트가 통제를 벗어나는지 등은 바뀌기 마련이다. 뛰어난 프로젝트 관리 능력과 애자일한 팀운영에서 얻은 경험을 통해 팀에 필요한 재능을 설정 및 변경하고 필요한 자원을 동원하며 어떤 특정 파트에 과도한 부담이 가지 않도록 스케줄을 통제할 수 있다.

 

 

 

한 곳에 모아라

 

이제 프로젝트 성공을 위해 다음 단계를 밟아야 한다.

 

권한을 부여할 이해관계자 한 명을 정하라.팀원이 데이터과학팀 관리자 대신 다른 이에게 보고하는 일이 생각보다 종종 일어난다. 디자인 팀원은 마케팅 부서에 보고할 수 있다. 주제전문가는 간부일 경우가 있어 CEO를 직접 찾아갈 수도 있다. 중요한 것은 팀에 의사결정 권한을 최대한 많이 줘야 한다. 여기서 이해관계자란 보통 사업과 관련 있거나 책임을 져야 하는 비즈니스 전문가를 가리킨다. 결국 일의 목적은 실적을 올리는 데 있다. 이해관계자는 공동 목표를 수립하고 팀에 인센티브를 줄 수 있다. 이런방식은 권한 없는 책임의 함정을 피할 수 있어 이상적이다. 서로 조율되지 않은 관계자 여럿을 팀이 상대하는 상황을 모면할 수 있다.

 

어떤 재능이 주도하고 뒤에서 지원할지 정하라.누가 전면에 나서고 누가 뒷받침할지는 프로젝트 유형과 단계에 따라 다르다. 가령 깊은 연구가 필요한 프로젝트가 있다고 치자. 패턴을 찾기 위해 막대한 데이터를 처리하고 시각화해야 한다. 이럴 때는 데이터 랭글링과 데이터 분석이 이끌고 주제 전문성은 뒤에서 지원하고, 외부와 커뮤니케이션 할 일이 없으므로 디자인은 참여할 필요가 없다. 반대로 합리적인 근거를 바탕으로 한 전략 수정안을 이사진에게 보고하려 한다면 스토리텔링과 디자인이 주도하고 데이터 담당이 뒷받침한다.

 

같은 장소에 배치하라.프로젝트 동안 팀원 모두 한 공간에서 일하게 하라. 소통과 협업을 위한 가상공간도 하나로 통합하라. 디자인과 스토리텔링은 협업 툴로 슬랙Slack, 기술팀은 깃허브GitHub, 비즈니스 전문가는 이메일을 사용한다면 곤란하다. 일대일 대응 분석paired analysis기법을 활용하라. 팀원이 서로서로 옆에 앉아 하나의 스크린으로 작업하는 스크럼 방식의 반복적 프로세스다. 데이터 랭글링과 데이터 분석 팀원들이 나란히 앉아 데이터 모델을 개량하고 가설을 검증할 수 있겠다. 주제 전문성과 스토리텔링 담당 둘이 마주 보고 프레젠테이션을 윤색하다가 차트를 다듬어야 할 때 디자인을 부를 수 있다.

 

진짜 팀으로 만들어라. 한자리에 모여 일하는 형태의 진짜 효과는 우리가 권한을 가진 하나의 팀이라는 인식에서 비롯된다. 콜슨은우리 회사는 타부서 이관 금지를 정책으로 채택했습니다라며여기저기 다른 부서에서 3명을 모아 손발을 맞추는 방식은 지향하지 않습니다라고 말했다. 이를 위해 콜슨은 외부 지원이 제한적이어도 자신의 팀만으로 충분히 목표에 다다르도록 필요 기술을 전부 확보하는 일을 우선과제로 삼았다. , 테크놀로지와 커뮤니케이션을 넘나들어 제너럴리스트라고 불릴 법한 이들을 채용하려 노력했다. 콜슨은 데이터 담당자가 스토리텔링에서 도움이 필요하거나 주제전문가가 통계 개념을 이해해야 하는 상황 등에서 주기적으로 피드백을 반영해 이 정책을 강화했다.

 

재활용과 템플릿. ‘UI 알고리즘 팀역시 콜슨의 손에서 탄생했다. UI 알고리즘 팀에서는 디자인과 데이터 랭글링을 통합해 좋은 데이터 시각자료 생산에 필요하며 몇 번이고 다시 사용할 수 있는 코드 집합을 만든다. 이런 템플릿이 있다면 팀을 효율적으로 운영할 수 있다. 가령 정보 디자이너와 데이터 분석가가 성공적인 시각화 사례를 두고 나눈 대화 내용을 하드코딩할 수 있다. 미 싱크탱크 도시문제연구소the Urban Institute수석 데이터과학자인 그레이엄 맥도널드Graham MacDonald는 템플릿을 이용해 이런 협업을 촉진했다. 도시문제연구소에서는 미국 내 수많은 카운티를 위해 카운티별로 데이터를 생성한다. 데이터 랭글링과 주제 전문성을 통합해 커뮤니케이션 니즈를 파악해 카운티마다 맞춤형 자료를 제공할 수 있는 템플릿을 만들어 재활용하고 있다. 다양한 재능을 통합해 팀을 구성했기에 가능한 결과다.

 

 

비전문가를 대상으로 하는 데이터과학 프레젠테이션(마지막 단계 문제)은 데이터과학이 발전한 속도와 비교하면 더디다. 반드시 해결해야 하는 문제다. 해결하기 위해서는 데이터과학팀을 어떻게 구성할지, 어떻게 관리할지, 데이터 스트림 관련 첫 단계부터 임원진에 차트를 선보이는 마지막 단계까지 어떤 단계에 누구를 투입할지 재검토해야 한다. 회사가 마지막 고지에 이를 때까지 데이터과학팀은 희생을 감내할 수밖에 없다. 윌러드 브린턴의 표현을 빌리자면 데이터과학팀은주춧돌 없는 대성당의 반석이 될 것이다.

 

 

 

번역 노이재 에디팅 최한나

 

 

스콧 베리나토(Scott Berinato) HBR 선임편집자다. 저서로굿 차트 >(한즈미디어, 2017) < Good Charts Workbook: Tips, Tools, and Exercises for Making Better Data Visualizations >(HBR, 2019)이 있다.

  • 아티클 다운로드
    (PDF)
    5,000원

    담기바로구매

  • 2019년 1-2월호
    25,000원
    25,000원

    구매하기

  • 디지털서비스
    1년 150,000원

    디지털서비스란

    신청하기

인사조직 다른 아티클

무료 열람 가능 아티클 수 0/1 회원가입 | 서비스상품안내