컬럼비아 대학교의 저널리즘스쿨은 뉴욕에 위치한 특성 때문에 언론사, 현업기자들과의 교류도
활발하지만 산업적 측면에서도 성과가 많은 연구소들을 운영하고 있습니다. 굳이 언론‘산업’
이라고 표현한 데서 짐작할 수도 있지만 컬럼비아 저널리즘스쿨의 연구소들은 정통적 의미의
저널리즘과는 다른 영역에 위치해 있습니다.
대표적인 것이 타우센터(The Tow Center for Digital Journalism)입니다. 기술의 힘으로 저널
리즘이 어떻게 변화하는지 각종 IT기술을 이용한 새로운 보도기법을 찾고 다른 한편으로는 새
로운 기술로 만들 수 있는 매체나 언론 산업의 변화를 예측하는 곳입니다. 이 타우센터와 비슷
하게 IT기술과 저널리즘의 양자 간의 관계를 다루면서도 보다 적극적으로 IT기술의 흐름을 끌
어들인 곳이 있는데 이곳은 브라운 인스터튜트(Brown Institute for Media Innovation)입니다.
2012년에 만들어진 브라운 인스터튜트는 컬럼비아대 저널리즘스쿨과 스탠퍼드대 공과대학의
협업으로 운영되고 있습니다. 즉 IT 전공자들과 저널리즘 전공자들이 머리를 맞댄 셈입니다.
이 협업의 결과물을 선보이는 ‘Computation + Journalism 2015’ 행사가 지난 10월 2일과 3일
이틀간 열렸습니다. 필자의 연수전공과는 거리가 있는데다 무엇보다 컴퓨터프로그래밍 언어와
통계학이 종횡무진으로 등장하는 바람에 이해의 폭은 크지 못했습니다. 물론 영어실력이 부족
하다는 게 가장 큰 제한점이었지만, 이번 행사의 경우는 언어적 장벽보다 사전지식의 장벽이 크
더군요. 그래도 행사의 내용을 일부나마 소개함으로써 IT기술이 어느 정도로 저널리즘 영역에서
응용되고 있는지 일면을 보여드릴 수 있을 것 같습니다.
이 행사에서 발표된 논문이나 토의는 크게 3가지 영역으로 나눠졌는데 이건 그대로 현재 저널
리즘과 IT기술의 결합의 방향들을 보여주고 있습니다. 첫 번째는 SNS 즉 소셜네트워크 서비스의
일반화로 나타난 새로운 뉴스공급, 댓글문화와 같이 IT기술이 새로 만들거나 변화시킨 커뮤니케
이션의 흐름과 영향을 다룬 연구들입니다.
두 번째는 IT기술을 이용해 취재하거나 시각화시킨 컨텐츠, 혹은 그 과정을 보여주는 사례연구
들입니다. 우리가 흔히 말하는 데이터 저널리즘이 주로 이 영역에 속합니다. 세 번째는 기자가
기사를 쓰거나 혹은 독자들이 기사를 입체적으로 이해하는데 도움이 되는 디지털 tool의 개발
사례입니다.
이틀간의 행사에서 발표된 논문이나 사례연구만 해도 거의 20개에 달하는 만큼 이 모두를 대략
적으로 소개하는 건 의미가 없을 것 같고 인상적이었던 몇 가지를 대표사례로 들어볼까 합니다.
(보다 자세히 알고 싶은 분들은 http://cj2015.brown.columbia.edu/ 를 참조하시기 바랍니다.)
우선 페이스북의 한 부서인 데이터 사이언스팀이 발표한 뉴스피드의 영향력에 대한 논문을 먼저
소개하고자 합니다. 자사의 서비스인 뉴스피드의 영향력을 자기들 스스로가 분석한 것인데 이런
연구를 하게 된 배경은 뉴스피드의 부작용에 대한 우려 때문입니다. 즉 SNS가 뉴스까지 제공하고
이를 통한 뉴스수용 비중이 커지면서 독자들이 공급자의 시각에 치우치고 다양성을 읽게 되는 것
아니냐는 이른바 ‘Chamber Effect’를 우려하는 비판에 대한 스스로의 분석인 셈입니다.
이 연구는 6개월간 무려 천백만 명의 뉴스수용양식을 분석했습니다. 이만한 빅데이타를 가진 곳
은 아마도 페이스북이 유일할 것이고 앞으로도 수많은 데이터 과학작업이 가능할 겁니다 아무튼
이 논문은 우선 페이스북 이용자들이 다양한 정보나 의견을 접하는데 있어서의 장애요소는 다음
의 세가지라고 말합니다. 첫째는 페이스북 친구들입니다. 자신의 정치적 성향과 일치되는 사람
들만 친구로 갖고 있다면 그들을 통해서 얻는 정보나 뉴스도 하나의 방향으로 집중될 수 있다는
당연한 설명입니다. 두 번째가 바로 페이스북의 뉴스피드 서비스에 대한 우려가 집중되는 부분
으로 뉴스를 골라내고 많이 읽은 기사를 순서매기는 알고리즘이나 패턴에서 오류나 편견이 자리
할 수 있다는 것입니다. 마지막 세 번째는 이용자들 스스로의 편견으로 이용자들이 뉴스피드의
기사들 가운데 일부만 골라내 보는 제한된 노출이 일어날 수 있다는 것입니다. 이 세가지 장애
요소의 영향력을 측정한 것이 바로 논문의 핵심입니다. 빅데이타 분석을 통해 나온 결론은 다음
과 같았습니다.
– 이용자들이 가진 친구들 가운데 자신과 이념이 반대되는 친구들의 비중은 23퍼센트에 달한다.
– 이용자의 친구들이 공유하는 경성뉴스 가운데서 29.5퍼센트는 사용자와 이념적으로는 반대되는
뉴스들이다.
– 이용자들이 뉴스피드에서 보는 경성뉴스의 28.5퍼센트는 이용자와 이념적으로 반대되는 뉴스
들이다.
– 이용자들이 실제 클릭하는 뉴스피드 기사의 24.9퍼센트는 이용자와 이념적으로 반대되는 뉴스
들이다.
결국은 사람들이 일정비율로 자신과 정치적 견해가 다른 친구들을 갖고 있고 그와 비슷한 비율로
이념적으로 다른 뉴스를 보고 또 그 정도 이념 비중으로 실제 뉴스피드의 기사를 보고 있다는 얘
기입니다. 결국 뉴스피드로 인한 이념성향 강화효과는 거의 없거나 미미하다는 결론입니다.
페이스북의 데이터사이언스 팀은 이번 학술대회에서 또다른 연구를 내놨는데 이건 개념적으로 상
당히 신선했습니다. 인터넷에서 메시지가 유통되는 과정에서 벌어지는 변이를 일종의 유전자의
변이에 비교해서 관찰한 연구입니다. 밈(meme), 즉 유전자와 유사하게 복제를 통해 후대로 이어지
는 문화의 구성단위를 페이스북의 메시지에 적용시켰습니다. 그래서 페이스북에서 메시지가 무수
히 많은 공유단계를 거칠 때 특히 메시지의 어떤 부분이 어떻게 변이하는지를 살펴본 겁니다.
선정된 메시지중 하나를 예를 들면 다음과 같습니다.
“어느 누구도 건강보험료를 낼 돈이 없다고 해서 병들어 죽어서는 안 되며, 어느 누구도 아프다
는 이유로 파산해서는 안 된다. 만약 당신이 이 말에 동의한다면 오늘안에 이 말을 당신의 페이스
북 상태화면에 올려라”
(“No one should die because they cannot afford health care, and no one should go broke
because they get sick. If you agree, post this as your status for the rest of the day”)
미국의 건강보험 개혁이 이슈가 된 상황에서 유행한 메시지 공유과정을 살펴본 것인데 몇 개월
간의 공유과정에서 이 단순한 메시지도 여러 변이과정을 겪습니다. 대부분은 언어나 문화적 기존
관념에서 비롯된 변이라 할 수 있는데 예를 들어 ‘글을 올리라’는 ‘post’가 ‘복사해 붙여라’
(copy and paste)로 바뀐다거나, ‘하루 안에'( the rest of the day)가 ’24시간 안에'(the next
24 hours)로 바뀌는 식입니다. 그러나 일부는 한 단계 더 나아가 이념적 성향이 낳은 변이가 나
타납니다. “오바마케어에 낸 돈이 없다고 죽어서는 안 된다”라든가 “정부가 세금을 낭비한다
고 해서 개인이 파산해서는 안 된다”라는 식의 변이는 보수적 성향의 독자들에게서만 나타나는게
관찰됐다는 겁니다. 반면 진보적 성향의 사용자들은 원래 글의 내용을 더 강화하는 방향으로 건강
보험에 설명을 더 붙이거나 아니면 아예 대중문화텍스트를 가져와서 패러디하는 경향을 보이기도
했습니다.
이런 변이가 어느 정도 시간에 걸쳐 나타나고 어떤 문화적 요인이나 정치성향이 어떤 meme을
변이시키는지에 대해서 파악된다면 유전자 연구가 생명체의 성장을 예측하듯 사회 이념, 여론의
변화과정을 어느 정도 예측할 수도 있을 것으로 보입니다.
이런 페이스북의 연구는 분석대상이 페이스북 사용자들의 방대한 데이터라는 점, 또 이 방대한
데이터를 처리하기 위한 코딩과 알고리즘이 동원된다는 점에서 컴퓨터과학과 저널리즘의 만남이
라 할 수 있었습니다.##