트위터만 활용해도 다음 질문에 대한 답을 구할 수 있다. 어떻게 하면 될까?
1. 당신의 정치적 성향은?
2. 우리 국민들의 프라이버시에 대한 태도는?
3. 지금 유행하고 있는 감기의 확산 경로는?
방법을 알고 있다면 여러분은 이미 소셜분석(Social Analytics) 전문가다. 소셜분석이 가트너가 선정한 2011년
전략기술 톱 10 중 4위를 차지했으니 여러분의 앞날은 전도 유망할 것이다. 모른다고 낙담할 필요는 없다. 접근하는 방법은 의외로
간단하다.
소셜분석은 말 그대로 ‘소셜’ 네트워크서비스, SNS를 분석하는 기술이다. 풀어서 설명하자면 SNS 이용자들의 프로파일,
SNS 이용자들이 생산하는 메시지, SNS 이용자간의 사회 연결망과 상호작용에 관한 데이터를 수집하고 해석하는 과정이라 할 수
있다.
그런데, SNS에는 이미 엄청난 양의 정보들이 쏟아져 나오고 있다. 특정 사실을 발견하기 위해 정보 수집 작업을 따로 할
필요가 없다는 얘기다. 다만, SNS 정보들은 여러 가지 데이터가 혼재되어 있기 때문에 그 정보들을 데이터의 형식과 속성에 따라
구분할 필요는 있다. 엄밀히 말한다면 소셜분석은 SNS 정보들을 ‘필터링’하고 해석하는 과정으로 보아야 할 것이다.
<SNS 정보의 필터링과 해체>
▶ SNS 이용자 프로파일 -> SNS 이용자의 이름, 나이, 성별, 직업, 국적, 거주지역 등의 정보
▶ SNS에서 생산되는 메시지 -> 사용된 단어, 서술된 문장, 링크 첨부 여부, 첨부한 링크의 종류, 메시지 작성 시점, 메시지를 작성한 곳, 메시지로 표현한 감정 등의 정보
▶ SNS 이용자의 사회 연결망 -> 인맥의 크기, 인맥 구성원, 인맥 관계의 방향성 등의 정보
▶ SNS 이용자간의 상호작용 -> 메시지 흐름의 방향성, 메지시의 확산 경로 등의 정보
각각의 데이터는 그 자체만으로도 의미 있는 해석을 가능하게 해 주는데, 여러 종류의 데이터를 서로 조합한다면 알아낼 수 있는 사실의 수는 조합 가지 수만큼 늘어나게 된다. 그 중 일부를 소개하면 다음과 같다.
<SNS 정보가 알려주는 사실들>
성별, 연령별, 직업별, 지역별, 시간별(현재, 과거, 흐름)
– 실시간 이슈, 특정 사건에 대한 반응, 감정 상태의 변화, 특정 대상에 대한 긍정 부정, 영향력, 평균 인맥의 크기, 인맥의 특성, 이용자 유형(정보생산자/정보유통자/방관자) 등
자, 그럼 함께 문제를 풀어보자.
첫 번째 문제는 여러분의 정치적 성향이다. 개성에 관한 문제는 두 가지 방향에서 접근해야 한다. 개인 스스로가 만들어 낸
정보와 다른 사람들과의 관계 속에서 규명된 사회적인 정체성 모두를 따져봐야 하는 것이다. 사람은 사회적 동물이 아닌가?
그런데 SNS는 다양성이 존중되는 세계다 보니 종교나 정치 같은 민감한 이슈에 대해서는 여러분이 스스로의 색깔을 잘 드러내지
않는다. 그렇다면 사회적인 정체성 분석이 남았다. ‘초록은 동색, 가재는 게편’이라는 말이 있듯, 당신의 친구들을 살펴보면 될
것이다.
만약 여러분의 트위터 팔로잉 중에 여당인사나 이미 사회에서 보수 인사로 평가되는 있는 사람들의 비중이 높다면 여러분은 보수성향을 가지고 있을 가능성이 높다.
트윗폴(twtpol)은 이러한 분석 알고리즘으로 설계된 정치성향 분석 기능을 제공한다. 필자와 지인들의 트위터 계정으로 테스트해본 결과 그 정확성에 놀랐다. 여러분들도 한 번 시험해보시길 바란다.
다음은 우리 국민들의 프라이버시에 대한 태도 문제다.
이번에는 어떤 데이터를 분석하면 될까? 이용자 프로파일이 적당해 보인다. SNS 이용자가 자신의 사진, 실명을 공개하고
있다면 프라이버시에 대해 개방적이라고 추측해 볼 수 있다. 그렇다면 나라별로 트위터 이용자들의 평균 개방성 지수를 계산하고,
그것들을 비교한다면 우리 국민의 프라이스버시에 대한 상대적인 태도 정도는 쉽게 알아낼 수 있을 것이다.
물론, 필자가 말한 것들이 정답은 아니다. 선택할 수 있는 데이터의 종류는 다양하며. 어떤 종류의 데이터를 사용할 지는 오로지 분석자가 결정하기 때문이다. .
마지막 3번 문제는 여러분의 몫으로 남겨두겠다. 참고로 구글은 검색 분석을 통해 독감 이동 경로를 예측해주었다.
그런데, SNS 분석은 SNS의 데이터들로부터 사실을 아는 데에만 그치지 않는다. 예측에도 활용될 수 있다. SNS의
데이터들과 특정 사건의 상관관계를 방정식으로 만들면 된다. 트위터로 주가를 예측하고, 선거 결과를 예측하는 것은 바로 이러한
방식으로 이루어진다.
SNS로 인해 누구나 분석전문가가 될 수 있는 길이 열렸다. 그런데, 정확한 분석을 위해서는 많은 양의 데이터표본이 있어야
한다. 하지만, 트위터는 접근할 수 있는 데이터 양을 제한한다. 그 이상을 이용하고자 할 때는 돈을 지불해야 한다. 그래도 돈을
주고도 데이터를 살 수 없는 페이스북보다는 낫다.
이 사실은 무엇을 의미할까? SNS는 가진 자를 더욱 똑똑하게 만들어준다는 것이다. SNS가 평등하다는 것은 거짓말이다.
정부를 대상으로 정보 공개 운동이 일어나고 있는 것으로 알고 있다.
다음 타켓은 SNS로 정해보는 것은 어떨까?