베리타스

감성지능 빅데이터 분석 2017 대선 결과 예측

입력 May 06, 2017 09:04 AM KST
bpu_0506
(Photo : ⓒ자료제공= 비피유홀딩스)
▲지난 4월 24일부터 5월 4일까지의 SNS 누적 데이터 대비 후보자 관련 게시물 비율은 문재인(32.78%), 안철수(24.3%), 홍준표(20.28%), 심상정(13.62%), 유승민(9.03%) 등이다.

빅데이터 분석이 대선을 목전에 둔 '깜깜이 기간' 동안 여론조사 대안으로 떠오르고 있는 가운데 미국 도널드 트럼프 대통령 당선을 예측했던 빅데이터 분석업체인 (주)비피유홀딩스(오상균 대표)의 2017 대통령 선거 결과 예측이 눈길을 끌고 있다.

(주)비피유홀딩스는 감성지능(EI)을 이용한 SNS 빅데이터 분석을 기초로 2017 대통령 선거 결과를 예측했다. 트위터, 페이스북, 네이버 블로그, 유튜브 등에서 데이터를 수집 분석한 결과 게시물 점유율(A), 게시물 감성지수(B), SNS 사용자의 지지율(C) 등이 나타났으며 특히 지역별 지지율 현황까지 예측했다.

그 중 지난 4월 24일부터 5월 4일까지의 SNS 누적 데이터 대비 후보자 관련 게시물 비율은 문재인(32.78%), 안철수(24.3%), 홍준표(20.28%), 심상정(13.62%), 유승민(9.03%) 등이다. 해당 비율을 데이터 건수로 살펴보면 문재인(285,722), 안철수(211,777), 홍준표(176,733), 심상정(118,718), 유승민(78,706) 순이다.

또 4일 하루 기준 SNS 상에서의 게시물 점유율은 문재인(35.45%), 안철수(21.86%), 홍준표(21.04%), 유승민(12.48%), 심상정(9.17%) 후보 순으로 나타났다. 또 이날 후보자별 선호도 등의 정보를 담은 게시물 감성지수는 문재인(64.63), 안철수(65.13), 홍준표(65.35), 유승민(65.86), 심상정(66.06)으로 나타났다.

bpu_050602
(Photo : ⓒ자료제공= 비피유홀딩스)
▲후보별/지역별 게시물 감성지수도 주목을 받는다. 지난 3일 기준 서울 지역에서는 문재인 후보 선호도가 1위를 차지했다. 또 게시물의 양적인 측면에서는 부족하나 선호도 면에서는 유승민, 심상정 두 후보가 좋은 점수를 획득하고 있다.

후보별/지역별 게시물 감성지수도 주목을 받는다. 지난 3일 기준 서울 지역에서는 문재인 후보 선호도가 1위를 차지했다. 또 게시물의 양적인 측면에서는 부족하나 선호도 면에서는 유승민, 심상정 두 후보가 좋은 점수를 획득하고 있다.

이 밖에 후보 관련 SNS 주요 연관 검색어로는 문재인(낙서장,안철수,동영상,저작자,저작물,영리적,홍준표,박근혜,뭘까요,동성애,가능성,바른정당,필패입니다,구글트렌드,갈라치,기득권), 안철수(지지율,심상정,홍준표,유승민,대선후보,지지자,김미경,교수님,박지원,신천지,민주당,유치원,네거티브,일자리), 홍준표(안철수,자유한국당,유승민,심상정,대선후보,지지율,박근혜,정치인,바른정당,토론회,안희정,정치권,경남도,경남지사,단일화,트럼프,민주당), 유승민(홍준표,안철수,심상정,바른정당,대선후보,박근혜,지지율,토론회,자유한국당,단일화,지지자,세월호,정의당,가능성,국방부,유심초,하이라이트), 심상정(안철수,홍준표,유승민,정의당,지지율,대선후보,토론회,박근혜,지지자,자유한국당,바른정당,대한민국,가능성,민주당,사람들,동성애,노동자,가운데) 등으로 나타났다.

데이터 수집 기간은 4월 11일부터 5월 4일까지 누적된 데이터를 기초로 했으며 데이터 수집 대상 SNS는 트위터, 페이스북, 네이버 블로그, 유튜브 등이다. 데이터 수집 방법은 실시간 데이터 수집기를 매 5분마다 가동하여 1일 평균 결과를 산출했다. 데이터 분석 대상은 메인 콘텐츠(이모티콘, 멀티미디어자료 포함, 리트윗, 공유 자료 포함), Semantics(의미론적 해석, 은유적 표현, 집단은어, 감성어, 제3자 지정어), 해시태그, 각 포스팅별 호감도 표현 방식(비표준 표현 방식 포함) 등이다.

의도성게재, 허위(비논리성), 가장(아이디 변환, 은닉), 모호한 위치정보, 기계에 의한 포스팅 등의 데이터는 분석 대상에서 제외됐으며 분석 지표인 감성지수는 개별후보나 이슈에 대한 지지도가 아니라, 개별후보 또는 이슈가 포함된 포스팅에 함유된 작성자의 개인적인 감성을 자연어 처리, 빅데이터 분석,구문 분석한 내용을 대한민국 영토 내 일반 한국어 감성 표현과 비교하여 산출한 값이다. 

한편 인공지능(AI)이 인간이 추론하기 어려운 내용을 컴퓨터를 이용해 사실관계를 분석하는 시스템이라면 감성지능(EI)은 컴퓨터에 인간 감성을 이입하여 인간의 감성으로 사실 관계를 분석하는 것으로, 기존 인공지능에서 분석 불가 항목인 감성까지 분석하여 인공지능 보다 월등한 분석이 가능해졌다.

아래는 지난 4월 11일부터 5월 4일까지 SNS 상에서의 누적된 빅데이터 분석을 토대로 한 결과값 요약 내용이다.

- 문재인 후보 관련 게시물은 날짜에 관계없이 30%대 초중반의 SNS 점유율 유지

- 27일 이후 홍준표 후보 관련 게시물 비중이 20%대로 올라선 이후 꾸준한 현상 유지

- 안철수 후보의 경우 약 30%에 달하던 게시물 양이 20%대 중반으로 내려온 이후 비중을 유지 중

- 유승민,심상정 양 후보의 게시물 양도 비교적 큰 변화없이 9%대와 13%대 점유율을 유지 중

- 문재인 후보 관련 게시물은 일일 점유율 부분에서도 지속적으로 상승추세

- 홍준표 후보 관련 게시물량의 증가세 주춤하였으나, 20%대의 점유율 유지

- 안철수 후보 관련 게시물은 일별로 점유율이 낮아지는 추세

- 5월3일이후 유승민 후보 관련 게시물이 증가함

- 홍준표 후보를 제외하고 각 후보의 감성지수가 상승/하강패턴이 유사하게 출현하고 있음

- 27일 이후 홍준표 후보의 감성지수 급상승 이후 다시 하락하여 64점대 감성지수 유지

- 문재인 후보의 경우 게시물 양에서도 우위이며, 일교차는 존재하지만 전체적으로 감성지수가 타후보들에 비해 안정적인 추세

- 안보분야에 대한 감성지수가 안철수 후보 뿐만 아니라 구여권 후보와 심상정 후보에 비해 낮은 감성지수를 보이고 있음

관련기사

오피니언

기고

샬롬나비 논평, "브렉시트, 영국 선교와 영

샬롬나비는 브렉시트에 대한 논평을 발표하고 "영국 저소득층의 쇠퇴한 삶의 상황이 초래한 브렉시트는 기독교이후 시대 영국을 위한 복음전도와 선교의 새로운 기

많이 본 기사

조용기 목사 대법 확정 판결에 "설교 중단하라"

여의도순복음교회 조용기 원로목사의 징역 2년 6개월 집행유예 4년 판결에 교회개혁실천연대(이하 실천연대)가 18일 "주일예배 설교를 중단"하고 모든