Archive.
【韓探】 데이터로 보는 20대 대선후보 2차 다자토론 승자는? (Social Sentiment) 본문
승자가 누구냐? 전문가들의 뇌피셜이 넘쳐난다.
정치인들의 진영에의 아전인수격 레토릭과 선동이 넘친다.
받아쓰기식 기사가 재생산되고 유권자 전체 인식의 지형을 왜곡하려는 시도가 계속된다.
이런 인포데믹이 퍼지기 이전에
그 날의 '유권자의 목소리'를 담은 데이터를 분석할 필요가 있는 이유다.
관심도가 호감도에 보통 비례하지만, 꼭 그렇지는 않다.
토론 시간대와 그 이후로 관심도를 분석한 한 후보군에 대해서
긍정적인 관심도, 부정적인 관심도의 비중도 따질 필요가 있는데,
소셜미디어에 발행된 글들의 언어를 분석해보면
그 관심도가 얼마나 호감도를 동반하는지 알 수 있다.
대선 2차토론 시간대를 포함해 발행된 2,600여 개의 2022년 2월 11일 네이버 블로그 포스트를 표본으로 함.
관심도* : 윤석열(43%) 이재명(38%) 안철수(12%) 심상정(7%) 순.
호감도** : 이재명(40%) 윤석열(37%) 안철수(13%) 심상정(10%) 순.
*관심도는 발행된 문서 2637건 중의 후보간 상대적인 점유율,
**호감도는 긍정언급으로 분류된 문서 312건 중의 후보간 상대적인 점유율을 의미함.
관심도가 높을수록 호감도가 높아지고, 그럴수록 투표의도(참여도)가 높아지는 상관관계에서,
호감도가 관심도와 참여도 사이에서 중요한 조절변수(퍼널)가 되는데,
尹후보의 관심도가 호감도 퍼널의 층을 통해 李후보에 비해 더 많이 걸러지는 것을 알 수 있다.
달리 말해서, 尹후보가 李후보에 비해 호감도에서 비교우위가 떨어진다는 점이다.
1차 토론에서 李후보가 尹후보에 비해 호감도에서 비교우위가 떨어졌던 포지션과는 상반된다.
더불어서 尹후보 우위의 두 후보간 관심도 격차(5%p)가 李 우위의 호감도 격차(3%p)로 인해
지금의 여론조사와 마찬가지로 오차 내의 박빙인 상황임을 소셜미디어 데이터로서도 확인할 수 있다.
조금 더 나아가면, 尹후보 대비 李후보 우위의 호감도의 비교우위가 유지될 경우
관심도가 투표의도에 영향을 미치는 것보다도 호감도가 투표의도에 더 강한 영향을 미치는 만큼,
유사한 관심도를 가진 상황에서 당선에는 李후보가 더 유리해질 수 있다는 점도 조심스럽게 예측해볼 수 있다.
관심도와 호감도 폭으로 추정한
네이버 블로그 이용자 투표의도(참여도)는 아래와 같다.
윤석열 43%~37%
이재명 40%~38%
안철수 13%~12%
심상정 10%~7%
"그래서 2차토론 누가 제일 잘했다? 나았다?"
'관심'은 하나의 재화(Herbert Simon)로 유권자 입장에서 비용이고, 후보 입장에서 수익이다.
한편 '호감'은 유권자 입장에서 후보라는 상징을 소비함으로써 얻는 심리적 효용이고, 후보는 그 상징의 공급자이다.
이런 맥락을 감안한 분석으로서 오른쪽의 포지셔닝맵은 후보 간 Trade-off 관계와 비교우위를 알 수 있게한다.
관심도와 선호도***를 각각 최대최소정규화한 값으로 표시했다.
***위의 호감도='후보간' 점유율이 아닌, 선호도='후보가 언급된 문서' 중의 긍정비율로 정의.
후보간 비교우위를 알기 위한 것인데, 혼동이 없도록 '선호도'로 정의.
결론적으로 위의 포지셔닝(사람들의 마음 속 위치이자 순위) 맵을 보면,
이번 2차토론에서 심상정 후보가 '선호도 면에서 비교우위가 가장 높은' 모습으로 평가되고 있다는 점을 알 수 있다.
윤석열 후보가 4명 중 꼴찌로 선호도 면에서 비교우위가 가장 낮은 위치에 있다는 점을 알 수 있다.
이전 1차토론에서 안철수 후보가 선호도 면에서 비교우위가 가장 높았던 것과 달라진 모습이다.
또한 이재명 후보가 4명 중 꼴찌로 선호도 면에서 비교우위가 가장 낮은 위치였던 모습과는 상반된다.
네이버 블로그 이용자의 표본 특성을 따르기 때문에 70대 이상 노년층 다수의 의견까지 대표하지 못하는 한계가 있고,
데이터로 드러난 대중의 의견이기 때문에 진영이익을 대표하는 식자층이나, 정치인의 개인적인 의견과는 다를 수 있다.
데이터로 보는 20대 대선후보 1차 다자토론 승자는? (Social Sentiment)
1차 다자토론 시간이 포함된 2월 3일 발행된 데이터만을 대상으로 했다. 이재명, 윤석열, 안철수, 심상정이 언급된 네이버 블로그 문서 1,957건, 트위터 12,482건 분석 결과. *네이버, 다음 등 뉴스댓
jin-x.tistory.com
(참고) 트위터 표본
대선 2차토론 시간대를 포함해 발행된 10,560 개의 2022년 2월 11일 트윗을 표본으로 함.
트위터 표본의 경우 20대~30대 여성 대다수를 대표한다.
관심도* : 윤석열(45%) 이재명(40%) 안철수(9%) 심상정(6%) 순.
호감도** : 이재명(43%) 윤석열(35%) 안철수(14%) 심상정(8%) 순.
*관심도는 표집된 문서 10,560건 중의 후보간 상대적인 점유율,
**호감도는 긍정언급으로 분류된 문서 2,276건 중의 후보간 상대적인 점유율을 의미함.
관심도와 호감도 폭으로 추정한
트위터 이용자 표본(2030여성)의 투표의도(참여도)는 아래와 같다.
윤석열 45%~35%
이재명 43%~40%
안철수 14%~9%
심상정 8%~6%
20대 대선 승패 시뮬레이션 - 尹 65.2% 李 34.8%
한국갤럽 尹 李 安 沈 95% 상한 34% 33% 11% 2% 95% 하한 40% 39% 15% 5% 조사 표준오차 1.5% 1.5% 1.1% 0.7% 시뮬레이션 평균 (조사결과와 일치) 37.00% 36.00% 13.00% 3.50% 시뮬레이션 표준오차 1.73% 1.73% 1...
jin-x.tistory.com
'재밌는 한국 탐구' 카테고리의 다른 글
【韓探】 데이터로 보는 安 단일화제안 여론반응은? (Social Sentiment) (0) | 2022.02.14 |
---|---|
【韓探】 20대 대선 승패 MCMC 시뮬레이션 - 尹 65.2% 李 34.8% (4자구도 - 2월 2주차) (0) | 2022.02.12 |
【韓探】 데이터로 보는 20대 대선후보 2차 다자토론 승자는? (네이버/구글/카카오 데이터) (0) | 2022.02.12 |
【韓探】한국 입법권력 독과점상태 계량분석(Multivariate HHI analysis of political markets on a global basis) (0) | 2022.02.06 |
【韓探】 데이터로 보는 20대 대선후보 1차 다자토론 승자는? (Naver & Kakao) (0) | 2022.02.04 |