[스포탈코리아] 빅데이터를 통한 분석에서 이재명 더불어민주당 대선 후보가 47% 득표율로 대통령에 당선되는 것으로 예측됐다.
김상민 동양미래대 로봇자동화공학부 겸임교수는 6일 자신의 블로그인 ‘열린뉴스김상민TV’를 통해 “빅데이터 ESM 선거예측시스템으로 이재명 47% vs 윤석열 38%로 9% 격차를 벌리며 이재명 당선 확실시”라고 이재명 후보의 당선을 전망했다.
지난 3일부터 여론조사 공표가 금지됐기에 각 후보의 지지율 추이를 더 이상 확인할 수 없다. 이에 김상민 교수는 구글과 네이버 검색어 트렌드를 통해 당선 후보를 전망했다. 그리고 “9% 격차로 오차 범위 밖에서 이재명 후보의 당선을 예측한다”고 했다.
그 이유로 “19대 대선보다 10.87% 높은 36.93%의 높은 사전투표율은 이재명에 대한 관심도와 사
전투표율의 상관 관계 매우 높다”면서 “전통적으로 민주당 지지가 높은 호남 지역에서는 전국 평균보다 훨씬 높은 50%대의 사전투표율을 보였다. 이는 진영간 결집을 보여주면서 한편으로는 이재명 지지층의 결집이 눈에 띄었다. 이 같은 결과는 지역별 사전투표율과 빅데이터 상에서 나타난 이재명 후보에 대한 상관 관계를 통해 확인할 수 있다”고 주장했다.
또한 “구글 트렌드에서의 이재명에 대한 관심도 순위 점수와 사전투표율과의 상관관계를 살펴보면 상관계수(1에 가까울 수록 상관도가 정비례하여 높고 -1에 가까울 수록 반비례하여 낮음)가 0.88로 매우 높은 상관관계가 있음을 알 수 있다. 이재명 후보에 대한 결집이 윤석열 후보의 결집보다 훨씬 높다고 볼 수 있다”고 덧붙였다.
이와 함께 김상민 교수는 “네이버의 빅데이터가 실시간 제공, 데이터 처리량 등에서 구글 빅데이터에 미치지 못한다. 또 네이버에서는 보수 언론 다수를 차지하는 형편과 신천지 등 종교단체의 댓글 부대 동원 의혹 등 상대적으로 이재명 후보에 대한 부정적 댓글 비중이 압도적으로 높아 ESM에서는 구글 빅 데이터 분석을 주로 하였다”며 네이버보다 구글을 중심으로 분석했다고 전했다.
이를 통해 예측된 결과는 이재명 47%, 윤석열 38%, 심상정 2.1%, 허경영 2.5% 득표율이었다. 김상민 교수는 “미국의 경우 미국 하원 선거에서 406개 선거구 중 404개의 선거구의 승패를 정확하게 예측한 바도 있다. 또 미국 언론에 의하면 2016년 트럼프와 힐러리의 대선, 2020년 트럼프와 바이든의 대선에서 승리를 예측한 것이 관심도의 측정이었다고 한다”며 이러한 트렌드 분석에 의한 예측이 신뢰도가 높다고 강조했다.
김상민 교수는 21대 총선 하루 전인 지난 2020년 4월 14일에도 ‘ESM 선거예측 모델을 이용한 4.15 총선 선거 결과’를 발표한 바 있다.
그는 더불어민주당+더불어시민당 총 171석(157+14석), 국민의힘 전신인 미래통합당+미래한국당 총 105석(90+15석)을 예측했다. 이는 실제 결과인 더불어민주당+더불어시민당 총 180석(163+17석), 미래통합당+미래한국당 총 103석(84+19석)과 비슷했다.
당시 방송3사 출구조사에서는 더불어민주당 139~158석, 더불어시민당 16~20석, 미래통합동 90~109석, 미래한국당 17~21석으로 더불어민주당+더불어시민당 155~178석, 미래통합당+미래한국당 107~130석 예측과도 거의 일치했다.
사진=열린뉴스김상민TV
김상민 동양미래대 로봇자동화공학부 겸임교수는 6일 자신의 블로그인 ‘열린뉴스김상민TV’를 통해 “빅데이터 ESM 선거예측시스템으로 이재명 47% vs 윤석열 38%로 9% 격차를 벌리며 이재명 당선 확실시”라고 이재명 후보의 당선을 전망했다.
지난 3일부터 여론조사 공표가 금지됐기에 각 후보의 지지율 추이를 더 이상 확인할 수 없다. 이에 김상민 교수는 구글과 네이버 검색어 트렌드를 통해 당선 후보를 전망했다. 그리고 “9% 격차로 오차 범위 밖에서 이재명 후보의 당선을 예측한다”고 했다.
그 이유로 “19대 대선보다 10.87% 높은 36.93%의 높은 사전투표율은 이재명에 대한 관심도와 사
전투표율의 상관 관계 매우 높다”면서 “전통적으로 민주당 지지가 높은 호남 지역에서는 전국 평균보다 훨씬 높은 50%대의 사전투표율을 보였다. 이는 진영간 결집을 보여주면서 한편으로는 이재명 지지층의 결집이 눈에 띄었다. 이 같은 결과는 지역별 사전투표율과 빅데이터 상에서 나타난 이재명 후보에 대한 상관 관계를 통해 확인할 수 있다”고 주장했다.
또한 “구글 트렌드에서의 이재명에 대한 관심도 순위 점수와 사전투표율과의 상관관계를 살펴보면 상관계수(1에 가까울 수록 상관도가 정비례하여 높고 -1에 가까울 수록 반비례하여 낮음)가 0.88로 매우 높은 상관관계가 있음을 알 수 있다. 이재명 후보에 대한 결집이 윤석열 후보의 결집보다 훨씬 높다고 볼 수 있다”고 덧붙였다.
이와 함께 김상민 교수는 “네이버의 빅데이터가 실시간 제공, 데이터 처리량 등에서 구글 빅데이터에 미치지 못한다. 또 네이버에서는 보수 언론 다수를 차지하는 형편과 신천지 등 종교단체의 댓글 부대 동원 의혹 등 상대적으로 이재명 후보에 대한 부정적 댓글 비중이 압도적으로 높아 ESM에서는 구글 빅 데이터 분석을 주로 하였다”며 네이버보다 구글을 중심으로 분석했다고 전했다.
이를 통해 예측된 결과는 이재명 47%, 윤석열 38%, 심상정 2.1%, 허경영 2.5% 득표율이었다. 김상민 교수는 “미국의 경우 미국 하원 선거에서 406개 선거구 중 404개의 선거구의 승패를 정확하게 예측한 바도 있다. 또 미국 언론에 의하면 2016년 트럼프와 힐러리의 대선, 2020년 트럼프와 바이든의 대선에서 승리를 예측한 것이 관심도의 측정이었다고 한다”며 이러한 트렌드 분석에 의한 예측이 신뢰도가 높다고 강조했다.
김상민 교수는 21대 총선 하루 전인 지난 2020년 4월 14일에도 ‘ESM 선거예측 모델을 이용한 4.15 총선 선거 결과’를 발표한 바 있다.
그는 더불어민주당+더불어시민당 총 171석(157+14석), 국민의힘 전신인 미래통합당+미래한국당 총 105석(90+15석)을 예측했다. 이는 실제 결과인 더불어민주당+더불어시민당 총 180석(163+17석), 미래통합당+미래한국당 총 103석(84+19석)과 비슷했다.
당시 방송3사 출구조사에서는 더불어민주당 139~158석, 더불어시민당 16~20석, 미래통합동 90~109석, 미래한국당 17~21석으로 더불어민주당+더불어시민당 155~178석, 미래통합당+미래한국당 107~130석 예측과도 거의 일치했다.
사진=열린뉴스김상민TV