이하의 내용은 개괄적인 정보입니다. 보다 상세한 내용은 QnA 형식으로 [SBS×Underscore] FAQ 에서 확인하실 수 있습니다.
<aside> 📊 Poliscore #1 - 여론조사로 보는 여론
</aside>
현재 국내에는 30개 이상의 조사업체들이 전국 단위 대선 후보 여론조사를 진행하고 있습니다. 다만 조사 방식, 가상번호 사용 여부, 샘플링 방식 등에 따라 동일한 날짜에 진행한 조사에서도 서로 다른 결과가 보고되고는 합니다.
서로 다른 여론조사 결과를 취합하는 가장 단순한 방식은 **단순 평균(simple average)**입니다. 그러나 이는 다음의 문제에 효과적으로 답하지 못합니다.
이에 저희 언더스코어는 상태공간모형(State Space Model, SSM) 혹은 칼만필터라는 기법을 활용하여 여론조사 정보들을 취합 중입니다.
1960년에 처음 발표된 칼만필터는 측정하려는 대상과 관련해 확률적인 오차가 포함되고, 특정 시점에서의 상태가 이전 시점과 관계가 있는 상황에서 통계적인 잡음(noise)에 흔들리지 않고 현재의 상태를 추정하기 위해 도입된 기법입니다.
가령, 우주에 내보내는 로켓의 엔진 온도를 실시간 추정하고자 할 때, 우리는 높은 엔진 온도로 인해 이를 직접 측정할 수 없습니다. 센서가 녹아내리기 때문이죠. 결국 센서는 엔진 외부 표면에 부착되고, 우리는 이러한 오차(error)를 감안해서 실시간으로 직접 관찰 가능하지는 않은(unobservable) 정보를 실시간으로 추정해야 합니다. 이 때 사용되는 기법이 칼만필터입니다.
여론조사 역시 이와 유사합니다. 여론조사의 참값(true value)을 알 수 없다고 했을 때, 만약 서로 다른 조사 결과들의 중간 어딘가에 그 값이 위치한다고 가정한다면, 우리는 이를 간접적으로 추정해 볼 수 있습니다.
언더스코어의 상태공간모형이 추정에 사용하는, 혹은 서비스에서 하위집합(subset)을 통해 선택하여 시각화하는 변수는 다음과 같습니다.
<aside> 👩🏻💻 Poliscore #2 - 온라인 패널 댓글 여론 추세
</aside>
<aside> 🗞️ Poliscore #3 - 포털 별 동일 기사 여론 차이 분석
</aside>