<aside> 📌
데이터 수집 및 가공
</aside>
계엄 발표일인 2024년 12월 3일을 기준으로 전후 10일인 2024.11.23.부터 2024.12.13.까지 포털(네이버)에 업로드된 모든 주요 뉴스 데이터 370,449건을 수집
수집 대상 언론사 수는 총 60개로, 구체적인 리스트는 다음과 같음
JTBC, KBS, MBC, MBN, SBS, SBS Biz, TV조선, YTN, kbc광주방송, 강원도민일보, 강원일보, 경기일보, 경향신문, 국민일보, 국제신문, 노컷뉴스, 농민신문, 뉴스1, 뉴시스, 대전일보, 더팩트, 데일리안, 동아일보, 디지털데일리, 디지털타임스, 마이데일리, 매일경제, 매일신문, 머니S, 머니투데이, 문화일보, 부산일보, 서울경제, 서울신문, 세계일보, 스포츠동아, 스포츠서울, 시사저널, 아시아경제, 아이뉴스24, 연합뉴스, 연합뉴스TV, 오마이뉴스, 이데일리, 이코노미스트, 전자신문, 조선비즈, 조선일보, 조세일보, 중앙일보, 지디넷코리아, 채널A, 파이낸셜뉴스, 프레시안, 한겨레, 한국경제, 한국경제TV, 한국일보, 헤럴드경제, 헬스조선
데이터 수집 범위는 제목, 날짜, 요약문, 언론사명, 댓글 수, 댓글 내용
실제 댓글 텍스트의 경우, 각 날짜마다 가장 댓글 수가 많았던 상위 2%의 기사들 (총 4,298건)을 선정해, 해당 기사들에 작성된 순공감순 기준 Top 10 댓글들을 수집함. 이렇게 수집된 댓글들의 수는 총 42,980건 (4,298개 기사 × 상위 10개 댓글)
이 때 각 댓글들이 윤석열 대통령(의 계엄)을 비판하고 탄핵을 찬성하는지, 아니면 반대로 계엄을 지지하고 탄핵에도 반대하는지 분류(classification)하기 위해 대규모언어모델(LLM, Large Language Model)을 활용함. 한글 텍스트를 매우 높은 성능으로 처리할 수 있는 Claude 3.5 Sonnet 모델을 활용한 결과, 아래와 같이 매우 효과적으로 분류가 가능하다는 사실을 확인했음. 아래 예시 댓글들에는 표기되어 있지 않지만, 만약 옹호/비판 여부를 판별할 수 없거나 무관한 댓글일 경우 “관련 없음”으로 별도 분류함.
[속보] 이재명 "尹, 불법적이고 위헌적인 반국민적 계엄 선포
댓글 내용 | LLM 분류 결과 |
---|---|
민주화되고나서 군통수권자가 계엄이라니 정신나간듯하네요 | 윤석열 비판 · 탄핵 찬성 |
기왕 계엄령 선포한 김에 더불범죄당 소탕 좀 해라. | 윤석열 옹호 · 탄핵 반대 |
니 때문이잖아 범죄자 찢재명 언제까지 방탄놀이할래 | 윤석열 옹호 · 탄핵 반대 |
국회 앞 4천명 모여…계엄군, '가결' 2시간 반 만에 철수(종합2보)
댓글 내용 | LLM 분류 결과 |
---|---|
19% 지지자가 80% 국민을 상대로 계엄을 선포하다니ㅉㅉㅉ | 윤석열 비판 · 탄핵 찬성 |
시민이래고해서 발빠르다했더니 민주노총,금속노조등이구먼,,, | 윤석열 옹호 · 탄핵 반대 |
내란 수괴 맷돼지 즉각 체포해라. | 윤석열 비판 · 탄핵 찬성 |
“결국 국민이 이긴다…윤석열 탄핵” 밤새 국회를 울렸다 [영상]
댓글 내용 | LLM 분류 결과 |
---|---|
결국 국민은 승리한다...내란 반란 수괴와 국짐은 공동정범이다 | 윤석열 비판 · 탄핵 찬성 |
탄핵안도 폐기되었지만 국짐도 이제 국민 마음 속에서 영원히 폐기됐다 | 윤석열 비판 · 탄핵 찬성 |
당론을 따른 을사오적들은 역사에 영원히 기록되었다는 것만 알아라 | 윤석열 비판 · 탄핵 찬성 |
법무장관·경찰청장 탄핵안 가결…직무정지
댓글 내용 | LLM 분류 결과 |
---|---|
지금 민주당이 하는 짓이 내란 아니냐? 지금 다들 장난해? | 윤석열 옹호 · 탄핵 반대 |
난 암만봐도 민주당하는짓이 내란같은데..?국가기능 중단이잖아? | 윤석열 옹호 · 탄핵 반대 |
이게 나라야 대통령이 얼마나 답답했으면 비상계엄을 선포 했겠냐? | 윤석열 옹호 · 탄핵 반대 |
또한 제로샷 토픽 분류(Zero-shot Topic Classification) 알고리즘에 기반해 각 뉴스의 제목 및 요약 텍스트를 바탕으로 해당 기사가 정치·사회적 사안을 다루는지 역시 판별함
기사 제목 | 정치·사회 이슈 소재일 확률 |
---|---|
이 와중에 계파 싸움…친윤, 권성동 원내대표로 밀어 | 99.87% |
[이 시각 국회 상황] '김 여사 특검법, 표결 시작 | 99.91% |
윤 대통령, 국회 방문 없었다…우원식 "방문 자제" | 99.86% |
: | : |
“미래교육 新모델 찾자”… 유네스코 포럼 개막 | 0.030% |
일상이 행복해지는 습관… ‘부산행복 마일리지’ 시범사업, 5만명 모집 | 0.027% |
구리시 ‘발달장애인 e스포츠 선수단 G1(GURI NO. 1) 양성과정’, 道 우수 | 0.022% |
<aside> 📊
기술 통계
</aside>
계엄 발표 시점 (2024. 12. 03. 10:23PM) 전후로 기초적인 기술 통계를 정리하자면 다음과 같음
계엄 | 속보 보도율 | 단독 보도율 | 일 평균 기사 수 | 기사 당 평균 댓글 수 |
---|---|---|---|---|
BEFORE (이전 10일) | 1.38% | 0.43% | 16,058건 | 9.04개 |
AFTER (이후 10일) | 5.07% | 0.50% | 17,618건 | 26.04개 |
통신사 (연합뉴스, 뉴스1, 뉴시스, YTN) | 속보 보도율 | 단독 보도율 | 기사 당 평균 댓글 수 |
---|---|---|---|
BEFORE (계엄 이전 10일) | 1.12% | 0.14% | 4.41개 |
AFTER (계엄 이후 10일) | 3.31% | 0.16% | 11.51개 |
非통신사 언론사들 | 속보 보도율 | 단독 보도율 | 기사 당 평균 댓글 수 |
---|---|---|---|
BEFORE (계엄 이전 10일) | 1.50% | 0.58% | 11.25개 |
AFTER (계엄 이후 10일) | 5.93% | 0.66% | 33.15개 |
앞서 소개한 ZSC 알고리즘을 통해 정치·사회 소재 기사라고 판별 (분류 확률 50% 이상) 된 72,997건을 분석한 결과, 계엄 전후로 단독 보도율이 가장 높은 상위 10개 언론사의 순위는 다음과 같이 변화했음
BEFORE (계엄 이전 10일)
언론사명 | 단독 보도율 |
---|---|
JTBC | 3.88% |
서울신문 | 3.75% |
채널A | 3.38% |
조선일보 | 3.28% |
동아일보 | 2.85% |
한겨레 | 2.17% |
한국일보 | 2.08% |
TV조선 | 1.63% |
중앙일보 | 1.44% |
경향신문 | 1.24% |
AFTER (계엄 이후 10일)
언론사명 | 단독 보도율 |
---|---|
채널A | 5.38% |
JTBC | 3.76% |
동아일보 | 3.40% |
중앙일보 | 2.66% |
한겨레 | 2.21% |
TV조선 | 2.17% |
한국일보 | 1.83% |
시사저널 | 1.81% |
경향신문 | 1.74% |
연합뉴스TV | 1.41% |
계엄 전후, 시간에 따른 댓글 수 추세 변화 역시 인상적이었는데, 계엄 이전 동안 계속 감소 중이던 기사 당 평균 댓글량은 계엄 발표 이후 급격히 증가함. 단순히 댓글량이 두 배 급증한 것 (p<.001) 이외에도, 그 이후 10일 간 댓글량이 매일 증가하는 방향으로 추세 역시 기존과 반전됨 (p<.001)
<aside> 📰
어떤 기사를 작성해야 사람들의 반응을 이끌어내는데에 유리했을까?
</aside>
우리가 기사당 실제 조회수를 알 수는 없었지만, 각 기사에 작성된 댓글의 양은 해당 기사가 얼마나 독자들의 반응을 이끌어냈는지를 알 수 있게끔 돕는 훌륭한 대리 변수(proxy variable)임.
분석 결과, 익히 알려진 바와 같이 속보일수록(p<.001), 단독 보도일수록(p<.001), 정치·사회 뉴스일수록(p<.001) 더 많은 댓글이 작성된 것으로 나타났음. 그러나 계엄 이후 속보, 단독, 정치 뉴스 여부의 효과는 각각 3배, 3.6배, 3.2배로 더욱 더 강력하게 증가했음.
이 때, “(기자 입장에서) 과연 자신이 기사를 쓸 때, 해당 시점에서 이미 다른 기사에서 다뤄지는 주제들을 유사하게 커버할 수록 얼마나 독자 반응을 증가시키는데 도움이 되는가?”라는 질문을 던져볼 수도 있을 것. 이에 0점에서 100점 사이로 정의되는 “동시간대 타 기사들과의 유사도”를 다음의 절차를 거쳐서 계산함
분석 결과, 계엄 이전에도 타 기사들과의 유사도가 높을수록 독자들의 댓글이 더 많아지는 양의 상관관계가 관찰되었지만(p<.01), 이러한 경향성이 계엄 이후에 더욱 더 가팔라졌음(p<.001). 즉, 개별 기자들 입장에서는 빠르게 각 시기의 이슈들을 팔로우업하는 것이 기사 반응 유도에 유리했을 것.
<aside> ⌨️
첫 탄핵안 부결 이후 온라인 공간의 여론 지형은 어떻게 변했을까?
</aside>