<aside> 📌
서비스 디자인 초안 및 구조도
</aside>
<aside> 💻
서비스 작동 원리
</aside>
Step 1 : 자료 수집 및 데이터 전처리(유형화)
기존에 BigKinds에 정기적으로 적재되고 있는 지역 언론 기사들과 별개로, 각 지자체별 지방 의회 회의록 및 지방연구원의 연구자료들을 외부에서 추가로 수집
각 기사/회의록/연구자료 텍스트에 개체명인식(NER) 알고리즘을 적용해 어떠한 지역을 언급했는지 확인
이후 특정 주기 ex. 일(day), 주(week) 마다 수집된 텍스트에 대해 유형화(clustering) 작업을 실시. 이는 해당 기간에 발생한 지역별 이슈들의 유형(토픽)을 파악하기 위함. 단, 아래의 예시 이미지에서 볼 수 있듯, 각 이슈 토픽은 서로 다른 출처의 자료들로 구성되며, 일부 이슈에서는 특정 유형의 자료가 누락되어있을 수 있음.
가령 **빨간색 점(×)**은 지역언론사 기사, **초록색 점(×)**은 회의록, **하늘색 점(×)**은 연구보고서를 의미한다고 할 때, 이슈 #1/2/3에는 서로 다른 유형의 자료들이 모두 포함되어있지만, 이슈 #4를 다룬 지역 신문 기사들은 하나도 없음. 이처럼 지역 언론사들이 누락하지만 중요하다고 파악되는 이슈를 별도 DB에 기록해둘 수 있을 것.
뿐만 아니라, 이 유형화 작업은, 기술적으로 서로 다른 소스의 자료를 **매칭(matching)**하는 작업으로도 볼 수 있음. 그렇기에 여러 유형의 자료들이 포함된 이슈들에서도 언론이 다룬 포인트와 회의록, 연구보고서가 다룬 포인트가 어떻게 서로 같고 다른지 역시 판단하고 기록할 수 있게 됨.
Step 2 : 지역 이슈 큐레이션 컨텐츠 서비스 (2025 하반기)
위 Step 1에서 수집 및 이슈 유형화가 안정적으로 진행된다면, 큐레이션 컨텐츠 서비스를 운영하기 위해 다음의 변수들을 추가적으로 추출·생성해야 함.
Step 3 : 지역 언론사 심층 취재 정보 제공 (2026 상반기)
첫 해에는 BigKinds 페이지 내 큐레이션 서비스 운영에 집중한다면, 차년도 사업부터는 지역언론 종사자들에게 보다 심층적인 취재 정보를 제공하는데까지 서비스를 확장할 수 있음