<aside> 📌
개발 배경
</aside>
<aside> 🧑🏻💻
개발 방향성 및 차별화 포인트
</aside>
이러한 기존 서비스들의 한계를 바탕으로 언더스코어는 <학술연구DB 기반 질문봇>을 개발했습니다. 저희의 문제의식은 크게 두 가지입니다.
이와 관련해 언더스코어는 일찍이 지난 2023년 상반기, 교육부 사회부총리실과의 용역 연구에서 정부출연연구기관의 보고서들이 기록되어 있는 NKIS와 지자체의 연구 보고서들이 기록되어 있는 PRISM, 두 개의 DB에 기초하여 유저의 질문에 답하는 정책 질의응답봇을 간단하게 개발한 바 있습니다.
아주 초보적인 수준이기는 하나, 이처럼 외부 보고서 데이터를 직접 접근함으로서 환각(hallucination) 현상으로 인해 존재하지 않는 문헌을 지어내는 상황을 예방하는 경험을 바탕으로, 언더스코어는 지난 2024년 여름, 보다 뛰어난 성능의 <학술연구DB 기반 논문 리뷰 솔루션>을 개발했습니다.
저희가 개발한 본 술루션은 유저가 자유롭게 작성한 연구 질문을 3~4가지의 하위 질문으로 분할하고, 그에 걸맞는 학술 연구들을 조합하여 최종적으로 연구 보고서를 작성합니다.
연구 보고서 생성은 LLM이 수행하나, 학술논문 검색·수집·분석은 이와 분리된 별도의 엔진에 의해 진행되기에 존재하지 않는 가짜 출처를 허위 생성하는 문제가 발생하지 않습니다. 질문 입력부터 최종 보고서 응답 생성까지는 약 20분의 시간이 소요되며, 각 링크의 답변 내용은 약 1.5만자 분량입니다.
또한 네트워크 분석을 바탕으로 인용의 중심부에 있는 논문을 더 우선순위로 선별하고, 약탈적 학술지(predatory journal)에 게재된, 낮은 수준의 연구들을 필터링하는 과정 역시 포함되어 있기에, 실제로 석·박사 학위 이상의 고숙련 전문가들의 문헌·자료 조사와 같은 성능의 보고서 생성 자동화가 가능해집니다.
덕분에 저희는 6개월 이후 출시된 OpenAI의 Deep Research보다도 훨씬 높은 성능의 학술 자료 기반 답변을 얻는 서비스를 설계할 수 있었습니다.
한국 경제가 부동산 가격으로 지탱되고 있고, 이로 인해 가계 부채나 금리 인상에서의 제약 등 여러 문제가 생긴다는 지적이 있어. 구체적으로 어떤 문제가 발생할 수 있고, 이를 어떻게 해결해 볼 수 있을까?
아래는 동일하게 위의 부동산 관련 질문을 했을 때의 OpenAI Deep Research와 저희 서비스의 답변 결과를 비교한 결과입니다. (*Deep Research는 하위 질문 4개를 자동 생성하지 않기에 직접 입력함)
현재 언더스코어는 학술 DB에 등록된 해외 학술 논문들만을 바탕으로 응답을 제공하고 있습니다. 지난 2024년 여름부터 매일 약 1,000건 가량 수집 중인 외신 기사 본문들, 매월 400여개 씩 수집 중인 씽크탱크, 국제기구, 컨설팅펌의 연구보고서와 매일 900여개 씩 축적되는 외신 뉴스 데이터, 국내 부처·정부출연연구기관들이 작성한 연구보고서(NKIS, PRISM) DB를 함께 활용할 수도 있기에 서비스의 확장 방향성은 열려있습니다.
<aside> 📒
실제 활용 예시
</aside>