고아침
고아침 · 정보처리기사
2021/10/05
🔍 지난 쏘프라이즈 선정작입니다.

(낚시 제목 죄송합니다) 이 글에서는 감염병보도준칙을 자연어처리 과업으로 어떻게 변환할 수 있을지 졸견을 
적은 뒤, 그 중 한 예로써 기사 표제에 사용되는 표현에 근거한 간단한 보도 기사 분석을 담았습니다. 

문제 정의


제시된 문제는 특정한 백신 관련 보도가 한국기자협회에서 제시하는 감염병보도준칙에 충실한지를 기사 내용에서 정량적으로 판단할 수 있는지, 있다면 그 기준은 구체적으로 어떤 것일지에 관한 것으로 이해됩니다. 다시 말해 기사 본문 및 관련된 메타데이터를 입력으로 받아 해당 기사가 보도준칙에 준하는지 위배되는지를 일련의 규칙 또는 통계적 기법으로 예측하는 자연어처리 문제로 생각합니다.
감염병보도준칙은 여러 원칙으로 구성된 목록이기 때문에 각 항목을 살펴보며 코로나19 백신 보도라는 맥락에서 자연어처리 기법으로 '번역'할 수 있을지 생각해보았습니다. 제가 전산언어학이나 언론연구 전문가는 아니므로 제 판단에 오류가 많이 있을 수도 있음을 감안하여 읽어주시고, 여러 제언도 환영합니다.

감염병보도준칙 출처: 한국기자협회(http://www.journalist.or.kr/news/section4.html?p_num=17)

■ 기본 원칙 1. 감염병 보도의 기본 내용 
가. 감염병 보도는 해당 병에 취약한 집단을 알려주고, 예방법 및 행동수칙을 우선적, 반복적으로 제공한다.
-> 질병관리청 등 권위 있는 출처 또는 분야 전문가에 의거해 취약 집단(노인층, 호흡기질환자, 재활병원, 장애인 복지시설, 교정기관 등)과 예방법, 행동수칙(거리두기, 마스크 착용, 손 씻기, 손 소독, 얼굴 만지지 않기 등)에 관련된 키워드 목록을 작성할 수 있을 것입니다. 이 목록을 사용해 해당 키워드가 기사 본문에 포함되는지 여부를 판단할 수 있습니다.
다만 감염병을 다루는 모든 기사에 위 내용이 들어가야 한다고 보기는 어려울 것 같습니다. 대신 예를 들어 각 언론사가 일정 기간 동안 특정 감염병에 관련해 내놓은 보도 중 취약 집단, 예방법, 행동수칙 키워...
얼룩패스
지금 가입하고
얼룩소의 모든 글을 만나보세요.
이미 회원이신가요? 로그인
15
팔로워 151
팔로잉 8