조각모음

라이뷰

조각모음

아기 울음소리, 인구 감소, 국어사전, 체불사업주, 모바일 게임

조각모음
조각모음 · 흥미로운 데이터셋을 모아서 소개합니다
2022/08/25
사진: Minnie Zhou (Unsplash 제공)

아기 울음소리

헝가리 출신의 애아빠 거보르 베레시는 2015년 영국에 스타트업을 세워 룰라본드(Lullabond)라는 앱을 만들고자 했습니다. 아기 울음소리를 분석해 그 의미(배고픔, 배아픔, 피곤함 등)를 해석해주는 앱이었습니다. 앱이 작동하기 위해서는 실제 아기 울음소리 표본과 각각의 표본이 어떤 의미를 갖는지 분류해둔 데이터가 대량으로 필요했고, 베레시의 회사는 도네이트-어-크라이(Donate-a-cry, ‘울음기증’)라는 공개 캠페인(유튜브)을 통해 이 데이터를 확보하고자 했습니다. 사용자들이 데이터 수집용 앱을 통해 아기 울음소리와 성별, 나이, 아기가 운 이유 등을 제출하면, 그 데이터 1만 건을 모아 울음소리 분석 앱을 완성하고 어린이 음성 연구를 위해 데이터를 공개 기증하겠다고 한 것입니다. 최종적으로 수집정제가 완료된 울음소리 표본은 457건이었고, 앱은 결국 완성되지 않은 것으로 보입니다. 베레시는 그럼에도 불구하고 울음소리 데이터를 연구용으로 기증하겠다는 약속만큼은 지켰습니다. Donate-a-cry 말뭉치는 깃헙에서 다운로드받을 수 있고, 각 오디오 파일 이름에 아기의 성별, 나이, 운 이유(배고픔, 트림하고 싶음, 배아픔, 불편함, 피곤함) 등이 표기되어 있습니다.

함께 볼 자료: 한국 스타트업 디플리가 정부 지원을 받아 구축한 비언어 발성 데이터셋은 12-65세 사이의 발화자가 녹음한 기침 소리, 하품, 우는 소리, 웃는 소리 등 16가지 비언어적 소리를 담았습니다. (설명자료-pdf) 전체 자료는 유료이지만 샘플 자료(727건)는 저작자표시-비영리-변경금지를 조건으로 공개하고 있습니다. 다운로드 링크.


얼룩패스
지금 가입하고
얼룩소의 모든 글을 만나보세요.
이미 회원이신가요? 로그인