Ondoku 도입으로 연구자의 부담 경감·효율적인 심포지엄 개최 실현! 국립민족학박물관 도입 사례 소개
2026년 1월 26일
- 국립민족학박물관
- 업종:박물관
- 소재지:오사카부 스이타시
- 인터뷰:X-DiPLAS 프로젝트 연구원 코바야시 님
목적·과제
문화인류학·민족학에 관한 영상 작품의 나레이션에서 사용. 세계에서 활약하는 연구자들의 목소리를 녹음해 왔으나, 온라인상으로는 녹음이 원활하지 않아 큰 수고가 발생하고 있었다.
해결책
연구자에 의한 음성 녹음을 폐지하고, Ondoku로 나레이션을 작성한다.
효과
연구자의 시간을 구속하며 몇 번이나 녹음할 필요가 없어져 업무 부담이 대폭 감소. 영상 작품을 제작하는 속도도 향상되어 타이트한 일정에도 대응할 수 있게 됨.
이 기사에서는 『Ondoku』의 도입 사례로서 오사카부 스이타시의 국립민족학박물관(민파쿠)에서의 활용 방법을 소개합니다.
기업·도입 부서 소개
코바야시 씨(이하 코바야시) 국립민족학박물관은 박물관 기능을 갖춘 문화인류학·민족학 연구소입니다. 세계 각국에 필드를 가진 연구자들이 소속되어 조사 결과를 널리 세상에 제공하고 있습니다. 또한 문화적 연구를 수행하는 「종합연구대학원대학」도 병설되어 있어, 박사 학위 논문 완성을 목표로 하는 학생들이 매일 배움을 심화하고 있습니다. 「민파쿠」라는 이름으로 친숙한 본 관은 2024년에 창설 50주년을 맞이했습니다.
저는 2022년도부터 시작된 X-DiPLAS(엑스디플라스)의 연구원으로서 활동하고 있습니다. X-DiPLAS란 문화인류학자나 고고학자가 세계에서 촬영한 사진을 데이터베이스화하여 국민이 자유롭게 열람할 수 있는 환경 구축을 목표로 하는 프로젝트입니다. 현재는 단순히 사진을 보관할 뿐만 아니라, 그것이 어떤 이야기를 담은 한 장인지 나타내는 「디지털 스토리」를 반영시키는 활동에 힘을 쏟고 있습니다.
HP:국립민족학박물관
문장 읽기 도구를 도입하게 된 배경에 대해 알려주세요.

코바야시 주로 연구자의 부담 경감을 목적으로 문장 읽기 도구를 도입했습니다.
저는 세계 각국의 문화인류학자·고고학자가 촬영한 사진을 데이터베이스화하여 국민에게 공개하는 활동을 계속하고 있습니다. 하지만 단순히 사진을 모으는 것만으로는 역사를 올바르게 계승했다고 할 수 없습니다. 사진에는 반드시 스토리가 있기 때문에, 연구자가 촬영 당시의 상황을 해설하는 「목소리」가 들어간 영상 작품의 제작이 필요합니다.
처음에는 세계의 연구자들과 연락을 취해 영상 작품용 목소리를 온라인상에서 녹음했습니다. 하지만 목소리의 지연이나 외부 소음 등이 원인이 되어 재녹음이 몇 번이나 발생하는 것이 문제였습니다. 연구자의 부담을 줄일 수 있는 것을 찾던 중, 글자를 입력하는 것만으로 「목소리」를 만들 수 있는 문장 읽기 도구를 알게 된 것이 계기입니다.
Ondoku 도입에 이르게 된 경위를 여쭤봐도 될까요?
코바야시 저는 문장 읽기 도구와 같이 AI를 사용하는 시스템에 거부감을 가지고 있었습니다. 어딘가 현실과 동떨어진 목소리에 위화감을 느끼고 있었거든요. 하지만 Ondoku의 음성은 내추럴하여 연구자의 나레이션을 대체하기에 최적이라고 느껴지는 부분이 있었습니다.
또한 가성비가 뛰어난 점도 평가 대상입니다. 사용 편의성과 요금의 균형이 좋아 제한된 예산 내에서도 충분한 활약을 해주고 있습니다.
Ondoku 도입 전과 비교하여 과제는 해결(개선)되었습니까?

코바야시 연구자의 부담 경감뿐만 아니라 원활하게 영상 작품을 만들 수 있게 되었습니다.
연구자의 시간을 구속하게 되는 녹음 작업은 저희 입장에서도 부정적인 업무 중 하나였습니다. Ondoku 덕분에 연구자와의 커뮤니케이션이 원활해진 것은 큰 진전입니다. 게다가 고퀄리티의 음성이 글자를 입력하는 것만으로 완성되므로, 영상 작품을 만드는 속도 향상에도 기여하고 있습니다.
저희는 프로젝트를 추진하기 위한 심포지엄을 정기적으로 개최하고 있습니다. 발표에 필요한 자료 제작도 Ondoku를 활용하여 원활하게 착수할 수 있었습니다. 심포지엄까지의 준비 기간이 촉박할 때일수록 Ondoku의 활약이 크다는 것을 느끼고 있습니다. 실제로 제작이 몰리는 기간에는 거의 매일 Ondoku를 이용하고 있습니다.
연구에서의 활용 외에 Ondoku가 도움이 된 사례가 있다면 알려주세요.

코바야시 Ondoku의 도입으로 나레이션용으로 만드는 문장의 질이 향상되었습니다.
문장을 쓰다 보면 나도 모르게 불필요한 표현을 추가하게 되어 문장이 길어질 때가 있습니다. 사실 Ondoku에 불필요하게 긴 문장을 입력하면 제대로 읽어주지 않거든요. 마치 사람처럼 말을 하기 때문에 숨을 쉬는 타이밍 등에 위화감을 느낄 때가 있습니다.
목소리에 의지해 표현을 재검토한 후 다시 시도하면, 질 높은 문장이 완성되어 있다는 것을 깨닫게 됩니다. 단순히 음성을 읽어주는 것뿐만 아니라, 깔끔하고 명확하게 전달되는 문장을 만들 수 있는 것도 Ondoku의 매력입니다.
Ondoku에 대한 추가적인 개선 요청 사항이 있다면 꼭 알려주세요.

코바야시 해외를 필드로 하는 연구자 입장에서는 스와힐리어의 추가가 있다면 좋겠습니다. 스와힐리어는 아프리카 내에서도 통용 범위가 넓은 언어이므로, 라인업에 있다면 작업의 폭이 넓어질 것 같습니다.
물론 더욱 원활한 활용을 위해 억양 제어 등의 시스템 개선이 이루어지면 좋을 수도 있겠지만, 너무 기능 중심적이면 심플한 조작성이 훼손될 가능성이 있지요. 요금을 포함한 밸런스를 생각했을 때, 현재의 인터페이스가 딱 적당한 선이 아닐까 느끼고 있습니다.
앞으로는 Ondoku를 어떻게 사용하고 싶으신가요?

코바야시 교육 활동 중에도 Ondoku를 활용하는 장을 늘려가고 싶습니다.
박물관에 병설된 대학 학생들에게 짧은 영상 작품을 만드는 과제를 내줄 때가 있습니다. 과제 발표 시 작품의 퀄리티를 높이는 수단 중 하나로 Ondoku를 통한 나레이션 도입을 권장한 적이 있었습니다. 학생들도 쉽게 사용할 수 있는 Ondoku라면 수업에서 도움되는 상황이 많을 것으로 생각합니다.
또한 Ondoku의 매력인 외국어 대응을 향후 활동에 살려가고 싶습니다. 현재 해외 연구자가 만든 영문 번역 나레이션을 사용하여 새로운 영상 작품을 만들어 나갈 계획이 있습니다.
외부에 영어 음성 녹음을 의뢰한다면 예산이 아무리 많아도 부족할 것입니다. Ondoku라면 압도적인 비용 절감에 기여해 줄 것입니다. 앞으로도 Ondoku를 활용하여 연구자들의 목소리를 담아내는 활동을 지속해 나가고 싶습니다.
Ondoku의 활용으로 연구자가 직접 녹음하는 부담을 줄였을 뿐만 아니라, 영상 작품 제작에 드는 시간적 비용도 절감할 수 있었군요! 훌륭한 사례를 공유해 주셔서 감사합니다.


■ AI 음성 합성 소프트웨어 「Ondoku」
Ondoku는 초기 비용 0으로 사용할 수 있는 온라인 텍스트 음성 변환 도구입니다.
- 일본어, 영어, 중국어, 한국어, 스페인어, 프랑스어, 독일어 등 약 50개 언어에 대응
- PC·스마트폰 어느쪽에서도 이용 가능
- 비즈니스·교육·엔터테인먼트 등의 용도에 대응
- 설치가 필요없고 브라우저에서 즉시 사용 가능
- 화상으로부터의 독해에도 대응
이용 방법은 사이트에서 텍스트를 입력하거나 파일을 업로드할 뿐. 몇 초 안에 자연스러운 오디오 파일이 생성됩니다. 5,000자까지의 음성 합성이라면 무료로 이용할 수 있으므로, 우선은 한번 시험해 주세요.
Email: ondoku3.com@gmail.com
텍스트 음성 변환 소프트웨어 Ondoku. 설치할 필요 없이 누구나 무료로 이용할 수 있는 텍스트 음성 변환 서비스입니다. 무료 등록을 하면 매월 5000자까지 무료로 할 수 있습니다 지금 무료 등록
