Giảm bớt gánh nặng cho nghiên cứu viên và tổ chức hội thảo hiệu quả nhờ triển khai Ondoku! Giới thiệu trường hợp thực tế tại Bảo tàng Dân tộc học Quốc gia
Ngày 26 tháng 1 năm 2026
- Bảo tàng Dân tộc học Quốc gia
- Ngành nghề: Bảo tàng
- Địa điểm: Thành phố Suita, tỉnh Osaka
- Phỏng vấn: Nghiên cứu viên dự án X-DiPLAS, Ông/Bà Kobayashi
Mục đích/Vấn đề
Sử dụng làm lời bình (narration) cho các tác phẩm video về nhân học văn hóa và dân tộc học. Trước đây, chúng tôi thường nhờ các nghiên cứu viên đang hoạt động trên thế giới thu âm giọng nói, nhưng việc thu âm trực tuyến không diễn ra suôn sẻ, gây ra rất nhiều khó khăn và tốn kém công sức.
Giải pháp
Ngừng việc để nghiên cứu viên trực tiếp lồng tiếng và chuyển sang tạo lời bình bằng Ondoku.
Hiệu quả
Không còn làm mất thời gian của nghiên cứu viên và không cần phải thu âm đi thu âm lại nhiều lần, giúp giảm bớt đáng kể gánh nặng công việc. Tốc độ sản xuất các tác phẩm video cũng được cải thiện, giúp chúng tôi đáp ứng được cả những lịch trình dày đặc.
Trong bài viết này, chúng tôi xin giới thiệu cách ứng dụng Ondoku như một ví dụ điển hình tại Bảo tàng Dân tộc học Quốc gia (Minpaku) ở thành phố Suita, tỉnh Osaka.
Giới thiệu doanh nghiệp và bộ phận triển khai
Ông Kobayashi (sau đây gọi là Kobayashi): Bảo tàng Dân tộc học Quốc gia là một viện nghiên cứu về nhân học văn hóa và dân tộc học, có chức năng của một bảo tàng. Đây là nơi làm việc của các nghiên cứu viên có địa bàn khảo sát trên toàn thế giới, nhằm cung cấp rộng rãi các kết quả nghiên cứu cho xã hội. Ngoài ra, bảo tàng còn có "Đại học Nghiên cứu Sau đại học Tổng hợp" dành cho các nghiên cứu văn hóa, nơi các sinh viên đang nỗ lực học tập để hoàn thành luận án tiến sĩ. Bảo tàng chúng tôi, thường được gọi thân mật là "Minpaku", đã kỷ niệm 50 năm thành lập vào năm 2024.
Tôi đang hoạt động với tư cách là nghiên cứu viên của dự án X-DiPLAS, bắt đầu từ năm tài chính 2022. X-DiPLAS là dự án nhằm xây dựng môi trường cho phép người dân tự do xem cơ sở dữ liệu về các bức ảnh do các nhà nhân học văn hóa và khảo cổ học chụp trên khắp thế giới. Hiện tại, chúng tôi không chỉ lưu trữ ảnh mà còn tập trung vào hoạt động phản ánh các "digital story" (câu chuyện kỹ thuật số) để thể hiện ý nghĩa và câu chuyện đằng sau mỗi bức ảnh.
HP: Bảo tàng Dân tộc học Quốc gia
Xin ông cho biết bối cảnh dẫn đến việc triển khai công cụ đọc văn bản.

Kobayashi: Mục đích chính của việc triển khai công cụ đọc văn bản là để giảm bớt gánh nặng cho các nghiên cứu viên.
Tôi đang tiếp tục hoạt động xây dựng cơ sở dữ liệu ảnh do các nhà nhân học văn hóa và khảo cổ học trên toàn thế giới chụp để công bố cho người dân. Tuy nhiên, nếu chỉ thu thập ảnh thì không thể nói là đã kế thừa lịch sử một cách đúng đắn. Vì mỗi bức ảnh luôn có một câu chuyện riêng, nên cần phải sản xuất các tác phẩm video có kèm theo "giọng nói" giải thích về hoàn cảnh lúc chụp của nghiên cứu viên.
Ban đầu, chúng tôi liên lạc với các nghiên cứu viên trên thế giới và thu âm giọng nói cho video trực tuyến. Tuy nhiên, do độ trễ của âm thanh hoặc tiếng ồn từ môi trường bên ngoài, việc thu âm lại phải thực hiện nhiều lần, đó là một vấn đề lớn. Trong lúc tìm kiếm giải pháp giúp giảm gánh nặng cho nghiên cứu viên, tôi đã biết đến công cụ đọc văn bản có thể tạo ra "giọng nói" chỉ bằng cách nhập chữ.
Ông có thể cho biết quá trình dẫn đến việc lựa chọn Ondoku không?
Kobayashi: Trước đây, tôi vốn không có cảm tình với các hệ thống sử dụng AI như công cụ đọc văn bản. Tôi luôn cảm thấy có gì đó không tự nhiên, xa rời thực tế ở những giọng nói đó. Tuy nhiên, giọng nói của Ondoku rất tự nhiên, khiến tôi cảm thấy đây là lựa chọn tối ưu để thay thế lời bình của các nghiên cứu viên.
Ngoài ra, hiệu quả chi phí (cost performance) cũng là một yếu tố để chúng tôi đánh giá cao. Sự cân bằng giữa tính dễ sử dụng và mức giá rất tốt, giúp công cụ này phát huy hiệu quả tối đa ngay cả trong phạm vi ngân sách hạn chế.
So với trước khi triển khai Ondoku, các vấn đề đã được giải quyết (cải thiện) như thế nào?

Kobayashi: Không chỉ giảm gánh nặng cho nghiên cứu viên, chúng tôi còn có thể sản xuất các tác phẩm video một cách trôi chảy hơn.
Công việc thu âm làm mất thời gian của các nghiên cứu viên vốn là một trong những việc gây áp lực cho chúng tôi. Nhờ có Ondoku, mối quan hệ hợp tác với các nghiên cứu viên đã trở nên tốt đẹp hơn, đây là một bước tiến lớn. Thêm vào đó, vì có thể tạo ra âm thanh chất lượng cao chỉ bằng cách nhập văn bản, công cụ này cũng góp phần nâng cao tốc độ sản xuất video.
Chúng tôi thường xuyên tổ chức các hội thảo chuyên đề (symposium) để thúc đẩy dự án. Việc chuẩn bị các tài liệu cần thiết cho buổi thuyết trình cũng diễn ra suôn sẻ hơn nhờ ứng dụng Ondoku. Đặc biệt là khi thời gian chuẩn bị cho hội thảo bị thắt chặt, tôi càng cảm nhận được tầm quan trọng của Ondoku. Thực tế, trong những giai đoạn cao điểm sản xuất, tôi sử dụng Ondoku hầu như mỗi ngày.
Ngoài việc ứng dụng trong nghiên cứu, ông có thể chia sẻ thêm ví dụ nào mà Ondoku đã giúp ích không?

Kobayashi: Việc triển khai Ondoku đã giúp nâng cao chất lượng các văn bản soạn thảo cho lời bình.
Khi viết văn bản, đôi khi chúng ta vô tình thêm vào những biểu đạt dư thừa, khiến câu văn trở nên quá dài. Thực tế là nếu nhập một đoạn văn dài bất hợp lý vào Ondoku, nó sẽ không thể đọc một cách trôi chảy được. Vì Ondoku phát âm giống như con người, nên đôi khi chúng ta sẽ thấy sự bất ổn trong nhịp ngắt nghỉ lấy hơi.
Dựa vào giọng đọc đó, tôi xem xét lại cách diễn đạt và thử lại, từ đó nhận ra rằng mình đã tạo ra được những văn bản chất lượng cao hơn. Không chỉ đơn thuần là đọc to âm thanh, khả năng giúp tạo ra những câu văn súc tích, dễ hiểu cũng là một điểm hấp dẫn của Ondoku.
Ông có yêu cầu cải tiến thêm nào đối với Ondoku không?

Kobayashi: Dưới góc độ của một nghiên cứu viên làm việc ở nước ngoài, tôi sẽ rất vui nếu có thêm tiếng Swahili. Tiếng Swahili là ngôn ngữ được sử dụng rộng rãi tại châu Phi, nên nếu có trong danh sách ngôn ngữ, phạm vi công việc của chúng tôi sẽ được mở rộng hơn.
Tất nhiên, để sử dụng mượt mà hơn nữa, việc cải tiến hệ thống như kiểm soát ngữ điệu (intonation) có lẽ cũng tốt. Tuy nhiên, nếu có quá nhiều chức năng, tính đơn giản trong thao tác có thể bị mất đi. Khi cân nhắc sự cân bằng bao gồm cả mức giá, tôi cảm thấy giao diện hiện tại đang ở mức rất vừa vặn.
Trong tương lai, ông dự định sẽ sử dụng Ondoku như thế nào?

Kobayashi: Tôi muốn tăng cường sử dụng Ondoku trong các hoạt động giáo dục.
Đôi khi tôi đưa ra bài tập cho sinh viên tại trường đại học liên kết với bảo tàng là sản xuất các tác phẩm video ngắn. Trong buổi thuyết trình bài tập, tôi đã từng khuyến khích các em sử dụng lời bình từ Ondoku như một cách để nâng cao chất lượng tác phẩm. Với một công cụ mà sinh viên cũng có thể sử dụng dễ dàng như Ondoku, tôi cảm thấy sẽ có nhiều tình huống nó giúp ích được trong giảng dạy.
Ngoài ra, tôi cũng muốn tận dụng khả năng hỗ trợ đa ngôn ngữ - một điểm mạnh của Ondoku - vào các hoạt động trong tương lai. Hiện tại, chúng tôi đang có kế hoạch sản xuất các video mới sử dụng lời bình tiếng Anh do các nghiên cứu viên nước ngoài soạn thảo.
Nếu thuê người lồng tiếng Anh bên ngoài, ngân sách bao nhiêu cũng sẽ không đủ. Với Ondoku, chắc chắn nó sẽ góp phần cắt giảm chi phí một cách đáng kể. Từ nay về sau, tôi muốn tiếp tục tận dụng Ondoku để duy trì các hoạt động truyền tải tiếng nói của các nghiên cứu viên.
Việc ứng dụng Ondoku không chỉ giúp giảm gánh nặng lồng tiếng cho các nghiên cứu viên mà còn giúp tiết kiệm chi phí thời gian trong sản xuất video! Cảm ơn ông rất nhiều vì đã chia sẻ một ví dụ tuyệt vời.


■ Phần mềm tổng hợp giọng nói AI “Ondoku”
"Ondoku" là một công cụ chuyển văn bản thành giọng nói trực tuyến có thể được sử dụng mà không mất phí ban đầu.
- Hỗ trợ khoảng 50 ngôn ngữ bao gồm tiếng Nhật, tiếng Anh, tiếng Trung, tiếng Hàn, tiếng Tây Ban Nha, tiếng Pháp và tiếng Đức.
- Có sẵn từ cả PC và điện thoại thông minh
- Thích hợp kinh doanh, giáo dục, giải trí, v.v.
- Không cần cài đặt, có thể sử dụng ngay từ trình duyệt
- Cũng hỗ trợ đọc từ hình ảnh
Để sử dụng nó, chỉ cần nhập văn bản hoặc tải tệp lên từ trang web. Tạo tập tin âm thanh tự nhiên trong vài giây. Bạn có thể sử dụng miễn phí tính năng tổng hợp giọng nói với tối đa 5.000 ký tự, vì vậy vui lòng dùng thử trước.
Email: ondoku3.com@gmail.com
Phần mềm đọc văn bản Ondoku. Đây là dịch vụ chuyển văn bản thành giọng nói không cần cài đặt và mọi người có thể sử dụng miễn phí. Nếu bạn đăng ký miễn phí, bạn có thể nhận được tối đa 5000 ký tự miễn phí mỗi tháng. Đăng ký ngay bây giờ miễn phí
