Ngôn ngữ đánh dấu tổng hợp giọng nói (SSML) là gì? Cách sử dụng nó trong phần mềm chuyển văn bản thành giọng nói và danh sách mã chính.

Ngày 21 tháng 6 năm 2025

Xin chào, chào mừng bạn đến với trang web Ondoku.

Hôm nay, chúng tôi xin giới thiệu SSML.

Bạn có thể cảm thấy khó khăn vì có một số thuật ngữ kỹ thuật.

Tuy nhiên, nếu bạn biết điều đó, nó sẽ tạo ra sự khác biệt rất lớn trong cách bạn sử dụng Ondoku.

Vui lòng đọc qua khi chúng tôi cố gắng làm cho nó dễ hiểu.

SSML là gì?

Trước hết, SSML là viết tắt của Speech Synthesis Markup Language.

Nó tương tự như HTML.

Bằng cách viết mã SSML này, bạn có thể kiểm soát thêm bài phát biểu của Ondoku.

Cách sử dụng SSML với Ondoku

Rất dễ sử dụng SSML trong Ondoku.

Vui lòng nhập trực tiếp mã SSML vào hộp văn bản Ondoku.

SSML sẽ được áp dụng tự động.

Hãy chắc chắn bao gồm

<speak> </speak>

ở đầu và cuối mã! Nếu không có mã <speak>, SSML sẽ không được áp dụng.

<speak> </speak>

Như đã đề cập trước đó, đây là mã để kích hoạt SSML.

Đảm bảo bao gồm mã này ở đầu và cuối văn bản bạn muốn chuyển thành giọng nói.

Thí dụ

<speak> Nhập văn bản bạn muốn chuyển từ văn bản thành giọng nói tại đây </speak>

<break time = "○○ ms" />

Như tên của nó, mã thời gian nghỉ là mã để tạm dừng.

Nhập mã mà bạn muốn chèn thời gian nghỉ và thay thế ○○ bằng số bạn thích.

Bài phát biểu do Ondoku tạo ra sẽ không có "tạm dừng" trừ khi được chỉ định.

Bạn có thể tạo một số thời gian ngắt nghỉ bằng dấu ngoặc hoặc dấu chấm câu, nhưng những khoảng dừng này có thể không được đặt như bạn muốn.

Đặc biệt nếu bạn cần thời gian nghỉ hơn 2 giây thì sẽ khó kiểm soát hơn.

Tuy nhiên, nếu bạn nhập

<break time = "1000ms" />

đến nơi bạn muốn tạm dừng,

<nói>
Tôi muốn một số thời gian nghỉ <break time = "1000ms" /> khi đọc câu này.
</speak>

bạn sẽ nghe thấy một số ngắt ở giữa câu.

* 1000 ms = 1 giây

Bạn có thể thay đổi số trước mili giây một cách tự do để kiểm soát thời gian tạm dừng.

200 mili giây = 0,200 giây
500ms = 0,500 giây
1000ms = 1.000 giây
2000ms = 2.000 giây
3 giây = 3 giây
10 giây = 10 giây, v.v.

<say-aspret-as = "expletive"> ○○ </say-as>

Với mã này, văn bản trong ○○ sẽ được phát với âm thanh bíp để kiểm duyệt âm sắc.

Đó là một loại mã vui nhộn. Văn bản kèm theo mã này sẽ được thay thế bằng âm thanh bíp.

<nói>
Từ này <say-aspret-as = "expletive"> bị hạn chế </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Nó là một mã cho phép bạn chỉ ra cách phát âm.

Đôi khi khi sử dụng tính năng chuyển đổi văn bản thành giọng nói, bạn có thể nghe thấy một từ được nói theo cách không mong muốn.

Ví dụ: bạn có thể làm cho phần mềm phát âm từ "一行" một dòng, là "Ichigyo", trong khi hệ thống phát âm nó là "Ichiyuki".

Đối với mã, hãy nhập chữ kanji cho ○○ và cách phát âm cho ◇◇.

<nói>
Phát âm chính xác là <sub alias = "Ichigyo"> 一行 </sub> thay vì Ichiyuki
</speak>

<emphasis> ○○ </emphasis>

Bạn có thể nhấn mạnh văn bản kèm theo mã trong bài phát biểu.

<nói>
Đoạn mã này sẽ <emphasis> nhấn mạnh văn bản </emphasis>
</speak>

<prosody> ○○ </prosody>

Prosody là một thuật ngữ ngôn ngữ mô tả các quy tắc của tiếng Anh nói tự nhiên, bao gồm

Ngữ điệu (cao độ lên và xuống)
Vị trí tạm dừng
Độ dài của âm thanh và độ căng, v.v.

Với những mã này, bạn có thể điều chỉnh 3 yếu tố sau của prosody:

Tỷ lệ (tỷ lệ, tốc độ)
Mã: "x-slow" "chậm" "trung bình" "nhanh" "x-nhanh" "mặc định"
Pitch (cao độ, chiều cao)
Mã: "x-low" "thấp" "trung bình" "cao" "x-cao" "mặc định"
Khối lượng (khối lượng, kích thước)
Mã: "im lặng" "x-soft" "mềm" "vừa" "lớn" "x-to" "mặc định"

<nói>
<prosody rate = "fast"> Nói nhanh. </prosody>
<prosody pitch = "high"> Nói với giọng cao. </prosody>
<prosody volume = "to"> Nói to. </prosody>
<prosody rate = "slow" pitch = "x-low"> Nói chậm và bằng giọng trầm. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Nói nhanh, bằng giọng cao và âm lượng bình thường. </prosody>
</speak>

■ Phần mềm tổng hợp giọng nói AI “Ondoku”

"Ondoku" là một công cụ chuyển văn bản thành giọng nói trực tuyến có thể được sử dụng mà không mất phí ban đầu.

Hỗ trợ khoảng 50 ngôn ngữ bao gồm tiếng Nhật, tiếng Anh, tiếng Trung, tiếng Hàn, tiếng Tây Ban Nha, tiếng Pháp và tiếng Đức.
Có sẵn từ cả PC và điện thoại thông minh
Thích hợp kinh doanh, giáo dục, giải trí, v.v.
Không cần cài đặt, có thể sử dụng ngay từ trình duyệt
Cũng hỗ trợ đọc từ hình ảnh

Để sử dụng nó, chỉ cần nhập văn bản hoặc tải tệp lên từ trang web. Tạo tập tin âm thanh tự nhiên trong vài giây. Bạn có thể sử dụng miễn phí tính năng tổng hợp giọng nói với tối đa 5.000 ký tự, vì vậy vui lòng dùng thử trước.

Chuyển đổi văn bản thành âm thanh ngay bây giờ

Phần mềm chuyển văn bản thành giọng nói "Ondoku" có thể đọc miễn phí 5000 ký tự mỗi tháng bằng giọng nói AI. Bạn có thể dễ dàng tải xuống các tệp MP3 và cũng có thể sử dụng cho mục đích thương mại. Nếu đăng ký miễn phí, bạn có thể chuyển đổi miễn phí tối đa 5.000 ký tự mỗi tháng từ văn bản sang giọng nói. Hãy thử Ondoku ngay bây giờ.

HP: ondoku3.com
Email: ondoku3.com@gmail.com

←bài báo trước | Bài tiếp theo→