Ngôn ngữ đánh dấu tổng hợp giọng nói (SSML) là gì? Cách sử dụng nó trong phần mềm chuyển văn bản thành giọng nói và danh sách mã chính.

Ngày 17 tháng 4 năm 2024

Ngôn ngữ đánh dấu tổng hợp giọng nói (SSML) là gì? Cách sử dụng nó trong phần mềm chuyển văn bản thành giọng nói và danh sách mã chính.


Xin chào, chào mừng bạn đến với trang web Ondoku.

Hôm nay, chúng tôi xin giới thiệu SSML.

Bạn có thể cảm thấy khó khăn vì có một số thuật ngữ kỹ thuật.

Tuy nhiên, nếu bạn biết điều đó, nó sẽ tạo ra sự khác biệt rất lớn trong cách bạn sử dụng Ondoku.

Vui lòng đọc qua khi chúng tôi cố gắng làm cho nó dễ hiểu.

SSML là gì?

Trước hết, SSML là viết tắt của Speech Synthesis Markup Language.

Nó tương tự như HTML.

Bằng cách viết mã SSML này, bạn có thể kiểm soát thêm bài phát biểu của Ondoku.

Cách sử dụng SSML với Ondoku

Rất dễ sử dụng SSML trong Ondoku.

Vui lòng nhập trực tiếp mã SSML vào hộp văn bản Ondoku.

SSML sẽ được áp dụng tự động.

Hãy chắc chắn bao gồm

<speak> </speak>

ở đầu và cuối mã! Nếu không có mã <speak>, SSML sẽ không được áp dụng.

<speak> </speak>

Như đã đề cập trước đó, đây là mã để kích hoạt SSML.

Đảm bảo bao gồm mã này ở đầu và cuối văn bản bạn muốn chuyển thành giọng nói.

Thí dụ

<speak> Nhập văn bản bạn muốn chuyển từ văn bản thành giọng nói tại đây </speak>

<break time = "○○ ms" />

Như tên của nó, mã thời gian nghỉ là mã để tạm dừng.

Nhập mã mà bạn muốn chèn thời gian nghỉ và thay thế ○○ bằng số bạn thích.

Bài phát biểu do Ondoku tạo ra sẽ không có "tạm dừng" trừ khi được chỉ định.

Bạn có thể tạo một số thời gian ngắt nghỉ bằng dấu ngoặc hoặc dấu chấm câu, nhưng những khoảng dừng này có thể không được đặt như bạn muốn.

Đặc biệt nếu bạn cần thời gian nghỉ hơn 2 giây thì sẽ khó kiểm soát hơn.

Tuy nhiên, nếu bạn nhập

<break time = "1000ms" />

đến nơi bạn muốn tạm dừng,

<nói>
Tôi muốn một số thời gian nghỉ <break time = "1000ms" /> khi đọc câu này.
</speak>

bạn sẽ nghe thấy một số ngắt ở giữa câu.

* 1000 ms = 1 giây

Bạn có thể thay đổi số trước mili giây một cách tự do để kiểm soát thời gian tạm dừng.

200 mili giây = 0,200 giây
500ms = 0,500 giây
1000ms = 1.000 giây
2000ms = 2.000 giây
3 giây = 3 giây
10 giây = 10 giây, v.v.

<say-aspret-as = "expletive"> ○○ </say-as>

Với mã này, văn bản trong ○○ sẽ được phát với âm thanh bíp để kiểm duyệt âm sắc.

Đó là một loại mã vui nhộn. Văn bản kèm theo mã này sẽ được thay thế bằng âm thanh bíp.

<nói>
Từ này <say-aspret-as = "expletive"> bị hạn chế </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Nó là một mã cho phép bạn chỉ ra cách phát âm.

Đôi khi khi sử dụng tính năng chuyển đổi văn bản thành giọng nói, bạn có thể nghe thấy một từ được nói theo cách không mong muốn.

Ví dụ: bạn có thể làm cho phần mềm phát âm từ "一行" một dòng, là "Ichigyo", trong khi hệ thống phát âm nó là "Ichiyuki".

Đối với mã, hãy nhập chữ kanji cho ○○ và cách phát âm cho ◇◇.

<nói>
Phát âm chính xác là <sub alias = "Ichigyo"> 一行 </sub> thay vì Ichiyuki
</speak>

<emphasis> ○○ </emphasis>

Bạn có thể nhấn mạnh văn bản kèm theo mã trong bài phát biểu.

<nói>
Đoạn mã này sẽ <emphasis> nhấn mạnh văn bản </emphasis>
</speak>

<prosody> ○○ </prosody>

Prosody là một thuật ngữ ngôn ngữ mô tả các quy tắc của tiếng Anh nói tự nhiên, bao gồm

  • Ngữ điệu (cao độ lên và xuống)
  • Vị trí tạm dừng
  • Độ dài của âm thanh và độ căng, v.v.

Với những mã này, bạn có thể điều chỉnh 3 yếu tố sau của prosody:

  • Tỷ lệ (tỷ lệ, tốc độ)
    Mã: "x-slow" "chậm" "trung bình" "nhanh" "x-nhanh" "mặc định"
  • Pitch (cao độ, chiều cao)
    Mã: "x-low" "thấp" "trung bình" "cao" "x-cao" "mặc định"
  • Khối lượng (khối lượng, kích thước)
    Mã: "im lặng" "x-soft" "mềm" "vừa" "lớn" "x-to" "mặc định"

<nói>
<prosody rate = "fast"> Nói nhanh. </prosody>
<prosody pitch = "high"> Nói với giọng cao. </prosody>
<prosody volume = "to"> Nói to. </prosody>
<prosody rate = "slow" pitch = "x-low"> Nói chậm và bằng giọng trầm. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Nói nhanh, bằng giọng cao và âm lượng bình thường. </prosody>
</speak>

Phần mềm chuyển văn bản thành giọng nói "Ondoku" có thể đọc miễn phí 5000 ký tự mỗi tháng bằng giọng nói AI. Bạn có thể dễ dàng tải xuống các tệp MP3 và cũng có thể sử dụng cho mục đích thương mại. Nếu đăng ký miễn phí, bạn có thể chuyển đổi miễn phí tối đa 5.000 ký tự mỗi tháng từ văn bản sang giọng nói. Hãy thử Ondoku ngay bây giờ.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Bài viết liên quan

Phần mềm đọc văn bản Ondoku. Đây là dịch vụ chuyển văn bản thành giọng nói không cần cài đặt và mọi người có thể sử dụng miễn phí. Nếu bạn đăng ký miễn phí, bạn có thể nhận được tối đa 5000 ký tự miễn phí mỗi tháng. Đăng ký ngay bây giờ miễn phí