Τι είναι η γλώσσα σήμανσης σύνθεσης ομιλίας (SSML); Πώς να το χρησιμοποιήσετε στο λογισμικό κειμένου σε ομιλία και στη λίστα με τον κύριο κωδικό.
17/04/2024
Γεια σας, καλώς ήλθατε στον ιστότοπο του Ondoku.
Σήμερα, θα θέλαμε να εισαγάγουμε SSML.
Μπορεί να το βρείτε δύσκολο, καθώς υπάρχουν ορισμένοι τεχνικοί όροι.
Ωστόσο, αν το γνωρίζετε, θα κάνει τεράστια διαφορά στον τρόπο με τον οποίο χρησιμοποιείτε το Ondoku.
Διαβάστε το καθώς προσπαθούμε να το καταστήσουμε κατανοητό.
Τι είναι το SSML;
Πρώτα απ 'όλα, το SSML σημαίνει Speech Synthesis Markup Language.
Είναι παρόμοιο με το HTML.
Γράφοντας αυτόν τον κωδικό SSML, μπορείτε να ελέγξετε περαιτέρω την ομιλία του Ondoku.
Πώς να χρησιμοποιήσετε το SSML με το Ondoku
Είναι πολύ εύκολο στη χρήση SSML στο Ondoku.
Εισαγάγετε απευθείας τον κωδικό SSML στο πλαίσιο κειμένου Ondoku.
Το SSML θα εφαρμοστεί αυτόματα.
Φροντίστε να συμπεριλάβετε
<speak> </speak>
στην αρχή και στο τέλος του κώδικα! Χωρίς τον κωδικό <speak>, το SSML δεν θα εφαρμοστεί.
<speak> </speak>
Όπως αναφέρθηκε προηγουμένως, αυτός είναι ο κωδικός για την ενεργοποίηση του SSML.
Φροντίστε να συμπεριλάβετε αυτόν τον κωδικό στην αρχή και στο τέλος του κειμένου που θέλετε να μετατρέψετε σε ομιλία.
Παράδειγμα
<speak> Εισαγάγετε το κείμενο που θέλετε να μετατρέψετε από κείμενο σε ομιλία εδώ </speak>
<break time = "○○ ms" />
Όπως υποδηλώνει το όνομα, ο κωδικός χρόνου διακοπής είναι ένας κωδικός για την παύση.
Εισαγάγετε τον κωδικό όπου θέλετε να εισαγάγετε έναν χρόνο διακοπής και αντικαταστήστε το ○○ με τον αριθμό που θέλετε.
Η ομιλία που δημιουργείται από το Ondoku δεν θα έχει "παύση" εκτός εάν έχει καθοριστεί.
Μπορείτε να κάνετε λίγο χρόνο διακοπής με αγκύλες ή σημεία στίξης, αλλά αυτές οι παύσεις ενδέχεται να μην ρυθμιστούν όπως θέλετε.
Ειδικά αν χρειάζεστε χρόνο διακοπής άνω των 2 δευτερολέπτων, θα είναι πιο δύσκολο να ελέγξετε.
Ωστόσο, εάν εισάγετε
<break time = "1000ms" />
στο μέρος που θέλετε να κάνετε μια παύση,
<ομιλία>
Θέλω λίγο διάλειμμα <break time = "1000ms" /> κατά την ανάγνωση αυτής της πρότασης.
</speak>
θα ακούσετε κάποιο διάλειμμα στη μέση της πρότασης.
* 1000 ms = 1 δευτερόλεπτο
Μπορείτε να αλλάξετε τον αριθμό πριν από την ms ή s ελεύθερα για να ελέγξετε τη διάρκεια της παύσης.
200ms = 0,200 δευτερόλεπτα
500ms = 0,500 δευτερόλεπτα
1000ms = 1.000 δευτερόλεπτα
2000ms = 2.000 δευτερόλεπτα
3s = 3 δευτερόλεπτα
10s = 10 δευτερόλεπτα κ.λπ.
<say-as interpret-as = "expletive"> ○○ </say-as>
Με αυτόν τον κωδικό, το κείμενο στο ○○ θα αναπαράγεται με έναν ήχο μπιπ για τον λογοκριτή bleep.
Είναι ένα είδος παιχνιδιάρικου κώδικα. Το κείμενο που περικλείεται σε αυτόν τον κωδικό θα αντικατασταθεί με ήχο.
<ομιλία>
Αυτή η λέξη είναι <say-as interpret-as = "expletive"> περιορισμένη </say-as>
</speak>
<sub alias = "◇◇"> ○○ </sub>
Είναι ένας κωδικός που σας επιτρέπει να υποδείξετε την προφορά.
Μερικές φορές όταν χρησιμοποιείτε μετατροπή κειμένου σε ομιλία, ενδέχεται να ακούσετε μια λέξη που εκφωνείται με απροσδόκητο τρόπο.
Για παράδειγμα, μπορείτε να κάνετε το λογισμικό να προφέρει τη λέξη "一行", μία γραμμή, ως "Ichigyo", ενώ το σύστημα την προφέρει ως "Ichiyuki".
Για τον κωδικό, εισαγάγετε το kanji για ○○ και την προφορά για ◇◇.
<ομιλία>
Προφέρετε σωστά ως <sub alias = "Ichigyo"> 一行 </sub> αντί για Ichiyuki
</speak>
<emphasis> ○○ </emphasis>
Μπορείτε να δώσετε έμφαση στο κείμενο που περιλαμβάνεται στον κώδικα στην ομιλία.
<ομιλία>
Αυτός ο κωδικός θα <emphasis> τονίσει το κείμενο </emphasis>
</speak>
<prosody> ○○ </prosody>
Το Prosody είναι ένας γλωσσικός όρος που περιγράφει τους κανόνες της φυσικής ομιλίας στα Αγγλικά, συμπεριλαμβανομένων
- Εντονισμός (άνοδος και πτώση)
- Θέση παύσης
- Μήκος ήχου και άγχους κ.λπ.
Με αυτούς τους κωδικούς, μπορείτε να προσαρμόσετε τα ακόλουθα 3 στοιχεία του prosody:
- Ποσοστό (ρυθμός, ταχύτητα)
Κωδικός: "x-slow" "slow" "medium" "fast" "x-fast" "default" - Θέση (βήμα, ύψος)
Κωδικός: "x-low" "low" "medium" "high" "x-high" "default" - Όγκος (όγκος, μέγεθος)
Κωδικός: "σιωπηλός" "x-soft" "soft" "medium" "δυνατός" "x-δυνατός" "προεπιλογή"
<ομιλία>
<prosody rate = "fast"> Μιλήστε γρήγορα. </prosody>
<prosody pitch = "high"> Μιλήστε με υψηλή φωνή. </prosody>
<prosody volume = "δυνατή"> Μιλήστε δυνατά. </prosody>
<prosody rate = "slow" pitch = "x-low"> Μιλήστε αργά και με χαμηλή φωνή. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Μιλήστε γρήγορα, με υψηλή φωνή και σε κανονική ένταση. </prosody>
</speak>
■ Λογισμικό σύνθεσης ομιλίας AI "Ondoku"
Το "Ondoku" είναι ένα διαδικτυακό εργαλείο μετατροπής κειμένου σε ομιλία που μπορεί να χρησιμοποιηθεί χωρίς αρχικό κόστος.
- Υποστηρίζει περίπου 50 γλώσσες, συμπεριλαμβανομένων των Ιαπωνικών, Αγγλικών, Κινέζων, Κορεατικών, Ισπανικών, Γαλλικών και Γερμανικών.
- Διατίθεται τόσο από υπολογιστή όσο και από smartphone
- Κατάλληλο για επιχειρήσεις, εκπαίδευση, διασκέδαση κ.λπ.
- Δεν απαιτείται εγκατάσταση, μπορεί να χρησιμοποιηθεί αμέσως από το πρόγραμμα περιήγησής σας
- Υποστηρίζει επίσης ανάγνωση από εικόνες
Για να το χρησιμοποιήσετε, απλώς εισαγάγετε κείμενο ή ανεβάστε ένα αρχείο από τον ιστότοπο. Δημιουργήστε φυσικά αρχεία ήχου σε δευτερόλεπτα. Μπορείτε να χρησιμοποιήσετε τη σύνθεση ομιλίας για έως και 5.000 χαρακτήρες δωρεάν, επομένως δοκιμάστε τη πρώτα.
Email: ondoku3.com@gmail.com
Λογισμικό ανάγνωσης κειμένου Ondoku. Είναι μια υπηρεσία κειμένου σε ομιλία που δεν απαιτεί εγκατάσταση και μπορεί να χρησιμοποιηθεί από οποιονδήποτε δωρεάν. Εάν εγγραφείτε δωρεάν, μπορείτε να λαμβάνετε έως και 5000 χαρακτήρες δωρεάν κάθε μήνα. Εγγραφείτε τώρα δωρεάν