स्पीच मार्कअप लैंग्वेज (SSML) क्या है। टेक्स्ट-टू-स्पीच सॉफ़्टवेयर में उपयोग करने का तरीका और मुख्य कोड की सूची।

26 जनवरी 2026

नमस्ते, Ondoku का उपयोग करने के लिए धन्यवाद।

इस लेख में हम SSML के बारे में परिचय देंगे।

हो सकता है कि कुछ तकनीकी शब्दों के कारण यह थोड़ा कठिन लगे, लेकिन SSML का उपयोग करना सीखकर आप Ondoku का और भी बेहतर तरीके से लाभ उठा पाएंगे।

हम इसे सरल तरीके से समझाएंगे, इसलिए कृपया इसे अवश्य देखें।

SSML क्या है

SSML एक स्पीच मार्कअप लैंग्वेज में से एक है।

"मार्कअप लैंग्वेज" HTML की तरह ही एक भाषा है, जो टेक्स्ट के प्रत्येक भाग की संरचना (भूमिका) को परिभाषित करती है।

SSML कोड लिखकर, आप Ondoku के उच्चारण को और अधिक सुविधा के साथ नियंत्रित कर सकते हैं।

वर्तमान में, सभी भाषाओं में समर्थित SSML कोड निम्नलिखित हैं:

केवल ये 2 प्रकार के कोड ही उपलब्ध हैं। अन्य कोड भाषा या आवाज के प्रकार के आधार पर उपयोग नहीं किए जा सकते। कृपया इसे पहले से समझ लें।

Ondoku में SSML का उपयोग कैसे करें

Ondoku में SSML का उपयोग करना बहुत आसान है।

Ondoku के टेक्स्ट बॉक्स में सीधे SSML कोड दर्ज करें।

ऐसा करने पर SSML अपने आप लागू हो जाएगा।

वाक्य की शुरुआत और अंत में

डालकर ही आप SSML का उपयोग कर सकते हैं।

इस कोड को डालना न भूलें! यदि कोड शामिल नहीं है, तो SSML लागू नहीं होगा।

SSML को सक्षम करने के लिए आवश्यक कोड है।

जिस टेक्स्ट को आप पढ़वाना चाहते हैं, उसके शुरू और अंत में यह कोड अवश्य डालें।

उदाहरण

यहाँ वह टेक्स्ट डालें जिसे आप पढ़वाना चाहते हैं

ब्रेक टाइम कोड, जैसा कि नाम से पता चलता है, अंतराल (पॉज) बनाने के लिए कोड है।

जहाँ आप अंतराल देना चाहते हैं वहाँ कोड दर्ज करें, और ○○ भाग को अपनी पसंद की संख्या से बदल दें।

Ondoku में सामान्य रूप से पढ़ते समय, कभी-कभी अंतराल वैसा नहीं होता जैसा आप चाहते हैं।

ऐसे समय में यह कोड बहुत उपयोगी होता है।

उदाहरण के लिए,

जैसे कोड को उस स्थान पर रखें जहाँ आप अंतराल चाहते हैं।

इस वाक्य को पढ़ते समय थोड़ा अंतरालदेना चाहता हूँ

जैसे ही आप कोड डालेंगे, आप देखेंगे कि जहाँ कोड डाला गया है वहाँ एक विराम लेने के बाद आगे का टेक्स्ट पढ़ा जाता है।

※ 1000ms = 1 सेकंड

ms या s के पहले की संख्या बदलकर आप "अंतराल" की लंबाई को अपनी इच्छानुसार बदल सकते हैं।

200ms = 0.200 सेकंड
500ms = 0.500 सेकंड
1000ms = 1.000 सेकंड
2000ms = 2.000 सेकंड
3s = 3 सेकंड आदि

का उपयोग करते समय ध्यान देने योग्य बातें

पूरे वाक्य की शुरुआत में टैग डालने पर व्यवहार आवाज के आधार पर अलग हो सकता है, और इसके काम करने की गारंटी नहीं दी जा सकती।

उदाहरण: मैं शुरुआत में 5 सेकंड का अंतराल बनाना चाहता हूँ

↑ तकनीकी सीमाओं के कारण इस प्रकार का उपयोग संभव नहीं है।

इसके अलावा, अंतराल की अधिकतम सीमा 10 सेकंड (10000ms, 10s) है।

यदि आप इससे अधिक समय सेट करते हैं, तो इसे 10 सेकंड तक सीमित कर दिया जाएगा।

टैग के उपयोग के बारे में इस लेख में भी बताया गया है।

Ondoku की रीडिंग में अंतराल और रिक्त समय को कैसे समायोजित करें [2 तरीके] | टेक्स्ट-टू-स्पीच सॉफ्टवेयर Ondoku

Ondoku का उपयोग करने वालों की एक आवश्यकता यह होती है कि "मैं अंतराल को थोड़ा और बढ़ाना चाहता हूँ"। यदि आप थोड़ा अंतराल देना चाहते हैं, तो इसके समायोजन के 2 तरीके हैं: 1. विराम चिह्न 2. SSML।

〇〇

यह टैग Ondoku की बहुभाषी आवाज (Multilingual) के साथ कई भाषाओं में टेक्स्ट पढ़वाते समय, प्रत्येक भाग के लिए भाषा निर्दिष्ट करने के लिए है।

इसका उपयोग तब किया जाता है जब उच्चारण गलत हो रहा हो, या जब वाक्य में बहुत सारी भाषाओं का उपयोग किया गया हो और उनकी पहचान करना कठिन हो।

जापानी में कोन्निचिवा को, अंग्रेजी में Hello कहते हैं,
फ्रेंच में Bonjour,
जर्मन में Guten Tag,
और चीनी में 你好 कहा जाता है।

टैग के उपयोग के बारे में इस लेख में विस्तार से बताया गया है।

Ondoku की बहुभाषी रीडिंग में SSML टैग का उपयोग कैसे करें? मल्टीलिंग्वल आवाजों में <lang> टैग का उपयोग | टेक्स्ट-टू-स्पीच सॉफ्टवेयर Ondoku

Ondoku की बहुभाषी रीडिंग में SSML टैग का उपयोग कैसे करें? मल्टीलिंग्वल आवाजों में टैग का उपयोग | टेक्स्ट-टू-स्पीच सॉफ्टवेयर Ondoku

Ondoku के मल्टीलिंग्वल फंक्शन में SSML टैग का उपयोग करने के तरीके की व्याख्या। कॉपी-पेस्ट के लिए उपलब्ध टेम्प्लेट के साथ। YouTube वीडियो और भाषा शिक्षण सामग्री बनाने के लिए सर्वोत्तम!

○○

यह ○○ भाग के टेक्स्ट को "बीप" की ध्वनि (सेंसर ध्वनि) के साथ बजाता है।

यह थोड़ा मनोरंजक कोड है। इस कोड से घिरे अक्षरों को बीप की आवाज से बदल दिया जाता है।

यह शब्द प्रसारण के लिए वर्जित है

○○

अल्फाबेट पढ़ते समय प्रत्येक अक्षर को स्पेल आउट (स्पेलिंग के साथ) किया जाता है।

The spelling of hello is Hello

हालाँकि, कुछ आवाजों में यह SSML त्रुटि (error) पैदा कर सकता है। कृपया इसे ध्यान में रखते हुए उपयोग करें।

जापानी: ननामी (Nanami)

अंग्रेजी (USA): en-US-A

_○○

यह कोड आपको 'योमिगाना' (उच्चारण) प्रदान करने की अनुमति देता है।

टेक्स्ट रीडिंग में कभी-कभी अनपेक्षित उच्चारण हो सकता है।

उदाहरण के लिए, यदि "一行" का उच्चारण "Ichiyuki" हो जाता है, तो उसे "Ichigyou" के रूप में योमिगाना देकर सही उच्चारण कराया जा सकता है।

कोड में ○○ में मूल शब्द और ◇◇ में उसका उच्चारण दर्ज करें।

Ichiyuki नहीं बल्कि _一行 (Ichigyou) के रूप में सही पढ़ें

○○

कोड से घिरे शब्दों पर जोर देकर (emphasize) पढ़वाया जा सकता है।

यह कोड शब्दों को जोरदार बना सकता है

○○

प्रोसॉडी (prosody - छंदशास्त्र/लय) प्राकृतिक भाषा बोलने के दौरान निम्नलिखित विशेषताओं का सामूहिक नाम है:

ध्वनि का उतार-चढ़ाव
विराम की स्थिति
लंबाई और तीव्रता, आदि।

इस कोड के माध्यम से आप इन 3 प्रकारों को समायोजित कर सकते हैं:

rate (रेट, गति)
समायोजन कोड: "x-slow", "slow", "medium", "fast", "x-fast", "default"
pitch (पिच, ऊंचाई)
समायोजन कोड: "x-low", "low", "medium", "high", "x-high", "default"
volume (वॉल्यूम, तीव्रता)
समायोजन कोड: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"

तेजी से बोलें।
ऊंची आवाज में बोलें।
जोर से बोलें।
धीरे और बहुत कम आवाज में बोलें।
तेजी से, ऊंची आवाज में और सामान्य वॉल्यूम में बोलें।

SSML का लाभ उठाकर Ondoku को और अधिक सुविधाजनक क्यों न बनाएं?

इस प्रकार, SSML का उपयोग करके आप Ondoku को और भी प्रभावी ढंग से उपयोग कर सकते हैं!

वीडियो निर्माण या प्रस्तुतियों के लिए, Ondoku की स्वाभाविक और सुनने में आसान आवाजों का और अधिक विस्तृत रूप से लाभ उठाएं।

■ एआई भाषण संश्लेषण सॉफ्टवेयर "ओन्डोकू"

"ओन्डोकू" एक ऑनलाइन टेक्स्ट-टू-स्पीच टूल है जिसका उपयोग बिना किसी प्रारंभिक लागत के किया जा सकता है।

जापानी, अंग्रेजी, चीनी, कोरियाई, स्पेनिश, फ्रेंच और जर्मन सहित लगभग 50 भाषाओं का समर्थन करता है।
पीसी और स्मार्टफोन दोनों से उपलब्ध है
व्यवसाय, शिक्षा, मनोरंजन आदि के लिए उपयुक्त।
किसी इंस्टॉलेशन की आवश्यकता नहीं, आपके ब्राउज़र से तुरंत उपयोग किया जा सकता है
छवियों से पढ़ने का भी समर्थन करता है

इसका उपयोग करने के लिए, बस टेक्स्ट दर्ज करें या साइट से एक फ़ाइल अपलोड करें। सेकंडों में प्राकृतिक ध्वनि फ़ाइलें उत्पन्न करें। आप 5,000 वर्णों तक वाक् संश्लेषण का निःशुल्क उपयोग कर सकते हैं, इसलिए कृपया पहले इसे आज़माएँ।

टेक्स्ट-टू-स्पीच सॉफ्टवेयर "ओंडोकू" हर महीने एआई आवाज के साथ मुफ्त में 5000 अक्षरों को पढ़ सकता है। आप आसानी से MP3 डाउनलोड कर सकते हैं और व्यावसायिक उपयोग भी संभव है। यदि आप निःशुल्क साइन अप करते हैं, तो आप प्रति माह 5,000 अक्षरों तक को टेक्स्ट से स्पीच में निःशुल्क रूपांतरित कर सकते हैं। अभी ओन्डोकू आज़माएँ।

HP: ondoku3.com
Email: ondoku3.com@gmail.com

←पिछला लेख | अगला लेख→