स्पीच मार्कअप लैंग्वेज (SSML) क्या है। टेक्स्ट-टू-स्पीच सॉफ़्टवेयर में उपयोग करने का तरीका और मुख्य कोड की सूची।

26 जनवरी 2026

स्पीच मार्कअप लैंग्वेज (SSML) क्या है। टेक्स्ट-टू-स्पीच सॉफ़्टवेयर में उपयोग करने का तरीका और मुख्य कोड की सूची।

नमस्ते, Ondoku का उपयोग करने के लिए धन्यवाद।

इस लेख में हम SSML के बारे में परिचय देंगे।

हो सकता है कि कुछ तकनीकी शब्दों के कारण यह थोड़ा कठिन लगे, लेकिन SSML का उपयोग करना सीखकर आप Ondoku का और भी बेहतर तरीके से लाभ उठा पाएंगे।

हम इसे सरल तरीके से समझाएंगे, इसलिए कृपया इसे अवश्य देखें।

SSML क्या है

SSML एक स्पीच मार्कअप लैंग्वेज में से एक है।

"मार्कअप लैंग्वेज" HTML की तरह ही एक भाषा है, जो टेक्स्ट के प्रत्येक भाग की संरचना (भूमिका) को परिभाषित करती है।

SSML कोड लिखकर, आप Ondoku के उच्चारण को और अधिक सुविधा के साथ नियंत्रित कर सकते हैं।

वर्तमान में, सभी भाषाओं में समर्थित SSML कोड निम्नलिखित हैं:

केवल ये 2 प्रकार के कोड ही उपलब्ध हैं। अन्य कोड भाषा या आवाज के प्रकार के आधार पर उपयोग नहीं किए जा सकते। कृपया इसे पहले से समझ लें।

Ondoku में SSML का उपयोग कैसे करें

Ondoku में SSML का उपयोग करना बहुत आसान है।

Ondoku के टेक्स्ट बॉक्स में सीधे SSML कोड दर्ज करें।

ऐसा करने पर SSML अपने आप लागू हो जाएगा।

वाक्य की शुरुआत और अंत में

डालकर ही आप SSML का उपयोग कर सकते हैं।

इस कोड को डालना न भूलें! यदि कोड शामिल नहीं है, तो SSML लागू नहीं होगा।

SSML को सक्षम करने के लिए आवश्यक कोड है।

जिस टेक्स्ट को आप पढ़वाना चाहते हैं, उसके शुरू और अंत में यह कोड अवश्य डालें।

उदाहरण

यहाँ वह टेक्स्ट डालें जिसे आप पढ़वाना चाहते हैं

ब्रेक टाइम कोड, जैसा कि नाम से पता चलता है, अंतराल (पॉज) बनाने के लिए कोड है।

जहाँ आप अंतराल देना चाहते हैं वहाँ कोड दर्ज करें, और ○○ भाग को अपनी पसंद की संख्या से बदल दें।

Ondoku में सामान्य रूप से पढ़ते समय, कभी-कभी अंतराल वैसा नहीं होता जैसा आप चाहते हैं।

ऐसे समय में यह कोड बहुत उपयोगी होता है।

उदाहरण के लिए,

जैसे कोड को उस स्थान पर रखें जहाँ आप अंतराल चाहते हैं।


इस वाक्य को पढ़ते समय थोड़ा अंतरालदेना चाहता हूँ

जैसे ही आप कोड डालेंगे, आप देखेंगे कि जहाँ कोड डाला गया है वहाँ एक विराम लेने के बाद आगे का टेक्स्ट पढ़ा जाता है।

※ 1000ms = 1 सेकंड

ms या s के पहले की संख्या बदलकर आप "अंतराल" की लंबाई को अपनी इच्छानुसार बदल सकते हैं।

  • 200ms = 0.200 सेकंड
  • 500ms = 0.500 सेकंड
  • 1000ms = 1.000 सेकंड
  • 2000ms = 2.000 सेकंड
  • 3s = 3 सेकंड आदि

का उपयोग करते समय ध्यान देने योग्य बातें

पूरे वाक्य की शुरुआत में टैग डालने पर व्यवहार आवाज के आधार पर अलग हो सकता है, और इसके काम करने की गारंटी नहीं दी जा सकती।

उदाहरण: मैं शुरुआत में 5 सेकंड का अंतराल बनाना चाहता हूँ

↑ तकनीकी सीमाओं के कारण इस प्रकार का उपयोग संभव नहीं है।

इसके अलावा, अंतराल की अधिकतम सीमा 10 सेकंड (10000ms, 10s) है।

यदि आप इससे अधिक समय सेट करते हैं, तो इसे 10 सेकंड तक सीमित कर दिया जाएगा।

टैग के उपयोग के बारे में इस लेख में भी बताया गया है।

〇〇

यह टैग Ondoku की बहुभाषी आवाज (Multilingual) के साथ कई भाषाओं में टेक्स्ट पढ़वाते समय, प्रत्येक भाग के लिए भाषा निर्दिष्ट करने के लिए है।

इसका उपयोग तब किया जाता है जब उच्चारण गलत हो रहा हो, या जब वाक्य में बहुत सारी भाषाओं का उपयोग किया गया हो और उनकी पहचान करना कठिन हो।


जापानी में कोन्निचिवा को, अंग्रेजी में Hello कहते हैं,
फ्रेंच में Bonjour,
जर्मन में Guten Tag,
और चीनी में 你好 कहा जाता है।

टैग के उपयोग के बारे में इस लेख में विस्तार से बताया गया है।

○○

यह ○○ भाग के टेक्स्ट को "बीप" की ध्वनि (सेंसर ध्वनि) के साथ बजाता है।

यह थोड़ा मनोरंजक कोड है। इस कोड से घिरे अक्षरों को बीप की आवाज से बदल दिया जाता है।


यह शब्द प्रसारण के लिए वर्जित है

○○

अल्फाबेट पढ़ते समय प्रत्येक अक्षर को स्पेल आउट (स्पेलिंग के साथ) किया जाता है।


The spelling of hello is Hello

हालाँकि, कुछ आवाजों में यह SSML त्रुटि (error) पैदा कर सकता है। कृपया इसे ध्यान में रखते हुए उपयोग करें।

जापानी: ननामी (Nanami)

अंग्रेजी (USA): en-US-A

○○

यह कोड आपको 'योमिगाना' (उच्चारण) प्रदान करने की अनुमति देता है।

टेक्स्ट रीडिंग में कभी-कभी अनपेक्षित उच्चारण हो सकता है।

उदाहरण के लिए, यदि "一行" का उच्चारण "Ichiyuki" हो जाता है, तो उसे "Ichigyou" के रूप में योमिगाना देकर सही उच्चारण कराया जा सकता है।

कोड में ○○ में मूल शब्द और ◇◇ में उसका उच्चारण दर्ज करें।


Ichiyuki नहीं बल्कि 一行 (Ichigyou) के रूप में सही पढ़ें

○○

कोड से घिरे शब्दों पर जोर देकर (emphasize) पढ़वाया जा सकता है।


यह कोड शब्दों को जोरदार बना सकता है

○○

प्रोसॉडी (prosody - छंदशास्त्र/लय) प्राकृतिक भाषा बोलने के दौरान निम्नलिखित विशेषताओं का सामूहिक नाम है:

  • ध्वनि का उतार-चढ़ाव
  • विराम की स्थिति
  • लंबाई और तीव्रता, आदि।

इस कोड के माध्यम से आप इन 3 प्रकारों को समायोजित कर सकते हैं:

  • rate (रेट, गति)
    समायोजन कोड: "x-slow", "slow", "medium", "fast", "x-fast", "default"
  • pitch (पिच, ऊंचाई)
    समायोजन कोड: "x-low", "low", "medium", "high", "x-high", "default"
  • volume (वॉल्यूम, तीव्रता)
    समायोजन कोड: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"


तेजी से बोलें।
ऊंची आवाज में बोलें।
जोर से बोलें।
धीरे और बहुत कम आवाज में बोलें।
तेजी से, ऊंची आवाज में और सामान्य वॉल्यूम में बोलें।

SSML का लाभ उठाकर Ondoku को और अधिक सुविधाजनक क्यों न बनाएं?

इस प्रकार, SSML का उपयोग करके आप Ondoku को और भी प्रभावी ढंग से उपयोग कर सकते हैं!

वीडियो निर्माण या प्रस्तुतियों के लिए, Ondoku की स्वाभाविक और सुनने में आसान आवाजों का और अधिक विस्तृत रूप से लाभ उठाएं।

■ एआई भाषण संश्लेषण सॉफ्टवेयर "ओन्डोकू"

"ओन्डोकू" एक ऑनलाइन टेक्स्ट-टू-स्पीच टूल है जिसका उपयोग बिना किसी प्रारंभिक लागत के किया जा सकता है।

  • जापानी, अंग्रेजी, चीनी, कोरियाई, स्पेनिश, फ्रेंच और जर्मन सहित लगभग 50 भाषाओं का समर्थन करता है।
  • पीसी और स्मार्टफोन दोनों से उपलब्ध है
  • व्यवसाय, शिक्षा, मनोरंजन आदि के लिए उपयुक्त।
  • किसी इंस्टॉलेशन की आवश्यकता नहीं, आपके ब्राउज़र से तुरंत उपयोग किया जा सकता है
  • छवियों से पढ़ने का भी समर्थन करता है

इसका उपयोग करने के लिए, बस टेक्स्ट दर्ज करें या साइट से एक फ़ाइल अपलोड करें। सेकंडों में प्राकृतिक ध्वनि फ़ाइलें उत्पन्न करें। आप 5,000 वर्णों तक वाक् संश्लेषण का निःशुल्क उपयोग कर सकते हैं, इसलिए कृपया पहले इसे आज़माएँ।

टेक्स्ट-टू-स्पीच सॉफ्टवेयर "ओंडोकू" हर महीने एआई आवाज के साथ मुफ्त में 5000 अक्षरों को पढ़ सकता है। आप आसानी से MP3 डाउनलोड कर सकते हैं और व्यावसायिक उपयोग भी संभव है। यदि आप निःशुल्क साइन अप करते हैं, तो आप प्रति माह 5,000 अक्षरों तक को टेक्स्ट से स्पीच में निःशुल्क रूपांतरित कर सकते हैं। अभी ओन्डोकू आज़माएँ।
HP: ondoku3.com
Email: ondoku3.com@gmail.com
संबंधित लेख

टेक्स्ट रीडिंग सॉफ्टवेयर ओन्डोकू। यह एक टेक्स्ट-टू-स्पीच सेवा है जिसका उपयोग बिना किसी इंस्टॉलेशन के मुफ्त में किया जा सकता है। यदि आप निःशुल्क पंजीकरण करते हैं, तो आप प्रत्येक माह 5000 अक्षर तक निःशुल्क प्राप्त कर सकते हैं। अभी मुफ्त में रजिस्टर करें