स्पीच मार्कअप लैंग्वेज (SSML) क्या है। टेक्स्ट-टू-स्पीच सॉफ़्टवेयर में उपयोग करने का तरीका और मुख्य कोड की सूची।
26 जनवरी 2026
नमस्ते, Ondoku का उपयोग करने के लिए धन्यवाद।
इस लेख में हम SSML के बारे में परिचय देंगे।
हो सकता है कि कुछ तकनीकी शब्दों के कारण यह थोड़ा कठिन लगे, लेकिन SSML का उपयोग करना सीखकर आप Ondoku का और भी बेहतर तरीके से लाभ उठा पाएंगे।
हम इसे सरल तरीके से समझाएंगे, इसलिए कृपया इसे अवश्य देखें।
SSML क्या है
SSML एक स्पीच मार्कअप लैंग्वेज में से एक है।
"मार्कअप लैंग्वेज" HTML की तरह ही एक भाषा है, जो टेक्स्ट के प्रत्येक भाग की संरचना (भूमिका) को परिभाषित करती है।
SSML कोड लिखकर, आप Ondoku के उच्चारण को और अधिक सुविधा के साथ नियंत्रित कर सकते हैं।
वर्तमान में, सभी भाषाओं में समर्थित SSML कोड निम्नलिखित हैं:
केवल ये 2 प्रकार के कोड ही उपलब्ध हैं। अन्य कोड भाषा या आवाज के प्रकार के आधार पर उपयोग नहीं किए जा सकते। कृपया इसे पहले से समझ लें।
Ondoku में SSML का उपयोग कैसे करें
Ondoku में SSML का उपयोग करना बहुत आसान है।
Ondoku के टेक्स्ट बॉक्स में सीधे SSML कोड दर्ज करें।
ऐसा करने पर SSML अपने आप लागू हो जाएगा।
वाक्य की शुरुआत और अंत में
डालकर ही आप SSML का उपयोग कर सकते हैं।
इस कोड को डालना न भूलें! यदि
जिस टेक्स्ट को आप पढ़वाना चाहते हैं, उसके शुरू और अंत में यह कोड अवश्य डालें।
उदाहरण
यहाँ वह टेक्स्ट डालें जिसे आप पढ़वाना चाहते हैं
ब्रेक टाइम कोड, जैसा कि नाम से पता चलता है, अंतराल (पॉज) बनाने के लिए कोड है।
जहाँ आप अंतराल देना चाहते हैं वहाँ कोड दर्ज करें, और ○○ भाग को अपनी पसंद की संख्या से बदल दें।
Ondoku में सामान्य रूप से पढ़ते समय, कभी-कभी अंतराल वैसा नहीं होता जैसा आप चाहते हैं।
ऐसे समय में यह कोड बहुत उपयोगी होता है।
उदाहरण के लिए,
जैसे कोड को उस स्थान पर रखें जहाँ आप अंतराल चाहते हैं।
इस वाक्य को पढ़ते समय थोड़ा अंतरालदेना चाहता हूँ
जैसे ही आप कोड डालेंगे, आप देखेंगे कि जहाँ कोड डाला गया है वहाँ एक विराम लेने के बाद आगे का टेक्स्ट पढ़ा जाता है।
※ 1000ms = 1 सेकंड
ms या s के पहले की संख्या बदलकर आप "अंतराल" की लंबाई को अपनी इच्छानुसार बदल सकते हैं।
- 200ms = 0.200 सेकंड
- 500ms = 0.500 सेकंड
- 1000ms = 1.000 सेकंड
- 2000ms = 2.000 सेकंड
- 3s = 3 सेकंड आदि
का उपयोग करते समय ध्यान देने योग्य बातें
पूरे वाक्य की शुरुआत में
उदाहरण:
मैं शुरुआत में 5 सेकंड का अंतराल बनाना चाहता हूँ
↑ तकनीकी सीमाओं के कारण इस प्रकार का उपयोग संभव नहीं है।
इसके अलावा, अंतराल की अधिकतम सीमा 10 सेकंड (10000ms, 10s) है।
यदि आप इससे अधिक समय सेट करते हैं, तो इसे 10 सेकंड तक सीमित कर दिया जाएगा।
〇〇
यह टैग Ondoku की बहुभाषी आवाज (Multilingual) के साथ कई भाषाओं में टेक्स्ट पढ़वाते समय, प्रत्येक भाग के लिए भाषा निर्दिष्ट करने के लिए है।
इसका उपयोग तब किया जाता है जब उच्चारण गलत हो रहा हो, या जब वाक्य में बहुत सारी भाषाओं का उपयोग किया गया हो और उनकी पहचान करना कठिन हो।
जापानी में कोन्निचिवा को, अंग्रेजी मेंHello कहते हैं,
फ्रेंच मेंBonjour ,
जर्मन मेंGuten Tag ,
और चीनी में你好 कहा जाता है।
○○
यह ○○ भाग के टेक्स्ट को "बीप" की ध्वनि (सेंसर ध्वनि) के साथ बजाता है।
यह थोड़ा मनोरंजक कोड है। इस कोड से घिरे अक्षरों को बीप की आवाज से बदल दिया जाता है।
यह शब्दप्रसारण के लिए वर्जित है
○○
अल्फाबेट पढ़ते समय प्रत्येक अक्षर को स्पेल आउट (स्पेलिंग के साथ) किया जाता है।
The spelling of hello isHello
हालाँकि, कुछ आवाजों में यह SSML त्रुटि (error) पैदा कर सकता है। कृपया इसे ध्यान में रखते हुए उपयोग करें।
जापानी: ननामी (Nanami)
अंग्रेजी (USA): en-US-A
○○
यह कोड आपको 'योमिगाना' (उच्चारण) प्रदान करने की अनुमति देता है।
टेक्स्ट रीडिंग में कभी-कभी अनपेक्षित उच्चारण हो सकता है।
उदाहरण के लिए, यदि "一行" का उच्चारण "Ichiyuki" हो जाता है, तो उसे "Ichigyou" के रूप में योमिगाना देकर सही उच्चारण कराया जा सकता है।
कोड में ○○ में मूल शब्द और ◇◇ में उसका उच्चारण दर्ज करें।
Ichiyuki नहीं बल्कि 一行 (Ichigyou) के रूप में सही पढ़ें
○○
कोड से घिरे शब्दों पर जोर देकर (emphasize) पढ़वाया जा सकता है।
यह कोड शब्दों कोजोरदार बना सकता है
○○
प्रोसॉडी (prosody - छंदशास्त्र/लय) प्राकृतिक भाषा बोलने के दौरान निम्नलिखित विशेषताओं का सामूहिक नाम है:
- ध्वनि का उतार-चढ़ाव
- विराम की स्थिति
- लंबाई और तीव्रता, आदि।
इस कोड के माध्यम से आप इन 3 प्रकारों को समायोजित कर सकते हैं:
- rate (रेट, गति)
समायोजन कोड: "x-slow", "slow", "medium", "fast", "x-fast", "default" - pitch (पिच, ऊंचाई)
समायोजन कोड: "x-low", "low", "medium", "high", "x-high", "default" - volume (वॉल्यूम, तीव्रता)
समायोजन कोड: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"
तेजी से बोलें।
ऊंची आवाज में बोलें।
जोर से बोलें।
धीरे और बहुत कम आवाज में बोलें।
तेजी से, ऊंची आवाज में और सामान्य वॉल्यूम में बोलें।
SSML का लाभ उठाकर Ondoku को और अधिक सुविधाजनक क्यों न बनाएं?
इस प्रकार, SSML का उपयोग करके आप Ondoku को और भी प्रभावी ढंग से उपयोग कर सकते हैं!
वीडियो निर्माण या प्रस्तुतियों के लिए, Ondoku की स्वाभाविक और सुनने में आसान आवाजों का और अधिक विस्तृत रूप से लाभ उठाएं।
■ एआई भाषण संश्लेषण सॉफ्टवेयर "ओन्डोकू"
"ओन्डोकू" एक ऑनलाइन टेक्स्ट-टू-स्पीच टूल है जिसका उपयोग बिना किसी प्रारंभिक लागत के किया जा सकता है।
- जापानी, अंग्रेजी, चीनी, कोरियाई, स्पेनिश, फ्रेंच और जर्मन सहित लगभग 50 भाषाओं का समर्थन करता है।
- पीसी और स्मार्टफोन दोनों से उपलब्ध है
- व्यवसाय, शिक्षा, मनोरंजन आदि के लिए उपयुक्त।
- किसी इंस्टॉलेशन की आवश्यकता नहीं, आपके ब्राउज़र से तुरंत उपयोग किया जा सकता है
- छवियों से पढ़ने का भी समर्थन करता है
इसका उपयोग करने के लिए, बस टेक्स्ट दर्ज करें या साइट से एक फ़ाइल अपलोड करें। सेकंडों में प्राकृतिक ध्वनि फ़ाइलें उत्पन्न करें। आप 5,000 वर्णों तक वाक् संश्लेषण का निःशुल्क उपयोग कर सकते हैं, इसलिए कृपया पहले इसे आज़माएँ।
Email: ondoku3.com@gmail.com
टेक्स्ट रीडिंग सॉफ्टवेयर ओन्डोकू। यह एक टेक्स्ट-टू-स्पीच सेवा है जिसका उपयोग बिना किसी इंस्टॉलेशन के मुफ्त में किया जा सकता है। यदि आप निःशुल्क पंजीकरण करते हैं, तो आप प्रत्येक माह 5000 अक्षर तक निःशुल्क प्राप्त कर सकते हैं। अभी मुफ्त में रजिस्टर करें