[फ्री / पेड] प्रत्येक कंपनी के भाषण संश्लेषण इंजन का सारांश। कौन सा सॉफ्टवेयर किस इंजन का उपयोग करता है

14 सितमबर 2020

कई पाठ-पठन सॉफ़्टवेयर की घोषणा आज की गई है।

हालाँकि, जब मैं टेक्स्ट-टू-स्पीच सॉफ़्टवेयर की आवाज़ सुनता हूँ,

"हुह जैसी कोई बात नहीं है? क्या यह आवाज अन्य सॉफ्टवेयर्स की तरह नहीं है?"

वास्तव में, टेक्स्ट-टू-स्पीच सॉफ़्टवेयर के लिए बेस स्पीच सिंथेसिस इंजन की आवश्यकता होती है।

इसलिए, भले ही सॉफ़्टवेयर का नाम अलग हो, अगर ध्वनि संश्लेषण इंजन समान है, तो आवाज़ का रंग समान है।

इस बार, हम भाषण संश्लेषण इंजन को पेश करेंगे जो कि मुफ्त में इस्तेमाल किया जा सकता है और खरीदे जाने पर भाषण संश्लेषण इंजन का उपयोग किया जा सकता है।

कुछ को एहसास होगा, "ओह, उस सॉफ्टवेयर ने इस संश्लेषण इंजन का उपयोग किया!"

कृपया इसके लिए तत्पर हैं!

एक मुक्त भाषण संश्लेषण इंजन

एक मुक्त भाषण संश्लेषण इंजन

मुफ्त वाक्य पढ़ने वाला सॉफ्टवेयर मुख्य रूप से है

  • AquesTalk
  • JTalk खोलें

आवाज संश्लेषण पुस्तकालय इंजन का उपयोग किया जाता है।

AquesTalk

एक्वेस्ट, इंक द्वारा विकसित AquesTalk।

सॉफ्टवेयर जो एक तथाकथित "धीरे-धीरे" आवाज में जोर से पढ़ सकता है
सभी "एक्वा टॉक" के साथ बनाया गया।

विशिष्ट उदाहरण स्टिक रीडिंग और सॉफ्ट टॉक हैं।

चूंकि पाठ से सिंथेटिक भाषण बनाना आसान है, इसलिए इसका उपयोग व्यक्तिगत उपयोग से लेकर वाणिज्यिक उत्पादों तक कई स्थितियों में किया जाता है।
सोफटॉक और स्टिक रीडिंग के लिए आधार के रूप में उपयोग किए जाने के अलावा, इसका उपयोग यूटीएयू डिफ़ॉल्ट आवाज के नमूने के लिए भी किया जाता है। इसके अलावा, यह भी टेलीफोन जैसे घरेलू उपकरणों के लिए एक मार्गदर्शन आवाज के रूप में प्रयोग किया जाता है।

AquesTalk पहली बार 25 मई, 2006 को जारी किया गया था। विकास की अवधि दो साल से कम है। (AquesTalk सार्वजनिक निकास)
ध्वनि स्रोत एक वास्तविक सिंथेटिक आवाज है, जिसमें कोई मानव अंदर नहीं है, रिकॉर्डिंग के आधार पर मैन्युअल रूप से संचालन के बिना बनाया गया है।

जनवरी 2010 AquesTalk 2exit, AquesTalk के उत्तराधिकारी की घोषणा की गई थी।
यह प्लेटफार्मों की एक विस्तृत श्रृंखला का समर्थन करता है जिसमें विंडोज, मैक ओएस एक्स, विनसीई, आईफोन और एंड्रॉइड जैसे स्मार्टफोन शामिल हैं। हाल ही में, एक स्वतंत्र माइक्रोचिप (हार्डवेयर) जिसे AquesTalk पिको कहा जाता है, दिखाई दिया है।

उद्धरण स्रोत: एनिको नीको का विश्वकोश

एपीआई उपयोग लाइसेंस और विकास पुस्तकालय अलग से बेचे जाते हैं।

विवरण के लिए, कंपनी की वेबसाइट देखें।

AquestTalk

JTalk खोलें

ओपन JTalk नागोया इंस्टीट्यूट ऑफ टेक्नोलॉजी, टोकुडा-री लैब में विकसित एक जापानी टेक्स्ट-टू-स्पीच सिंथेसिस सिस्टम है।

यह संशोधित बीएसडी लाइसेंस के तहत वितरित खुला स्रोत है।

"ओपन JTalk" का उपयोग पाठ्यपुस्तकों द्वारा किया जाता है। यदि आप इसे एक बार सुनते हैं और आप कहेंगे "मैंने इसके बारे में सुना है"।

JTalk खोलें

भाषण संश्लेषण इंजन जिसका उपयोग शुल्क के लिए किया जा सकता है

भाषण संश्लेषण इंजन जिसका उपयोग शुल्क के लिए किया जा सकता है

पेड स्पीच सिंथेसिस इंजन

  • आईबीएम: वाट्सन टेक्स्ट टू स्पीच
  • Google: टेक्स्ट टू स्पीच
  • अमेज़ॅन: पोली
  • Microsoft: SAPI5

प्रसिद्ध है।

कई आकर्षक योजनाएं हैं जैसे कि हजारों पात्रों तक मुफ्त।

उपरोक्त के लिए, एचपी पर डेमो आदि प्रदान किए जाते हैं, और आप ध्वनि को खेल सकते हैं और सुन सकते हैं।

भाषण संश्लेषण इंजन बहुत मुश्किल है

इस बार मैंने भाषण संश्लेषण इंजन पेश किया।

स्पीच सिंथेसिस इंजन का उपयोग करके, आप अपना खुद का टेक्स्ट-टू-स्पीच सॉफ्टवेयर बना सकते हैं या इसे अपनी इच्छानुसार कस्टमाइज़ कर सकते हैं।

हालांकि, जब आप इसका उपयोग करने का प्रयास करते हैं , तो यह एपीआई द्वारा प्रदान किया जाता है, इसलिए जब तक आप इसे प्रोग्राम नहीं कर सकते, इसे सेट करना मुश्किल है

एपीआई "एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस" का एक संक्षिप्त नाम है, जिसका अर्थ है "एक प्रोग्राम जिसे किसी निश्चित फ़ंक्शन के लिए विशेष प्रोग्राम द्वारा साझा किया जा सकता है" या "सॉफ़्टवेयर कार्यों को साझा करने के लिए एक तंत्र"। यदि अक्सर उपयोग किए जाने वाले फ़ंक्शन एपीआई के रूप में तैयार किए जाते हैं, तो खरोंच से प्रोग्राम करने की कोई आवश्यकता नहीं है। आप कुशलता से विकसित करने के लिए आवश्यकतानुसार एपीआई का उपयोग कर सकते हैं।

वेब एपीआई के मामले में, कार्यक्रम वेब पर प्रकाशित किया जाता है और इसे बाहर से कॉल करके उपयोग किया जाता है। वेब एपीआई विभिन्न क्षेत्रों में प्रकाशित किए जाते हैं, लेकिन उनमें से कई मुफ्त उपलब्ध हैं।

उदाहरण के लिए, यदि आप एपीआई का उपयोग करके अन्य कंपनियों की वेबसाइटों से नवीनतम जानकारी प्राप्त कर सकते हैं, तो आप अपनी वेबसाइट या एप्लिकेशन में नए कार्य जोड़ सकते हैं और सेवा में सुधार कर सकते हैं। हाल के वर्षों में, स्मार्टफोन एप्लिकेशन के लिए आवश्यक स्तर में वृद्धि हुई है, इसलिए एप्लिकेशन विकास में वेब एपीआई का उपयोग करना आम है।

उद्धरण स्रोत: इंटरनेट अकादमी

भुगतान किए गए संस्करणों में टेक्स्ट-रीडिंग सॉफ़्टवेयर पेश करने वाली कंपनियों ने अपने स्वयं के भाषण संश्लेषण इंजन विकसित किए हैं या इस समय पेश किए गए भुगतान भाषण संश्लेषण इंजन का उपयोग कर रहे हैं।

"पहले स्थान पर, एक भाषण संश्लेषण इंजन क्यों नहीं बना?"

आप सोच सकते हैं, लेकिन यह एक आसान काम नहीं है।

इसके लिए बहुत सारे शोधकर्ताओं, डेवलपर्स, श्रमसाध्य प्रक्रियाओं की आवश्यकता होगी जो पैसे और काम की आवश्यकता होती है।

बहुत कम से कम, व्यक्तियों के लिए यह मुश्किल है, और हम अनुशंसा करते हैं कि आप किसी कंपनी या शोध संस्थान के पैमाने पर काम करें।

इसलिए, यदि आपको एपीआई का उपयोग करना मुश्किल लगता है, तो पेड टेक्स्ट-रीडिंग सॉफ़्टवेयर का उपयोग करना आसान और सहज है।

फ्री से लेकर पेड तक कई तरह के टेक्स्ट-टू-स्पीच सॉफ्टवेयर्स आज भी उपलब्ध हैं।

मुझे यकीन है कि आप अपना पसंदीदा सॉफ़्टवेयर पा सकते हैं।

अधिक विस्तार से इस लेख की जाँच करें!

वाक्य पढ़ने के सॉफ्टवेयर की सिफारिश की सारांश। 7 चयन [नि: शुल्क / भुगतान]

मुझे उम्मीद है कि यह लेख आपकी मदद करता है।

मैं आपसे पुनः मिलने की आशा करता हूं।

यह टेक्स्ट रीडिंग सॉफ्टवेयर ओन्डोकू है। ओन्डोकू 5000 तक मुफ्त में पाठ पढ़ सकता है। पाठ को उच्च गुणवत्ता में जोर से पढ़ा जाता है और इसे एमपी 3 के रूप में डाउनलोड किया जा सकता है। आप इसका उपयोग व्यावसायिक उद्देश्यों के लिए भी कर सकते हैं, इसलिए कृपया ओन्डोकू का उपयोग करें।
HP: ondoku3.com
Email: ondoku3.com@gmail.com
संबंधित लेख

टेक्स्ट रीडिंग सॉफ्टवेयर ओन्डोकू। यह एक टेक्स्ट-टू-स्पीच सेवा है जिसका उपयोग बिना किसी इंस्टॉलेशन के मुफ्त में किया जा सकता है।