[फ्री / पेड] प्रत्येक कंपनी के भाषण संश्लेषण इंजन का सारांश। कौन सा सॉफ्टवेयर किस इंजन का उपयोग करता है
17 जनवरी 2021
कई पाठ-पठन सॉफ़्टवेयर की घोषणा आज की गई है।
हालाँकि, जब मैं टेक्स्ट-टू-स्पीच सॉफ़्टवेयर की आवाज़ सुनता हूँ,
"हुह जैसी कोई बात नहीं है? क्या यह आवाज अन्य सॉफ्टवेयर्स की तरह नहीं है?"
वास्तव में, टेक्स्ट-टू-स्पीच सॉफ़्टवेयर के लिए बेस स्पीच सिंथेसिस इंजन की आवश्यकता होती है।
इसलिए, भले ही सॉफ़्टवेयर का नाम अलग हो, अगर ध्वनि संश्लेषण इंजन समान है, तो आवाज़ का रंग समान है।
इस बार, हम भाषण संश्लेषण इंजन को पेश करेंगे जो कि मुफ्त में इस्तेमाल किया जा सकता है और खरीदे जाने पर भाषण संश्लेषण इंजन का उपयोग किया जा सकता है।
कुछ को एहसास होगा, "ओह, उस सॉफ्टवेयर ने इस संश्लेषण इंजन का उपयोग किया!"
कृपया इसके लिए तत्पर हैं!
एक मुक्त भाषण संश्लेषण इंजन
मुफ्त वाक्य पढ़ने वाला सॉफ्टवेयर मुख्य रूप से है
- AquesTalk
- JTalk खोलें
आवाज संश्लेषण पुस्तकालय इंजन का उपयोग किया जाता है।
AquesTalk
एक्वेस्ट, इंक द्वारा विकसित AquesTalk।
सॉफ्टवेयर जो एक तथाकथित "धीरे-धीरे" आवाज में जोर से पढ़ सकता है
सभी "एक्वा टॉक" के साथ बनाया गया।
विशिष्ट उदाहरण स्टिक रीडिंग और सॉफ्ट टॉक हैं।
चूंकि पाठ से सिंथेटिक भाषण बनाना आसान है, इसलिए इसका उपयोग व्यक्तिगत उपयोग से लेकर वाणिज्यिक उत्पादों तक कई स्थितियों में किया जाता है।
सोफटॉक और स्टिक रीडिंग के लिए आधार के रूप में उपयोग किए जाने के अलावा, इसका उपयोग यूटीएयू डिफ़ॉल्ट आवाज के नमूने के लिए भी किया जाता है। इसके अलावा, यह भी टेलीफोन जैसे घरेलू उपकरणों के लिए एक मार्गदर्शन आवाज के रूप में प्रयोग किया जाता है।AquesTalk पहली बार 25 मई, 2006 को जारी किया गया था। विकास की अवधि दो साल से कम है। (AquesTalk सार्वजनिक निकास)
ध्वनि स्रोत एक वास्तविक सिंथेटिक आवाज है, जिसमें कोई मानव अंदर नहीं है, रिकॉर्डिंग के आधार पर मैन्युअल रूप से संचालन के बिना बनाया गया है।जनवरी 2010 AquesTalk 2exit, AquesTalk के उत्तराधिकारी की घोषणा की गई थी।
यह प्लेटफार्मों की एक विस्तृत श्रृंखला का समर्थन करता है जिसमें विंडोज, मैक ओएस एक्स, विनसीई, आईफोन और एंड्रॉइड जैसे स्मार्टफोन शामिल हैं। हाल ही में, एक स्वतंत्र माइक्रोचिप (हार्डवेयर) जिसे AquesTalk पिको कहा जाता है, दिखाई दिया है।उद्धरण स्रोत: एनिको नीको का विश्वकोश
एपीआई उपयोग लाइसेंस और विकास पुस्तकालय अलग से बेचे जाते हैं।
विवरण के लिए, कंपनी की वेबसाइट देखें।
JTalk खोलें
ओपन JTalk नागोया इंस्टीट्यूट ऑफ टेक्नोलॉजी, टोकुडा-री लैब में विकसित एक जापानी टेक्स्ट-टू-स्पीच सिंथेसिस सिस्टम है।
यह संशोधित बीएसडी लाइसेंस के तहत वितरित खुला स्रोत है।
"ओपन JTalk" का उपयोग पाठ्यपुस्तकों द्वारा किया जाता है। यदि आप इसे एक बार सुनते हैं और आप कहेंगे "मैंने इसके बारे में सुना है"।
भाषण संश्लेषण इंजन जिसका उपयोग शुल्क के लिए किया जा सकता है
पेड स्पीच सिंथेसिस इंजन
- आईबीएम: वाट्सन टेक्स्ट टू स्पीच
- Google: टेक्स्ट टू स्पीच
- अमेज़ॅन: पोली
- Microsoft: SAPI5
प्रसिद्ध है।
कई आकर्षक योजनाएं हैं जैसे कि हजारों पात्रों तक मुफ्त।
उपरोक्त के लिए, एचपी पर डेमो आदि प्रदान किए जाते हैं, और आप ध्वनि को खेल सकते हैं और सुन सकते हैं।
भाषण संश्लेषण इंजन बहुत मुश्किल है
इस बार मैंने भाषण संश्लेषण इंजन पेश किया।
स्पीच सिंथेसिस इंजन का उपयोग करके, आप अपना खुद का टेक्स्ट-टू-स्पीच सॉफ्टवेयर बना सकते हैं या इसे अपनी इच्छानुसार कस्टमाइज़ कर सकते हैं।
हालांकि, जब आप इसका उपयोग करने का प्रयास करते हैं , तो यह एपीआई द्वारा प्रदान किया जाता है, इसलिए जब तक आप इसे प्रोग्राम नहीं कर सकते, इसे सेट करना मुश्किल है ।
एपीआई "एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस" का एक संक्षिप्त नाम है, जिसका अर्थ है "एक प्रोग्राम जिसे किसी निश्चित फ़ंक्शन के लिए विशेष प्रोग्राम द्वारा साझा किया जा सकता है" या "सॉफ़्टवेयर कार्यों को साझा करने के लिए एक तंत्र"। यदि अक्सर उपयोग किए जाने वाले फ़ंक्शन एपीआई के रूप में तैयार किए जाते हैं, तो खरोंच से प्रोग्राम करने की कोई आवश्यकता नहीं है। आप कुशलता से विकसित करने के लिए आवश्यकतानुसार एपीआई का उपयोग कर सकते हैं।
वेब एपीआई के मामले में, कार्यक्रम वेब पर प्रकाशित किया जाता है और इसे बाहर से कॉल करके उपयोग किया जाता है। वेब एपीआई विभिन्न क्षेत्रों में प्रकाशित किए जाते हैं, लेकिन उनमें से कई मुफ्त उपलब्ध हैं।
उदाहरण के लिए, यदि आप एपीआई का उपयोग करके अन्य कंपनियों की वेबसाइटों से नवीनतम जानकारी प्राप्त कर सकते हैं, तो आप अपनी वेबसाइट या एप्लिकेशन में नए कार्य जोड़ सकते हैं और सेवा में सुधार कर सकते हैं। हाल के वर्षों में, स्मार्टफोन एप्लिकेशन के लिए आवश्यक स्तर में वृद्धि हुई है, इसलिए एप्लिकेशन विकास में वेब एपीआई का उपयोग करना आम है।
उद्धरण स्रोत: इंटरनेट अकादमी
भुगतान किए गए संस्करणों में टेक्स्ट-रीडिंग सॉफ़्टवेयर पेश करने वाली कंपनियों ने अपने स्वयं के भाषण संश्लेषण इंजन विकसित किए हैं या इस समय पेश किए गए भुगतान भाषण संश्लेषण इंजन का उपयोग कर रहे हैं।
"पहले स्थान पर, एक भाषण संश्लेषण इंजन क्यों नहीं बना?"
आप सोच सकते हैं, लेकिन यह एक आसान काम नहीं है।
इसके लिए बहुत सारे शोधकर्ताओं, डेवलपर्स, श्रमसाध्य प्रक्रियाओं की आवश्यकता होगी जो पैसे और काम की आवश्यकता होती है।
बहुत कम से कम, व्यक्तियों के लिए यह मुश्किल है, और हम अनुशंसा करते हैं कि आप किसी कंपनी या शोध संस्थान के पैमाने पर काम करें।
इसलिए, यदि आपको एपीआई का उपयोग करना मुश्किल लगता है, तो पेड टेक्स्ट-रीडिंग सॉफ़्टवेयर का उपयोग करना आसान और सहज है।
फ्री से लेकर पेड तक कई तरह के टेक्स्ट-टू-स्पीच सॉफ्टवेयर्स आज भी उपलब्ध हैं।
मुझे यकीन है कि आप अपना पसंदीदा सॉफ़्टवेयर पा सकते हैं।
अधिक विस्तार से इस लेख की जाँच करें!
वाक्य पढ़ने के सॉफ्टवेयर की सिफारिश की सारांश। 7 चयन [नि: शुल्क / भुगतान]
मुझे उम्मीद है कि यह लेख आपकी मदद करता है।
मैं आपसे पुनः मिलने की आशा करता हूं।
Email: ondoku3.com@gmail.com
टेक्स्ट रीडिंग सॉफ्टवेयर ओन्डोकू। यह एक टेक्स्ट-टू-स्पीच सेवा है जिसका उपयोग बिना किसी इंस्टॉलेशन के मुफ्त में किया जा सकता है। यदि आप निःशुल्क पंजीकरण करते हैं, तो आप प्रत्येक माह 5000 अक्षर तक निःशुल्क प्राप्त कर सकते हैं। अभी मुफ्त में रजिस्टर करें