ما هي لغة توصيف تركيب الكلام (SSML). كيفية الاستخدام في برامج تحويل النص إلى كلام وقائمة الأكواد الرئيسية.

26 يناير، 2026

ما هي لغة توصيف تركيب الكلام (SSML). كيفية الاستخدام في برامج تحويل النص إلى كلام وقائمة الأكواد الرئيسية.

مرحباً، شكراً جزيلاً لاستخدامكم Ondoku دائماً.

سنقوم في هذه المقالة بتقديم SSML.

قد تبدو بعض المصطلحات الفنية صعبة قليلاً، ولكن من خلال معرفة كيفية استخدام SSML، ستتمكن من استخدام Ondoku بشكل أكثر سهولة وفعالية.

سنشرح ذلك بطريقة مبسطة، لذا يرجى المتابعة.

ما هو SSML

SSML هي إحدى لغات الترميز الصوتي.

"لغة الترميز" هي لغة تحدد هيكل (دور) كل جزء من النص، تماماً مثل HTML.

من خلال كتابة أكواد SSML، يمكنك التحكم في نطق Ondoku بشكل أكثر مرونة.

حالياً، أكواد SSML المدعومة في جميع اللغات هي

هذان النوعان فقط من الأكواد. الأكواد الأخرى قد لا تكون متاحة اعتماداً على اللغة أو نوع الصوت. يرجى العلم بذلك مسبقاً.

كيفية استخدام SSML في Ondoku

استخدام SSML في Ondoku سهل للغاية.

يرجى إدخال كود SSML مباشرة في مربع نص Ondoku.

سيتم بعد ذلك تطبيق SSML تلقائياً.

في بداية ونهاية النص،

مجرد إدراج هذا يمكنك من استخدام SSML.

يرجى التأكد من عدم نسيان إدراج هذا الكود! إذا لم يتم تضمين كود ، فلن يتم تطبيق SSML.

هو الكود اللازم لتفعيل SSML.

تأكد من وضع هذا الكود في بداية ونهاية النص الذي ترغب في قراءته.

مثال

يرجى إدخال النص الذي ترغب في قراءته هنا

كود وقت التوقف (Break time) هو، كما يوحي اسمه، كود لإنشاء فواصل زمنية.

قم بإدخال الكود في المكان الذي تريد إدراج فاصل فيه، واستبدل جزء ○○ بالرقم الذي تفضله.

عند القراءة بشكل طبيعي في Ondoku، قد لا تظهر الفواصل الزمنية تماماً كما تتوقع.

في مثل هذه الحالات، يكون هذا الكود مفيداً.

على سبيل المثال،

لنحاول إدراج هذا الكود في المكان الذي تريد وضع فاصل فيه.


أريد ترك فاصلبسيط عند قراءة هذه الجملة

ستلاحظ بعد ذلك أنه يأخذ نفساً في الموضع الذي تم فيه إدراج الكود قبل متابعة القراءة.

※ 1000ms = ثانية واحدة

من خلال تغيير الرقم الموجود قبل ms أو s، يمكنك تغيير طول "الفاصل" بحرية.

  • 200ms = 0.200 ثانية
  • 500ms = 0.500 ثانية
  • 1000ms = 1.000 ثانية
  • 2000ms = 2.000 ثانية
  • 3s = 3 ثوانٍ، وما إلى ذلك

نقاط يجب مراعاتها عند استخدام

يختلف سلوك إدراج وسم في بداية النص بالكامل باختلاف الصوت، ولا يمكن ضمان السلوك.

مثال: أريد إنشاء فاصل مدته 5 ثوانٍ في البداية

↑ هذا النوع من الاستخدام غير ممكن تقنياً.

أيضاً، الحد الأقصى لطول الفاصل هو 10 ثوانٍ (10000ms، 10s).

إذا تم ضبط وقت أطول من ذلك، فسيتم تقريبه إلى 10 ثوانٍ.

يتم شرح كيفية استخدام وسم في هذه المقالة أيضاً.

〇〇

هذا الوسم مخصص لتحديد اللغة لكل جزء من النص عند استخدام القراءة متعددة اللغات بصوت Ondoku المتعدد اللغات (Multilingual).

يُستخدم عندما يكون هناك خطأ في النطق، أو عندما يتم استخدام لغات عديدة في النص ولا يمكن تمييزها.


日本語のこんにちはは、英語ではHello
フランス語ではBonjour
ドイツ語ではGuten Tag
中国語では你好といいます。

يتم شرح كيفية استخدام وسم بالتفصيل في هذه المقالة.

○○

يتم تشغيل النص في جزء ○○ بصوت "بيب" الخاص بالكلمات المحظورة.

إنه كود يضفي لمسة من المرح. يتم استبدال الأحرف الموجودة داخل هذا الكود بصوت "بيب".


هذه الكلمة هي محظورة تلفزيونياً

○○

عند قراءة الحروف الأبجدية، يتم نطق كل حرف على حدة (التهجئة).


The spelling of hello isHello

ومع ذلك، هناك بعض الأصوات التي قد يسبب فيها SSML هذا خطأً. يرجى استخدامه مع العلم بذلك.

اليابانية: ななみ

الإنجليزية (USA): en-US-A

○○

هذا كود يسمح بإضافة طريقة النطق (Yomigana).

عند قراءة النصوص، قد يحدث أحياناً نطق غير متوقع.

على سبيل المثال، إذا تم نطق "一行" كـ "Ichiyuki"، يمكنك جعلها تنطق بشكل صحيح كـ "いちぎょう" عن طريق إضافة طريقة النطق.

في الكود، يرجى إدخال الحروف الصينية (Kanji) في ○○ وطريقة النطق في ◇◇.


تقرأ بشكل صحيح كـ 一行 وليس Ichiyuki

○○

يمكنك جعل القراءة تركز على الكلمات المحاطة بالكود (التشديد).


هذا الكود يمكنه القيام بـ التشديد

○○

العروض (prosody) هو مصطلح عام لخصائص أصوات اللغة عند التحدث بأسلوب طبيعي، مثل:

  • ارتفاع وانخفاض الصوت
  • مواقع التوقف
  • الطول والقوة والضعف، إلخ.

ما يمكن ضبطه بهذا الكود هو:

  • السرعة (rate)
    أكواد الضبط: 「x-slow」「slow」「medium」「fast」「x-fast」「default」
  • طبقة الصوت (pitch)
    أكواد الضبط: 「x-low」「low」「medium」「high」「x-high」「default」
  • مستوى الصوت (volume)
    أكواد الضبط: 「silent」「x-soft」「soft」「medium」「loud」「x-loud」「default」


أتحدث بسرعة.
أتحدث بصوت عالٍ.
أتحدث بصوت مرتفع.
أتحدث ببطء وبصوت منخفض.
أتحدث بسرعة، وبصوت عالٍ، وبمستوى صوت عادي.

لماذا لا تستخدم SSML لجعل Ondoku أكثر سهولة؟

بهذه الطريقة، يمكنك استخدام Ondoku بشكل أكثر فعالية من خلال الاستفادة من SSML!

لماذا لا تستخدم أصوات Ondoku الواقعية والواضحة في مجموعة أوسع من المجالات مثل إنتاج الفيديو والعروض التقديمية؟

■ برنامج تركيب الكلام بالذكاء الاصطناعي "Ondoku"

"Ondoku" هي أداة لتحويل النص إلى كلام عبر الإنترنت ويمكن استخدامها دون أي تكلفة أولية.

  • يدعم ما يقرب من 50 لغة بما في ذلك اليابانية والإنجليزية والصينية والكورية والإسبانية والفرنسية والألمانية.
  • متاح من كل من الكمبيوتر الشخصي والهاتف الذكي
  • مناسب للأعمال والتعليم والترفيه وما إلى ذلك.
  • لا يتطلب التثبيت، ويمكن استخدامه على الفور من المتصفح الخاص بك
  • كما يدعم القراءة من الصور

لاستخدامه، ما عليك سوى إدخال نص أو تحميل ملف من الموقع. قم بإنشاء ملفات صوتية طبيعية في ثوانٍ. يمكنك استخدام تركيب الكلام لما يصل إلى 5000 حرف مجانًا، لذا يرجى تجربته أولاً.

يمكن لبرنامج تحويل النص إلى كلام "Ondoku" قراءة 5000 حرف شهريًا بصوت AI مجانًا. يمكنك بسهولة تنزيل ملفات MP3 والاستخدام التجاري ممكن أيضًا. إذا قمت بالتسجيل مجانًا، فيمكنك تحويل ما يصل إلى 5000 حرف شهريًا مجانًا من النص إلى كلام. جرب أوندوكو الآن.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
مقالات ذات صلة

برنامج قراءة النص أوندوكو. إنها خدمة تحويل النص إلى كلام لا تتطلب التثبيت ويمكن لأي شخص استخدامها مجانًا. إذا قمت بالتسجيل مجانًا، فيمكنك الحصول على ما يصل إلى 5000 حرف مجانًا كل شهر. إشترك الآن مجانا