هي الاتصال أو إرسال المُدخل بعد أن تم التعرف عليه إلى أنظمة ال /08ا/5 أو /11/10 التي
وأمثلة على ذلك:
الأمن , مثلا نفرض أن
880117 وكما يتضح من الاسم أننا ممكن نستخدم الصوت في
ن ووضعناه في الحاسوب
نظام صوتي للدخول لإحدى القاعات وقمنا بأخذ بصمة صوتية لشخْص
'مثلا يتم فتح باب القاعة_ لو أتى الشخص وأدخل الجملة
غيره سيقوم كرت الصوت مبدل
كما قلنا بتحويل
وبعدها تتم عملية التعرف بمقارنة البصمة المسجلة في النظام مع
ابقت البصمتين أو مع وجود نسبة خطأ بسيطة جدا مسموح بها فإنه
البصمة الجديدة المدخلة حاليا فإذا
سيتم فتح باب القاعة
ج من تسجيل الصوت ما يسمى ب1956 10016 وهي الضوضاء الناتجة
تلميح:عندما نلاحظ الإشارات الصوتية لشخص يتحدث نلاحظ فترات السكوت تمثل أيضا بواسطة موجات
لكنها بسيطة جدا تسمى 0158 لاحظ الشكل:
07> ممكن نستخدم ال908607 في التعليم أيضًا..
0 ممكن التحكم في الأجهزة الكهربائية بواسطة الصوت أن
الشخص عدة
5 ومعناها تشخيص الأمراض أعني أنه يمكن بواسطة ميكانيزم معين عندما
كلمات يتم تشخيص حالته..
وبالمناسبة تشخيص الأمراض في علوم الحاسب يشكل فرع هام جدا نسميه ب 850101600181565
المعلوماتية العضوية وهي الخاصة بأعضاء الإنسان والتي يتم فيها تشخيص الأمراض بواسطة طريقتين
,,,الأولى وهو ما عرقتاه 066551119 586617
وأخيرا هذه المراحل الثلاثة 600700111681100 , 609011001 , 16-00006655109 هي غير مرئية
للمستخدم لكن كل ما يراه المستخدم من عملية التعرف التي تنجز له بواسطة برنامج أو غيره هي : دقة
تعرف هذا البرنامج على الكلام و سرعة التعرف أي سرعة
المستخدم من عمل تقدير للبرنامج..
ننتقل الآن للتقسيمة الرئيسية لمعالجة الكلام..
ححالجه الكلام
تحدثنا بالسابق عن مرحلة ال 06855(019+]-6ء!| ووا
ا ستذكر الخطوات الأساسية التي
ومعناها جمع أشخاص معينين ذكور وإناث في أعمار متقاربة ونأخذ لهم بصمات صوتية وطبعا كما ذكرنا
أنه يجب الحصول على هذه الإشارات بشكل يسمح للحاسب بأن يتعامل معها..
2/ اكتشاف المسموع والغير مسموع (صه نا08166 01660لانا :8 001660
من الطبيعي أن يكون لديئا في الكلام أصوات مسموعة وغير مسموعة...
وبالمقابل لدينا حروف أخرى مثل ال (س . ش ) ال لها أقل ما يمكن وتسمى غير مسموعة أو بالأصج
غير المجهورة ليس بسبب أنها لا تسمع ولكن ب
الحروف قريبة جدا من حالة ال 170556
ولمعرفة الفرق بين هذه الأصوات المسموعة 106660 والغير مسموعة 1/0©0/ل سنتطرق إلى مفهوم
ال 05509 28:0 لتشاهد الفرق بيت الموجات المسموعة وغير المسموعة
من الرسم نلاحظ الأصوات المسموعة 1/0660
مقدار ال 0106ةا2070 لها كبير جدا والموجات أطول
مما يسبب أن عدد مرات إلتقاء أو تقاطع موجاتها مع الخط الأفقي 200655 11001200121 قلي جدا "كما
نلاحظ النقاط الحمراء في الرسم هي نقاط تقاطع الموجات مع الخط الأفقي " وهذا ما نسميه بمعدل
9 2800 الذي هو عبارة عن معدل تقاطع الموجات مع الخط الأفقي ,وجاءت كلمة 2610 بسبب
أن قيمة الموجة أو الإشارة عند التقاطع تكون مساوية للصفر
حيث يمكننا أن نقول بأن معدل ال 00055809 280 منخفض في ال-508807 101680
أقيمة ال 0108ا2070 لها قليل جدا, والموجات آقصر مما يسبب أن معدل التقائها مع الخط الأ
وسريع_وبالتالي فإن معدل ال 0055079 2800 كبير هنا.
3/ تحديد بداية ونهاية الكلام المفيد 00101-04816100 6170
طبعا عند النطق هناك فترات توقف عن الكلام لكن فترات التوقف هذه كما قلنا تحتوي على
إشارات ا51903 ضعيفة 00158 ومن ضمن الأشياء المستهدفة في المعالجة 0700655179 هي تقليل كمية
ي تتم عن طريق التخلص من الإشارات ضرورية مثّل ال 00158 وهي تتم بواسطة
ا متخصصة للتخلص من ال 10158 بطريقة معينة.
يتم التخلص من هذه الأشارات الضعيقة (00156) بواسطة
8 خاصة
10/800104 1101 يتضح معنى هذا المصطلح من خلال المثال التاليى
مثلا لو كان لدينا مجموعة من الطالبات نطقوا كلمة واحدة مثلا) الحمد لله (عندما نأخذ تسجيل صوتي لكل
واحدة منهن فإننا نلاحظ أن كل طالبة تنطق الكلمة في
إذن الواجب علينا وضع جميع البصمات في طول واحد_ لكي نستطيع التعامل معها ككلمة واحدة دون
الإخلال بالكلمة وطبعا هذه لها ميكانيزم معين وطريقة 81900107177 خاصة لهذه الأغراض.
زمنية بسيطة جدا ستكون أعضاء النطق في ث
مثلا أنناء النطق بحرف معين فإنه خلال
ملحوظ وهذه الفترة هي 20 ملي ثانية.
ال 508661 يحدث فيها ثبات كل (20 ملي ثانية ) وهي فترة صغيرة جدا تكاد لا تذكر , وبالتالي
ملي ثانية) ثم نأخذ من كل ©5807 عينة (5507018) تعبر عن خصائص هذا ال 58076 وذلك بدل أن
اسوف أقسمها إلى مجموعة 0310165 حسب طولها وأبدأ بعد ذلك بأخذ العينات
مثلا عندي كلمة
ي ولكن ستكون هناك
م واف ولاه
انية 0 عدي ثانية
0 دي ثانية
من كل 0808 عينة تعبر عنه بذك ما تأخذ الإشارة بكافلها
06 »1/00 وبواسطة هذه المرحلة يتم التقليل من نسبة الخطأ التي قد تحدث نتيجة تقسيم موجات
الكلام إلى 780765 وأخذ العينات.
وطريقتها هي أنه يتم عمل 1000017 على ال 58076 الأول ثم آخر على ال 58076 الثاني وهكذا
والهدف منها كما قلنا تقليل نسبة الخطأ 1
0 من ال 868018 الأول و 9650 من
وتتقاطع هذه النوافذ ال 100000175 بنسبة 9650 يعني
الثاني وهكذا انظر الشكل التالي--:
لام صلا
0 عدي ثانية .| 20 علي ثانية 0 ملي ثانية
المشكلة في ال 559081 5066617 أنني لا أستطيع أن أجعل الحاسب يتعامل مع ال ا5:903 03109
ولذلك أقوم بتوصيف هذه الإشارات عن طريق جميع الملامج الثابتة 6800765) لها وبذلك أكون عملت
اوهي ذات معنى مقارب لل 800ا07008 فهي التعبير عن الصوت بواسطة مجموعة من الصفات وطبعا
ما زادت الصفات التي آقوم باستخلاصها من الصوت كل ما يكون التعرف على الصوت أسهل... وكان
نسبة الخطأ في عملية التعرف أقل.
يمكننا تصنيف التعرف على الكلام كالتالي:
110/8 09011100 000 15012180 ويستخدم للتعرف على كلمات منفصلة ومعزولة عن بعضها
وهو أسهل أنواع التعرف وذلك لأننا لا نواجه مشكلة ال 00-20160018000 وهي التقاء الحرف في
نهاية الكلمة الأولى مع الحرف في بداية الكلمة الثانية مما يسبب صعوبة في التعرف..
/14© 09011100»© 0/030 0001160180 يستخدم للتعرف على مجموعة من الكلمات بفواصل وذلك
بوضع 58005 بين الكلمات وهو يشبه النوع السابق لكنه أصعب في التعرف..
© 05 1000 وه 506617 0111015 وهي للتعرف على الكلام المتواصل وإلى الآن مازال به
العديد من المشاكل وهذا الصنف يحتاج إلى الكثير من التدريب وهو من أصعب الأنواع في التعرف..
لا 5 70651807619 5066217 وهي عمليات فهم الكلام بواسطة مترجمات خاصة وممكن تحويله إلى
نصوص بع التعرف عليه..
5 الا 50011109 1/060 ويستخدم ب عن كلمات معينة أو ما يسمى بال 10050 ع»! في موضوع
وبما أ في هذه السلسلة نتحدث عن علم التعرف على الكلام أ سنتطرق إلى عدة جوانب خاصة بكيفية
إنتاج الكلام وأعضاء النطق في الإنسان وبعض المعلومات الخاصة بهذا المجال..
في عمليات التعرف على الكلام من المهم أن نركز على كيفية إنتاج الكلام وعملية إنتاج الكلام
في الرسالة التي بريد الشخص النطق بها وهذه الرسالة ستنحول بعد ذلك إلى إشارات عصبية
أ بالتفكير
ا9190 8351©« التي تصبح غالبا إشارات كهربية تحرك أعضاء النطق و بعد أن تتحرك أعضاء
الذي يحتوي على معلومات الرسالة الأصلية وعندها تُسمع الرسالة للطرف الآخر.. أي سوف ثنتج الكلمة
أو المنطوق 0001661731066
ال 1/0/2178601000 هي عبارة عن شكل من أشكال الموجات وإحدى الطرق التي نستطيع تمثيل الكلام
وهي أسهل الموجات
تمثيل ان 2089800000
وإحداثيات ال 19/27©620000 السيني هو الوقت ©8071 والصادي يمثل الطاقة للحرف 508897 أو
وهناك أنواع أخرى للموجات نستطيع بواسطتها تمثيل الكلام ومنها ما يسمى ب (1ه1 506003 الذي
في عملية المعالجة0106655109 .
صنو
نستطيع تمثيل الكلام بها وهي ذات 3 أبعاد : الوقت ©8800 التريد
عندما أريد أن أنطق أي كلمة 08568066 في البداية سيتم التنفس من الرئتين ثم يرج الهواء إلى
الحنجرة والذي يسبب عند مروره بها اهتزاز الحبال الصوتية
ومن إلى التجويف الفمي 687/587 0381 وممكن في بعض الحروف مثل م- ن يضطر الهواء
للمرور بالتجويف الأنفي 631/587 718581 وبعدها تخرج الكلمة وتصبح مسموعة وتتحول إلى
ال 20000 1/2176 عندها سنطلق عليها مسمى 860105556
إذن نطلق على الكلمة مصطلح ©2600158 عندما تخرج من الفم وتتحول إلى 10/8176600177 و تصبح
والعملية العكسية هي الأذن التي تستقبل هذا الكلام حيث تدخل الإشارة إلى طبلة الأذن وتبداً المطرقة
تضرب وتصل الرسالة إلى الشخص الآخر ويسمع الكلمة.
الجهاز الصوتي أو جهاز النطق 3003:830015 70631 يتمثل في 3 أعضاء رئيسية هي الحلق
11086 _القم 0008 _الأنف 0056
الحلق +12024© يحتوي على الحبال الصوتية 60:05 70631 التي تهتز لتنتج لنا الأصوات.
وفي الرسم التالي تفصيل لجهاز النطق:
نقاط النطق تتمثل في : الأسنان 8617© اللسان 700918 اللهاة 78101000 الجزء الغلمي خلف
الأسنان العليا 21780128 الحنك الأعلى 5217ا0700 1116 06 12006 :031316 11330 أو ما يعرف
ب سقف القم و الشقاد ودرا
نود أن أوضح الآن عدة مفاهيم تختص بالموجات الصوتية.
موجات غير متساوية.
أو©06:1001 ©1116 وهي تعني أنها ليست دورة متساوية مثل الشكل السابق وذلك بسبب أن موجات
الكلام مستحيل أن تتساوى ويتخللها فترات من ال ©0015 وشكلها تقريبا كالتالي:
المهم أن تكون الموجات غير متساوية
وهناك مسمى للموجات وهو ما نمثل به ال©10015_ وهي 1800000 وذلك بسبب عشوائيتها انظر
الشكل :
وهي التي تمثل فترات بين الكلام مثل التنفس.
وظيفة الحبال الصوتية عند إخراج الكاام:
نستطيع تقسيم حالات الحبال الصوتية إلى 3 حالات مختلفة بعد أن نتفق على أن الحبال الصوتية في
الأحوال العادية تكون مقفلة نوعا ما.
مما يسبب ارتطامها ببعض ليقوموا بعمل شيء من الاهتزاز ثم يعولوا
يتم إنتاج الصوت بعد حتى يتعداها انظر الرسم:
طول الباق لصوي حيث أنه كلما قصرت الحبال الصوتية كان التردد فيها أعلى
ومقدار الشد ف
حيث يزداد التردد كلما زاد الشد في الحبال الصوتية..
والتردد الناتج عن اهتزاز الحبال الصوتية عادة يتراوح بين 60 - 400 هرتز حيث يبلغ متوسط التردد
في الحبال الصوتية عند الذساء البالغين 180 هرتز وعند الرجال البالغين 100 هرتز.
2 الحالة الثانية للحبال الصوتية هي عند ما يسمى ب 0 ل111/01660نا
أو 50190 701661855 وليس المعنى أنها ليست مسموعة تماما ولكن أنها حروف تنطق ولكن عند
تمثيلها نلاحظ أنها تشبه حالة ال 00158 أي ذات قيمة منخفضة عندها ستكون الحبال الصوتية مفتوحة
3 الحالة الثالثة هي كون الحبال الصوتية مفتوحة بشكل كيير أي تكون المسافة بينها واسعة وهذه تحدث
أثناء التنفس حيث يسبب انفتاحها الواسع مرور الهواء بينها دون عمل اهتزاز على الحبال الصوتية ولا
ينتج صوت حينها.
المسافة بين الحبال الصوتية 6101155 مما يضيِّق مكان مرور الهواء فيها وبالتالى عند تنفس الشخص
ينتج صوت ملحوظ للنفس وذلك بعد أن ضاقت المسافة بين الحبال الصو الهواء أثناء مروره يسبب
اهتزاز للحبال الصوتية مما أدى إلى ظهور الصوت المزعج أثناء الت
بض التعاريف الهامة:
76 هي أقل وحدة صوتية وهي عبارة عن مجموعة الرموز التي يتكون منها الصوت وممكن
تكون حرف وقد تكون أقل منه.