0 مذي ثانية 0 ملي نائية 0 مذي ثانية
المشكلة في ال ا51908 5066617 أنني لا أستطيع أن أجعل الحاسب يتعامل مع ال [51903 013109
ولذلك أقوم بتوصيف هذه الإششارات عن طريق جميع الملامح الثابتة 88011765 لها وبذلك أكون عملت
8/ استخلاص الخصائص 1321101 6 681117]
وهي ذات معنى مقارب لل 8009ا00006 فهي التعبير عن الصوت بواسطة مجموعة من الصفات وطبعا
كل ما زادت الصفات التي أقوم باستخلاصها من الصوت كل ما يكون التعرف على الصوت أسهل وكان
نسبة الخطأ في عملية التعرف آقل 1
يمكننا تصنيف التعرف على الكلام كالثالي:
© // 1 091711100©© 0+0/لا 1501316 ويستخدم للتعرف على كلمات منفصلة ومعزولة عن بعضها
وهو أسهل أنواع التعرف وذلك لأننا لا نواجه مشكلة ال 0-2010011316017 وهي التقاء الحرف في
نهاية الكلمة الأولى مع الحرف في بداية الكلمة الثانية مما يسبب صعوبة في التعرف
» //0 11017أ7 1209 1/010 001160160 يستخدم للتعرف على مجموعة من الكلمات بفواصل وذلك
بوضع 50005 بين الكلمات وهو يشبه النوع السابق لكنه أصعب في التعرف
١620911000 05 566217 5لا00 0111 و هي للتعرف على الكلام المتواصل وإلى الآن مازال به
العديد من المشاكل وهذا الصنف يحتاج إلى الكثير من التدريب وهو من أصعب الأنواع في التعرف
نا 5 170635137819 5066017 وهي عمليات فهم الكلام بواسطة مترجمات خاصة وممكن تحويله إلى
نصوص بعد التعرف عليه
5 50010719 060ل ويستخدم للتنقيب عن كلمات معينة أو ما يسمى بال 10000 (8»! في موضوع
معين
وبما أننا في هذه السلسلة نتحدث عن علم التعرف على الكلام فإننا سنتطرق إلى عدة جوانب خاصة بكيفية
إنتاج الكلام وأعضاء النطق في الإنسان وبعض المعلومات الخاصة بهذا المجال
في عمليات التعرف على الكلام من المهم أن نركز على كيفية إنتاج الكلام وعملية إنتاج الكلام تبداً بالتفكير
في الرسالة التي يريد الشخص النطق بها وهذه الرسالة ستتحول بعد ذلك إلى إشارات عصبية
ا55903 161831 _التي تصبح غالبا إشارات كهربية تحرك أعضاء النطق و بعد أن تتحرك أعضاء
الذي يحتوي على معلومات الرسالة الأصلية وعندها تُسمع الرسالة للطرف الآخر أي سوف تُنتج الكلمة
أو المنطوق 11613:166ن
ال (1//217670101 هي عبارة عن شكل من أشكال الموجات وإحدى الطرق التي نستطيع تمثيل الكلام
وهي أسهل الموجات
تمثيل اك (117/3981000
وإحداثيات ال 1//37©80010(0 السيني هو الوقت ©1107 والصادي يمثّل الطاقة للحرف 508197 أو
وهناك أنواع أخرى للموجات نستطيع بواسطتها تمثيل الكلام ومنها ما يسمى ب 5062131817 الذي تكون
في عملية المعالجة0106655109
التردد
أما ال 506010973070 فإننا نستطيع تمثيل الكلام بها وهي ذات 3 أبعاد : الوقت ©2100 التردد
عندما أريد أن أنطق أي كلمة 61731:12662انا في البداية سيتم التنفس من الرئتين ثم يذرج الهواء إلى
الحنجرة والذي يسبب عند مروره بها اهتزاز الحبال الصوتية
8©1+أومنه إلى التجويف الفمي 681/87 0731 وممكن في بعض الحروف مثل م- ن يضطر الهواء
للمرور بالتجويف الأنفي 621/1 113531 وبعدها تذرج الكلمة وتصبح مسموعة وتتحول إلى
ال 101110 117/3178 عندها سنطلق عليها مسسى 800115216
إذن نطلق على الكلمة مصطلح 360115816 عندما تخرج من الفم وتتحول إلى 1//317660110 و تصبح
والعملية العكسية هي الأنن التي تستقبل هذا الكلام حيث تدخل الإشارة إلى طبلة الأذن وتبداً المطرقة
تضرب وتصل الرسالة إلى الشخص الآخر ويسمع الكلمة
الجهاز الصوتي أو جهاز النطق 3003631015 70231 يتمثل في 3 أعضاء رئيسية هي الحلق
1110216 _القم 1004217 _ الأنف 0056
الحلق 118021 يحتوي على الحبال الصوتية 60105 70631 التي تهتز لتنتج لنا الأصوات
وفي الرسم التالي تفصيل لجهاز النطق:
الحباد الصونية م --- دي الضحساقة بين
متي ل جؤكسسسسمس١ > الحبال الصوتية
نقاط النطق تتمثل في : الأسنان 166417 اللسان 1007916 اللهاة 78117 الجزء الغلمي خلف
الأسنان العليا 21780138 الحنك الأعلى 10107217 116 4ه 1006 :031316 11330 أو ما يعرف
ب سقف الفم و الشفاه كم
نود أن أوضح الآن عدة مفاهيم تختص بالموجات الصوتية
موجات غير متساوية
أو©ة©0©110 ©1016 وهي تعني أنها ليست دورة متساوية مثل الشكل السابق وذلك بسبب أن موجات
الكلام مستحيل أن تتساوى ويتخللها فترات من ال 10156 وشكلها تقريبا كالتالي:
المهم أن تكون الموجات غير متساوية
وهناك مسمى للموجات وهو ما نمثل به ال171015©6_وهي 18000407 وذلك بسبب عشوائيتها انظر
الشكل :
وظيفة الحبال الصوتية عند إخراج الكلام:
نستطيع تقسيم حالات الحبال الصوتية إلى 3 حالات مختلفة بعد أن نتفق على أن الحبال الصوتية في
الأحوال العادية تكون مقفلة نوعا ما
ضغط الهواء الآتي لها من الرئتين مما يسبب ارتطامها ببعض ليقوموا بعمل شيء من الاهتزاز ثم يعودوا
مرة أخرى إلى حالتهما المقفلة تتكرر هذه الحركة أثناء إنتاج الكلام بشكل دوري مما يسبب إنتاج طنين
معين الذي بدوره يسبب إنتاج الترددلا©2600080؟ وطبعا طالما الهواء لم يتعدى الحبال الصوتية إذن لم
يتم إنتاج الصوت بعد حتى يتعداها انظر الرسم:
طول الحبال الصوتية: حيث أنه كلما قصرت الحبال الصوتية كان التردد فيها أعلى
ومقدار شد فيها: حيث يزداد التردد كلما زاد التندد في الحبال الصوتية
والتردد الناتج عن اهتزاز الحبال الصوتية عادة يتراوح بين 60 - 400 هرتز حيث يبلغ متوسط التردد
في الحبال الصوتية عند الدساء البالفين 180 هرتز وعند الرجال البالغين 100 هرتز
2 الحالة الثانية للحبال الصوتية هي عند ما يسمى ب
أو 50117 701061655 وليس المعنى أنها ليست مسموعة تماما ولكن أنها حروف تنطق ولكن عند
تمثيلها نلاحظ أنها تشبه حالة ال ©0015 أي ذات قيمة منخفضة عندها ستكون الحبال الصوتية مفتوحة
3 الحالة الثالثة هي كون الحبال الصوتية مفتوحة بشكل كبير أي تكون المسافة بينها واسعة وهذه تحدث
ينتج صوت حينها
د د # اح #ا بلا
المسافة بين الحبال الصوتية كا مما يضرّق مكان مرور الهواء فيها وبالتالي عند تنفس الشخص
ينتج صوت ملحوظ للنفس وذاك بعد أن ضاقت المسافة بين الحبال الصوتية فإن الهواء أثناء مروره يسبب
اهتزاز للحبال الصوتية مما أدى إلى ظهور الصوت المزعج أثناء التنفس
بعض التعاريف الهامة:
20006006 هي آفل وحدة صوتية وهي عبارة عن مجموعة الرموز التي يتكون منها الصوت وممكن
تكون حرف وقد تكون أقل منه
05 اللغويات و هي القواعد التي تحكم وترتب الأصوات لكي تنتج لغة مثلا تأخذ
ال0110076076 وتضعها مع بعضها البعض بدرتيب وقواعد معينة لينتج لي كلمات التي تجتمع وتكون لي
الجمل التي تكون الكلام أو اللغة 112
5 علم الأصوات و هي التي تدرس الصوتيات وتصنفها مثلا تصنف ال 101660 من
لننتقل الآن إلى آلية إنتاج الكلام
0/0 وعجوم اللهاة
)0 : | التجويف الأتفي]
مخرحات الأنف ) د
البلنسوم ء
كاف تلمعوب عه كلف لهعص+
الحباب الصوتية
التمثيل التحطيظي لآلية إنتاج الكلام | 0"
نلاحظ أن حجم الرئة يتناسب مع حجم الهواء الذي يكون بداخلها
نستطع تقسيم الأصوات التي تستطيع القناة الصوتية إخراجها إلى أ010/6/ا و 01150173171
ال 7010/61 وهي الحروف التي يتم إنتاجها عندما يكون الفم مفتوح قليلا وهي الحروف المدية وهنا
جزئي وطبعا هذه السواكن تعمد على الحرف الذي يسبقها والدرف الذي يليها
التي قد تكون من الشفاه أو اللسان أو طرف اللسان أو باشتّراك بعض نقاط النطق لإخراج هذه الدروف
2 وطريقة نطق الحرف 311100131101 07 110311161
٠ 0105676 وهي الحروف الانفجارية حيث يتم قفل نقطة من نقاط النطق نهائيا مثل الشفاه أو
غيرها ثم بعدها يخرج الحرف فجأة مثل حرف 8 في كلمة 018 وحرف ال 6 في كلمة
© وتمثل الموجة بالشكل التالي:
ممحط
1681/65 وهي الحروف الاحتكاكية الناتجة عن احتكاك نقطتين من نقاط النطق أثناء النطق
بحرف معين مثل الحروف التالية:
كبير من إخراجها
٠ 20500103165 وهي الحروف التي تخرج مع إقفال أحد نقاط النطق تماما ثم يتدرج الهواء في
الخروج بعد ذلك مثل حرف ال 3 في كلمة 110098
01110217 2008 التي تعني اقتراب أعضاء النطق من بعضها عند إنتاج الحرف ولها نوعين
561111701765 وهي تشبه الحروف المدية 7 ,//1
5 نا وهي الحروف المنسابة مثّل 1 ,18
بسم الله الرحمن الرحيم
شهدت التسعينيات أول تعامل مع الأنظمة المنطوقة بعد ما بات في وقت من الأوقات حلم مبرمجي
الحاسوب الوصول إلى الطريقة التي تمكنهم من التحدث مع الحاسوب والتخاطب معه , هذه الطريقة التي
أصبحت تستخدم لمساعدة من يواجهون صعوبة في استخدام لوحة المفاتيح أو الماوس ليتعاملوا مع
الحاسوب , وهي مع ذلك وسيلة للرفاهية والراحة لدى الإنسان مما علمه الله لبني البمر
كان هذا العلم هو التعرف على الكلام الذي صار في بعض الدول المتقدمة وسيلة لإنجاز امتحانات
الطلاب وحقق كير من الأمن بعد ما استخدمته الجهات الأمنية ا
بداية حديثنا سيكون عن فروع علم الحاسب الآلي كالتالي :
ين -1علوم الحاسب الآلي(65 506166 66ا001770)
+ -2نظم المعلومات(15 558171 11131017 17101)
وعلوم الحاسب الآلي ([65)بحد ذاتها يندرج تحتها عدة فروع نذكر منها:
٠ معالجة الصور | ( 0106655179 1113206)
)5066617 0106855179 معالجة أو تشغيل الكلام( ٠
والذي ذريد التوصل إليه أن (0106655109 5066617) معالجة الكلام هو أحد الأفرع الرئيسية لعلوم
الحاسب الآلي
والحاسب الآلي لكي يقوم بعملية معالجة الأصوات (الكلام بالأخص) يجب في البداية أن يقوم بالتعرف
علي هذه الأصوات وهو ما يسمى ب (0091718101©: 50©©617)التعرف على الكلام وعليه سيكون
محور حديثنا في هذه السلسلة
كلمة: (5066611) تعني الكلام
لكن : (©7016) تعني الأصوات عموما ليس فقط الأصوات البشرية بل تتعدى ذلك إلى أصوات العصافير
وأصوات الأجهزة وغير ذلك
مثلا لدينا مصنع به العديد من الأجهزة فيهم جهاز جديد قمنا بتسجيل صوته عند أول تشغيل له وبذلك قد
أخذنا بصمة له وهو جديد وبعد عمل هذا الجهاز 1000 ساعة مثلا عندها يحتاج الجهاز إلى صيانة
نسجل صوته مرة أخرى ونأخذ بصمة أخرى له
تبقى هذه البصمات الصوتية محفوظة لدينا
عندما يصادفنا جهاز في المصنع به عطل نأخذ منه بصمة صوتية (أي تسجيل صوتي لهذا الجهاز وهو
يحتاج إلى صيانة
ولذلك ما نعنيه في هذه السأسلة_التعرف على الكلام (266090758101 (508©61) هو تعرف الحاسوب
على صوت الإنسان
نظام التعرف على الكلام: (5175186111 ١09111017 50262)
وهي العمليات التي تسبق المعالجة الأساسية للصوت وهي عبارة تحويل الصوت المدخل إلى الحاسوب إلى
شكل يستطيع ال (86009171267])التعامل معه
وال ( 460901726 متمثل في جزأين (1/17 8 5/101 )
ال /5/10 وهي البرامج التي تتعامل مع الإشارات الصوتية والخاصة بالتعرف على الصوتيات وال 7ثا/
هي الحاسوب نفسه
وبالتالي لكي يقوم الحاسوب بمعالجة الإشارات الصوتية والتعامل معها لا بد أن تتم عملية
ال 6-0702©55109 08 التي تتلخص في تحويل الإشارات الصوتية المدخلة إلى شكل ثنائي
لنبداً العملية من البداية س من الناس قام بتسجيل صوته عن طريق المايكروفون للحاسب مجموعة
الكلمات التي قام بتسجيلها هي عبارة سلسلة من الإشارات المتصلة والتي تعرف ب 569:31 013109/
وممكن تسميتها ب [51913 601011107110115 والتي تمثل بالشكل التالي-:
بحيث أث كل حرف
تختلف قيمته عن
مهلي ثائدرة الوقت