جرت في قسم علوم الحاسوب بكلية العلوم جامعة بغداد، مناقشة رسالة الماجستير الموسومة “تمييز الاصوات في البيئة المزدحمة باعتماد التعلم العميق” للطالبة غدير قاسم علي واشراف الاستاذ المساعد الدكتور حسام علي عبدالمحسن .

وهدف البحث الى تطوير نظام يعتمد على تقانات التعلم العميق (RNN وCNN) للتعرف على المتحدثين في البيئات المزدحمة بدقة عالية، وإنشاء قاعدة بيانات مخصصة (GSCC) تحتوي على تسجيلات لمتحدثين منفردين ومجموعات تصل إلى خمسة متحدثين في بيئات مختلفة، بغية تحسين دقة التعرف على المتحدثين باستخدام ميزات معالجة الإشارة المتقدمة مثل MFCC والكروما والطيف الميل.

واوصت الرسالة بعد ان أظهر النظام دقة عالية بلغت ٩٩.٩% لمتحدث واحد أو اثنين، و٩٩.٩% لثلاثة متحدثين، و٩٨.٥% لأربعة متحدثين، و٩٨.٢% لخمسة متحدثين، فيما أثبتت الشبكات العصبية التكرارية (RNN) فعاليتها في تحليل الأنماط الزمنية وتمييز المتحدثين في البيئات الصوتية المعقدة، وساهم استخدام الميزات الصوتية المتقدمة، مثل MFCC والكروما والطيف الميل، في تحسين دقة التعرف على المتحدثين.

Comments are disabled.