ارایه یک روش بهبودیافته نهان کاوی گفتار در داده های صوتی مبتنی بر VoIP با استفاده از رویکرد یادگیری عمیق

نوع مقاله : قدرت- انتقال و توزیع

نویسندگان

1 دانشگاه صنعتی مالک اشتر

2 دانشیار دانشگاه صنعتی مالک اشتر تهران

چکیده

امروزه پروتکل انتقال صدا از طریق اینترنت(VoIP) به‌صورت گسترده در ارتباطات بلادرنگ و شبکه‌های اجتماعی مورد استفاده قرار گرفته و به حامل مناسبی برای روش‌های نهان‌نگاری تبدیل‌شده است. در راستای مقابله با این تهدیدات، روش‌های متعدد نهان‌کاوی ابداع‌شده‌اند که در میان راه‌حل‌های ارائه‌شده، ترکیب روش‌های پردازش سیگنال و یادگیری ماشین، امکان ایجاد نهان‌کاوهایی با دقت بسیار بالا را فراهم نموده است. در این مقاله یک رویکرد ترکیبی از روش‌های پردازش سیگنال گفتار و الگوریتم‌های هوش مصنوعی استفاده شده است. در این تحقیق ابتدا پیش‌پردازش داده بر روی سیگنال صوتی فشرده‌شده با کدک G.729 صورت می‌گیرد که ویژگی‌های درون‌فریمی و همبستگی‌های بین‌فریمی را با دقت خوبی استخراج می‌کند. سپس نتایج به‌دست‌آمده به یک شبکه یادگیری عمیق داده شده تا آموزش داده‌های پاک از داده‌های نهان نگاشته انجام گیرد. ارزیابی نتایج حاصل از پیاده‌سازی، میزان بهبود را هم در بخش صحت تشخیص و در بحث زمان محاسبات شامل می‌شود. روش پیشنهادی برای دو خانواده مهم نهان‌نگاری یعنی QIM و PMS مورد ارزیابی قرار گرفته و برای نرخ‌های مختلف ادغام روش مذکور تست و پیاده‌سازی شده است. نکته مهم دیگر تست برخط بودن روش ارائه‌شده بوده که برای فایل‌های 1000 میلیثانیه‌ای، زمان پاسخ‌گویی کمتر از 5 میلیثانیه بوده که نشان از سرعت بالای مدل پیشنهادی در مرحله اجرا می‌‌باشد.

کلیدواژه‌ها

موضوعات


Smiley face