ارائه الگوریتم جدید مبتنی بر مدل مخلوط گوسی با استفاده از ویژگی‌های ضرایب کپسترال نرمالیزه شده توانِ بر مبنای فیلتر کاکلی در سیستم تصدیق هویت گوینده

نویسندگان

1 دانشگاه پدافند هوایی خاتم الانبیباء(ص)

2 دانشگاه صنعتی امیرکبیر

چکیده

در این مقاله، یک الگوریتم استخراج ویژگیِ مبتنی بر سیستم شنوایی، بر اساس یک تبدیل زمانی- فرکانسی به نام تبدیل شنوایی (AT) و ضرایب کپسترال نرمالیزه شده توان(PNCC)، که یک ویژگی موفق در زمینه تشخیص گفتار و گوینده بوده است، پیشنهاد می­گردد. به طور معمول عملکرد مدل­های صوتی که توسط داده­های بدون نویز(تمیز) آموزش داده می­شوند، وقتی در شرایط نویزی مورد آزمایش قرار می­گیرند به طور فزاینده­ای کاهش می­یابد. ویژگی پیشنهادی که ضرایب کپسترال نرمالیزه شده توانِ مبتنی بر فیلتر کاکلی (CFPNCC) نامیده ­می­شود تحت چنین شرایطی مقاومت بالایی را از خود بروز می­دهد. ویژگی بارز الگوریتم پیشنهادی ترکیب مزیت‌های فیلتر بانک کاکلی با مزایای ویژگی PNCC  است که مقاومت توأم در مقابل نویزهای ایستان و غیر ایستان را به همراه دارد. به­گونه‌ای که آزمایش‌های انجام‌شده بر روی پایگاه دادگان استاندارد SSC نشان می­دهد، در سیستم تصدیق گوینده مبتنی بر مدل مخلوط گوسی، این ویژگی بهتر از ویژگی PNCC عمل می­کند و به­طور کلی نسبت به سایر ویژگی­های متداول در زمینه تشخیص گوینده مانند MFCC و RASTA-PLP < /span> در شرایط نویزی نرخ خطای پایین­تری را داراست.

کلیدواژه‌ها