ارائه الگوریتم جدید مبتنی بر مدل مخلوط گوسی با استفاده از ویژگی‌های ضرایب کپسترال نرمالیزه شده توانِ بر مبنای فیلتر کاکلی در سیستم تصدیق هویت گوینده

نویسندگان

1 دانشگاه پدافند هوایی خاتم الانبیباء(ص)

2 دانشگاه صنعتی امیرکبیر

چکیده

در این مقاله، یک الگوریتم استخراج ویژگیِ مبتنی بر سیستم شنوایی، بر اساس یک تبدیل زمانی- فرکانسی به نام تبدیل شنوایی (AT) و ضرایب کپسترال نرمالیزه شده توان(PNCC)، که یک ویژگی موفق در زمینه تشخیص گفتار و گوینده بوده است، پیشنهاد می­گردد. به طور معمول عملکرد مدل­های صوتی که توسط داده­های بدون نویز(تمیز) آموزش داده می­شوند، وقتی در شرایط نویزی مورد آزمایش قرار می­گیرند به طور فزاینده­ای کاهش می­یابد. ویژگی پیشنهادی که ضرایب کپسترال نرمالیزه شده توانِ مبتنی بر فیلتر کاکلی (CFPNCC) نامیده ­می­شود تحت چنین شرایطی مقاومت بالایی را از خود بروز می­دهد. ویژگی بارز الگوریتم پیشنهادی ترکیب مزیت‌های فیلتر بانک کاکلی با مزایای ویژگی PNCC  است که مقاومت توأم در مقابل نویزهای ایستان و غیر ایستان را به همراه دارد. به­گونه‌ای که آزمایش‌های انجام‌شده بر روی پایگاه دادگان استاندارد SSC نشان می­دهد، در سیستم تصدیق گوینده مبتنی بر مدل مخلوط گوسی، این ویژگی بهتر از ویژگی PNCC عمل می­کند و به­طور کلی نسبت به سایر ویژگی­های متداول در زمینه تشخیص گوینده مانند MFCC و RASTA-PLP < /span> در شرایط نویزی نرخ خطای پایین­تری را داراست.

کلیدواژه‌ها


عنوان مقاله [English]

Presenting A New Algorithm Based on GMM-UBM With Cochlear Filter- PNCC Feature for Speaker Verification

نویسندگان [English]

  • jafar khalilpour 1
  • Esmail zarezadeh 2
1
2
چکیده [English]

In this paper, an auditory-inspired feature extraction algorithm based on a recently published time-frequency transform, i.e., auditory transform (AT) and the power normalized cepstral coefficients (PNCC) is proposed. Usually, the performance of acoustic models trained in clean speech drops significantly when tested on noisy speech.The proposed feature, called Cochlear Filter PNCC (CFPNCC), has shown strong robustness in the acoustic mismatch situations. An important feature of the proposed algorithm is the combination of advantages of the cochlear filter with the advantages of the PNCC feature, which has the resistance to both stationary noise and non-stationary noise. As shown in our experiments, in a GMM-UBM speaker verification system, CFPNCC outperforms the original PNCC and achieves the best overall results on the SSC database compared to the conventional features such as MFCC and RASTA-PLP under noisy conditions.

کلیدواژه‌ها [English]

  • peaker Verification
  • Feature Extraction
  • Noise Robustness