Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi
Yazarlar: Efe Tankut YAPAROĞLU, Yavuz ŞENOL
Konular:Mühendislik, Elektrik ve Elektronik
DOI:10.28948/ngumuh.516805
Anahtar Kelimeler:Konuşmacı doğrulama,Eğitim kümesi optimizasyonu,RBF yapay sinir ağları,MFCC,Cohort
Özet: Bu çalışmada, konuşmacı doğrulama görevi için iki aşamalı bir karar verme algoritması önerilmiştir. Bu iki aşamalı algoritma, ikinci aşamada sahtekarlara dayanıklı yapı sayesinde ilk aşamayı geçen sahtekârları ortadan kaldırmayı amaçlıyor. Birinci aşamada, öznitelik olarak mel-frekanslı sepstral katsayılar (MFCC) kullanılarak temel bir sistem oluşturulmuş ve bir radyal taban fonksiyonu (RBF) sinir ağı kullanılarak konuşmacı modellemesi gerçekleştirilmiştir. Ardından, eğitim setini iki kısımda optimize etmek için araştırmalar gerçekleştirildi: (1) taklitçi konuşmacı özniteliklerinin gerçek konuşmacı özniteliklerine oranı, (2) taklitçi konuşmacı kümesi içinde aynı cinsiyet özniteliklerinin zıt cinsiyet özniteliklerine oranı (gerçek konuşmacıya bağlı olarak). Son olarak, iki aşamalı karar verme algoritması sunulmuş ve iki aşamalı sistem tarafından sağlanan performans artışı test sonuçlarıyla birlikte verilmiştir.