Veri Bilimi

Veri Bilimi

Otomatik Konuşma Tanıma Sistemlerinde Kullanılan Gerçek Metin Verisinde Biçimbilimsel-Sözdizimsel Hataların Tespiti ve Düzeltmesi

Yazarlar: Hüseyin POLAT, Hayri SEVER, Saadin OYUCU, Şükran TEKBAŞ

Cilt 2 , Sayı 2 , 2019 , Sayfalar 18 - 24

Konular:Mühendislik

Anahtar Kelimeler:Konuşma Tanıma,Doğal Dil İşleme,Düz Metin Hataları,Gramatik Kelime Hatası

Özet: Türkçe Otomatik Konuşma Tanıma (ASR: Automatic Speech Recognition) sistemlerinde kullanılan akustik model gürbüz bir dil modeli ile desteklenmediği durumlarda kelime hata oranı yüksek çıkmaktadır. İyi dizayn edilmiş bir dil modeli ile akustik modelin birlikte ASR’de kullanılması kelime hata oranını düşürmektedir. ASR için gerekli dil modelinin eğitiminde düz metin verisi kullanılmaktadır. Kullanılan metin verisinin doğruluğu ASR modellerinin eğitimi için oldukça önemlidir. Bu çalışmada, doğal dil işlemeye dayalı bir yöntem kullanılarak Türkçe ASR sisteminin eğitilmesinde kullanılan metin verisi içerisindeki yazım hatalarının tespiti ve düzeltilmesi gerçekleştirilmiştir. Öncelikle metin verisi içerisinde dil bilgisel olarak yanlış yazılmış olan kelimeler bulunmuştur. Bir kelimedeki karakter eksikliği, karakter fazlalığı, karakterlerin yer değiştirmesi veya karakteri yanlış yazılmış olan kelimeler hatalı olarak kabul edilmiştir. Metin verisi içerisinde hatalı olarak kabul edilen kelimeler morfolojik analiz ile tespit edilmiştir. Yanlış kelimelerin yerine atanacak olan kelimeler belirlenmiştir. Yanlış yazılmış olan kelimeler doğru kelimeler ile değiştirilmiştir. Gerçekleştirilen çalışma hatalı kelimeleri tespit etme ve doğru kelimeler ile yer değiştirme işleminde %93 oranında başarı göstermiştir.


ATIFLAR
Atıf Yapan Eserler
Henüz Atıf Yapılmamıştır

KAYNAK GÖSTER
BibTex
KOPYALA
@article{2019, title={Otomatik Konuşma Tanıma Sistemlerinde Kullanılan Gerçek Metin Verisinde Biçimbilimsel-Sözdizimsel Hataların Tespiti ve Düzeltmesi}, volume={2}, number={2}, publisher={Veri Bilimi}, author={Hüseyin POLAT,Hayri SEVER,Saadin OYUCU,Şükran TEKBAŞ}, year={2019}, pages={18–24} }
APA
KOPYALA
Hüseyin POLAT,Hayri SEVER,Saadin OYUCU,Şükran TEKBAŞ. (2019). Otomatik Konuşma Tanıma Sistemlerinde Kullanılan Gerçek Metin Verisinde Biçimbilimsel-Sözdizimsel Hataların Tespiti ve Düzeltmesi (Vol. 2, pp. 18–24). Vol. 2, pp. 18–24. Veri Bilimi.
MLA
KOPYALA
Hüseyin POLAT,Hayri SEVER,Saadin OYUCU,Şükran TEKBAŞ. Otomatik Konuşma Tanıma Sistemlerinde Kullanılan Gerçek Metin Verisinde Biçimbilimsel-Sözdizimsel Hataların Tespiti ve Düzeltmesi. no. 2, Veri Bilimi, 2019, pp. 18–24.