Eskişehir Türk Dünyası Uygulama ve Araştırma Merkezi Bilişim Dergisi
Yazarlar: Osman USLU, Serel ÖZMEN-AKYOL
Konular:Bilgisayar Bilimleri, Bilgi Sistemleri
Anahtar Kelimeler:Makine Öğrenmesi,Metin Sınıflandırma,Metin Analizi,Destek Vektör Sınıflandırıcısı,Rastgele Orman,Naive Bayes Sınıflandırıcı
Özet: En büyük bilgi kaynağının internet olarak kabul edildiği günümüz bilgi çağında, elektronik ortamda yer alan metinlerin gün geçtikçe artması sonucunda metin madenciliği ve makine öğrenimi konusu önem kazanmıştır. Teknolojinin gelişmesine paralel olarak bu alanlarda da yenilikler geliştirilmektedir. Yapılan yenilikler ile herhangi bir platformda düzensiz olarak bulunan metinlerin, anlamlı bir bütün haline getirilerek sınıflandırılması ihtiyacı doğmaktadır. Bu çalışmada; farklı makine öğrenmesi yöntemleri kullanılarak Türkçe haber metinlerinin sınıflandırması yapılmaktadır. Haber içerikleri olarak birçok haber metninin ve haber kategorisinin yer aldığı bir veri seti kullanılmıştır. Çalışmada, Destek Vektör Sınıflandırıcısı, Rastgele Orman ve Naive Bayes Sınıflandırıcına göre gerçekleştirilen analiz sonuçları karşılaştırılarak, en başarılı performansa sahip yöntemin 91% doğruluk oranı ile Naive Bayes Sınıflandırıcısı olduğu görülmüştür.