Bilgisayar Bilimleri
Yazarlar: Erkan DUMAN, Zafer TOLAN
Konular:Bilgisayar Bilimleri, Bilgi Sistemleri, Bilgisayar Bilimleri, Teori ve Metotlar, Bilgisayar Bilimleri, Yapay Zeka
DOI:10.53070/bbd.990574
Anahtar Kelimeler:Popüler CNN Modelleri,Dermoskopik Görüntüler,Cilt Hastalıkları Teşhisi,Dengeli Dağılım Sergilemeyen Veri Seti
Özet: Bu çalışmada, dengeli dağılım sergilemeyen bir veri seti karşısında popüler evrişimsel sinir ağı mimarilerinin nasıl bir performans sergileyebilecekleri çok-sınıflı bir medikal görüntü işleme uygulaması ile detaylı bir şekilde analiz edilmiştir. 7 farklı deri hastalığına ait 10.015 tane renkli lezyon resimlerinden oluşan büyük ölçekli ve dengesiz bir veri seti olan HAM10000(İnsan-Makineye Karşı-10000), test aracı olarak kullanılmıştır. Bu veri seti ile eğitilip performans karşılaştırması yapılan evrişimsel sinir ağı modellerinin eğitim aşamasında ölçüm metriği olarak f1-score değerleri ve test aşamasında ise her bir modelin hem hata matrisi hem de ROC eğrileri altında kalan AUC alanları hesaplanmıştır. Evrişimsel sinir ağı modellerinin eğitim süreçleri, k-fold çapraz doğrulama ile analiz edilmiştir. Ayrıca imagenet veri setindeki filtreler, Eğitim-Transferi seçeneği ile içe aktarılmıştır. Ön-eğitimli bu modellerin uygulamaya özgü kendilerini geliştirebilmeleri için ise en derindeki evrişim katmanlarına ince-ayar işlemi uygulanmıştır. Ezber yapma problemini engellemek amacı ile modellerin çıkardıkları özellikler, tek sütunlu vektör haline getirildikten sonra 50% oranında silme işlemi ve ağırlıkların güncelleme aşamasında ise L2-düzenleme(weigh decay) işlemi uygulanmıştır. Çalışmanın asıl amacı olmamak ile birlikte evrişim mimarilerin performanslarını kısmen de olsa iyileştirebilmek için HAM10000 sınıfındaki azınlık sınıfları için veri çeşitlendirme ile oluşturulan sentetik lezyon görüntüleri, bilgi sızıntısına neden olmayacak şekilde eğitim sürecine dâhil edilmiştir.