Veri Bilimi
Yazarlar: Cantekin ÇELİKHASI, Ahmet SAYAR, Adem ULU
Konular:Mühendislik
Anahtar Kelimeler:Graf Benzerliği,LZ Sıkıştırma,Komşu Eşleşme,Kosinüs Benzerliği,DNA örüntü keşfi
Özet: Bu çalışmanın amacı farklı DNA örneklerindeki dizilimlerin benzerlik oranını hesaplamaktır. DNA verilerinin büyüklüklerinin getirdiği işlem hacmini kısaltmak ve performansı arttırmak için,DNA dizileri sıkıştırılıp motif çıkarımı yapıldı. Bunun için LZ Sıkıştırma algoritması kullanıldı. Elde edilen motiflerden her biri sadece bir graf düğümünü ifade ederken bu motiflerin sırası da düğümlerin komşuluklarını ifade edecek şekilde grafa dönüştürüldü. Her bir DNA’dan elde edilen graf, DNA’lardaki benzerliği bulabilmek için kullanıldı. Graflar üzerinden benzerlik oranını hesaplayan algoritmalardan, her iki Komşu Eşleşme ve Kosinüs Benzerliği metotlarını karşılaştırdık. Buna göre Kosinüs Benzerliği’nin Komşu Eşleşme’ye göre daha performanslı olduğunu gösterdik.