Bilgisayar Bilimleri

Bilgisayar Bilimleri

Classification of Documents Extracted from Images with Optical Character Recognition Methods

Yazarlar: Ömer AYDIN

Cilt 6 , Sayı 2 , 2021 , Sayfalar 46 - 55

Konular:Bilgisayar Bilimleri, Yapay Zeka

Anahtar Kelimeler:Optik karakter tanıma,OCR,Sınıflandırma,Naive Bayes,Makine Öğrenimi,Metin madenciliği,Görüntü işleme

Özet: Son on yılda, makine öğrenimi yöntemleri sürücüsüz arabalar, ses tanıma, etkili web araması ve insan genomunun çok daha iyi anlaşılması gibi birçok alanda katkı sağladı. Makine öğrenimi bugün o kadar yaygındır ki, muhtemelen farkında olmadan günde onlarca kez kullanılmaktadır. Bir makineye bazı süreçleri veya bazı durumları öğretmeye çalışmak, insan beyni tarafından tahmin edilmesi zor olan bazı sonuçları tahmin etmelerini sağlayabilir. Bu yöntemler aynı zamanda insan faaliyetleriyle genellikle kısa sürede yapılması imkânsız veya zor olan bazı işlemleri yapmamıza yardımcı olur. Bu nedenlerden dolayı, makine öğrenimi bugün çok önemlidir. Bu çalışmada, iki farklı makine öğrenimi yöntemi birleştirilmiştir. Gerçek dünyadaki bir sorunu çözmek için yapılan bu çalışmada, el yazması belgeleri önce bilgisayar ortamına aktarıldı ve sonra sınıflandırıldı. Tüm süreci gerçekleştirmek için üç temel yöntem kullanıldı. El yazısı veya basılı belgeler bir tarayıcı veya dijital kamera ile dijitalleştirilmiştir. Bu belgeler iki farklı optik karakter tanıma (OCR) işlemiyle işlenmiştir. Daha sonra üretilen metinler Naive Bayes algoritması kullanılarak sınıflandırılmıştır. Tüm proje Windows işletim sistemi üzerinde Microsoft Visual Studio 12 platformunda programlanmıştır. Çalışmanın tüm bölümlerinde C# programlama dili kullanılmıştır. Ayrıca hazırlanan bazı kodlar ve DLL'ler kullanılmıştır.


ATIFLAR
Atıf Yapan Eserler
Henüz Atıf Yapılmamıştır

KAYNAK GÖSTER
BibTex
KOPYALA
@article{2021, title={Classification of Documents Extracted from Images with Optical Character Recognition Methods}, volume={6}, number={46–55}, publisher={Bilgisayar Bilimleri}, author={Ömer AYDIN}, year={2021} }
APA
KOPYALA
Ömer AYDIN. (2021). Classification of Documents Extracted from Images with Optical Character Recognition Methods (Vol. 6). Vol. 6. Bilgisayar Bilimleri.
MLA
KOPYALA
Ömer AYDIN. Classification of Documents Extracted from Images with Optical Character Recognition Methods. no. 46–55, Bilgisayar Bilimleri, 2021.