Linguistics and Literature Review

Linguistics and Literature Review

Towards Sindhi Corpus Construction

Yazarlar: Mutee U Rahman

Cilt 1 , Sayı 1 , 2015 , Sayfalar 39-48

Konular:-

DOI:10.32350/llr/11/04

Anahtar Kelimeler:-

Özet: The paper discusses the current state of Sindhi corpus construction in detail. Sindhi corpus development issues including corpus acquisition, preprocessing, and tokenization are discussed in detail. Preliminary results and observations which include letter unigram, bigram and trigram frequencies; word frequencies and word bigram frequencies are presented. Current state of Sindhi corpus with its limitations and future work is also discussed. The paper also explores the orthography and script of Sindhi language with reference to corpus development.


ATIFLAR
Atıf Yapan Eserler
Sonuçların tamamını görmek için Asos İndeks'e üye bir üniversite ağından erişim sağlamalısınız. Kurumunuzun üye olması veya kurumunuza ücretsiz deneme erişimi sağlanması için Kütüphane ve Dokümantasyon Daire Başkanlığı ile iletişim kurabilirsiniz.
Dergi editörleri editör girişini kullanarak sisteme giriş yapabilirler. Editör girişi için tıklayınız.

KAYNAK GÖSTER
BibTex
KOPYALA
@article{2015, title={Towards Sindhi Corpus Construction}, volume={1}, number={39–48}, publisher={Linguistics and Literature Review}, author={Mutee U Rahman}, year={2015} }
APA
KOPYALA
Mutee U Rahman. (2015). Towards Sindhi Corpus Construction (Vol. 1). Vol. 1. Linguistics and Literature Review.
MLA
KOPYALA
Mutee U Rahman. Towards Sindhi Corpus Construction. no. 39–48, Linguistics and Literature Review, 2015.