Basit öğe kaydını göster

dc.contributor.authorKaraoglan, B.
dc.contributor.authorDinçer, B.T.
dc.contributor.authorKisla, T.
dc.contributor.authorMetin, S.K.
dc.date.accessioned2020-11-20T16:45:43Z
dc.date.available2020-11-20T16:45:43Z
dc.date.issued2013
dc.identifier.isbn9781467355629
dc.identifier.urihttps://doi.org/10.1109/SIU.2013.6531217
dc.identifier.urihttps://hdl.handle.net/20.500.12809/5504
dc.description2013 21st Signal Processing and Communications Applications Conference, SIU 2013, 24 April 2013 through 26 April 2013, Haspolat, 98109en_US
dc.description.abstractIn order to compare work done under natural language processing, the corpora involved in different studies should be standardized/normalized. Entropy, used as language model performance metric, totally depends on signal information. Whereas, when language is considered semantic information should also be considered. Here we propose a metric that exploits Zipf's and Heaps' power laws to respresent semantic information in terms of signal information and estimates the amount of information anticipated from a corpus of given length in words. The proposed metric is tested on 20 different lengths of sub-corpora drawn from major corpus in Turkish (METU). While the entropy changed depending on the length of the corpus, the value of our proposed metric stayed almost constant which supports our claim about normalizing the corpus. © 2013 IEEE.en_US
dc.item-language.isoturen_US
dc.item-rightsinfo:eu-repo/semantics/closedAccessen_US
dc.subjectCorpus Comparisonen_US
dc.subjectCross Entropyen_US
dc.subjectLanguage Model Performanceen_US
dc.titleDerlem normalizasyonu için bir önerien_US
dc.item-title.alternativeA proposal for corpus normalization [Derlem normalizasyonu için bir öneri]en_US
dc.item-typeconferenceObjecten_US
dc.contributor.departmenten_US
dc.contributor.departmentTempKaraoglan, B., Uluslararasi Bilgisayar Enstitüsü, Ege Üniversitesi, Izmir, Turkey -- [Dinçer, B.T., Enformatik Bölümü, Mugla Üniversitesi, Mugla, Turkey -- [Kisla, T., Bilgisayar Ve ÖgRetim Teknolojileri Egitimi Bölümü, Ege Üniversitesi, Izmir, Turkey -- [Metin, S.K., Yazilim Mühendisligi Bölümü, IZmir Ekonomi Üniversitesi, Izmir, Turkeyen_US
dc.identifier.doi10.1109/SIU.2013.6531217
dc.relation.journal2013 21st Signal Processing and Communications Applications Conference, SIU 2013en_US
dc.relation.publicationcategoryKonferans Öğesi - Uluslararası - Kurum Öğretim Elemanıen_US


Bu öğenin dosyaları:

DosyalarBoyutBiçimGöster

Bu öğe ile ilişkili dosya yok.

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster