Show simple item record

dc.contributor.authorLippus, Pärtel
dc.date.accessioned2019-06-28T13:08:02Z
dc.date.available2019-06-28T13:08:02Z
dc.date.issued2019-06-20
dc.identifier.urihttp://datadoi.ut.ee/handle/33/93
dc.description.abstractEesti keele spontaanse kõne foneetilise korpuse sagedussõnastik on koostatud korpuse v.1.0.5 (20.06.2019, doi:10.15155/1-00-0000-0000-0000-001A3L) versiooni põhjal, kui korpuses oli märgendatud 685 750 sõna (89 tundi ja 18 minutit kõnet). Vt korpuse kohta lähemalt https://www.keel.ut.ee/et/foneetikakorpus Korpus lemmatiseeriti ESTMORF morfoloogilise analüsaatoriga (https://www.filosoft.ee/html_morf_et/morfoutinfo.html -- vt ka sõnaliikide loendit). Tabelis EKSKFK_sagedussonastik_2019-06-20.txt on esitatud 1000 sagedasema sõna lemma, sõnaliik ning sagedus.en_US
dc.description.abstractThe frequency table of the 1000 most frequent words in the Phonetic Corpus of Estonian Spontaneous Speech is based on a the v.1.0.5 (20.06.2019, doi:10.15155/1-00-0000-0000-0000-001A3L) version of the corpus, which has a total of 685 750 words (89 h 18 minutes of speech). For more info about the corpus: https://www.keel.ut.ee/en/languages-resourceslanguages-resources/phonetic-corpus-estonian-spontaneous-speech The words were lemmatisized using ESTMORF morphological analyzer (see (https://www.filosoft.ee/html_morf_et/morfoutinfo.html for more info, inc. the list of word classes). The table in the file EKSKFK_sagedussonastik_2019-06-20.txt presents the 1000 most frequent lemmas, their word class and frequency.en_US
dc.relationEKTB3en_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectword frequencyen_US
dc.subjectEstonianen_US
dc.subjectspontaneous speechen_US
dc.titleFoneetikakorpuse sagedussõnastiken_US
dc.typeinfo:eu-repo/semantics/dataseten_US
dc.typeword frequency tableen_US
dc.relation.iscitedby10.15155/1-00-0000-0000-0000-001A3Len_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record