Entropija v slovenskih leposlovnih besedilih
Delo prinaša kvantitativni opis dveh vzorcev slovenskih leposlovnih besedil, skupaj dolgih 3.100.000 besed, in najpomembnejše parametre znakovnih n-terčkov, od enojčkov do štiriindvajseterčkov, ocenjena je tudi zgornja meja entropije v tovrstnih besedilih. Prvi vzorec vsebuje besedila 60 del 41 avtorjev, od Ivana Cankarja do Ivana Zorca, 46 izvirnih in 14 prevodov, z letnico izida od 1858 do 1996 in v skupnem obsegu 2.700.000 besed, drugi vzorec pa vsebuje celoten opus Cirila Kosmača, 52 del, objavljenih med letoma 1931 in 1988, s 400.000 besedami. Oba vzorca skupaj predstavljata med 0,5 % in 1 % celotne slovenske leposlovne produkcije.
Downloads

Series
Institutes
License

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.