StatiStiLiSed meetodid ühendverbide tuvaStamiSeL tekStikorpuSeSt

Q2 Arts and Humanities

Eesti Rakenduslingvistika Uhingu Aastaraamat Pub Date : 2015-04-23 DOI:10.5128/ERYA11.03

Eleri Aedmaa

引用次数: 0

Abstract

DOI: http://dx.doi.org/10.5128/ERYa11.03 Artiklis vordlen sonadevahelise seose tugevuse mootmise statistilisi meetodeid, mida kasutatakse arvutilingvistikas pusiuhendite tuvastamiseks. Too pohieesmark on rakendada viit summeetrilist statistikut – t-skoori, vastastikuse informatsiooni vaartust, hii-ruut-statistikut, log-toepara funktsiooni ja minimaalset tundlikkust – erineva suurusega korpuste peal ja valja selgitada, milline meetod tootab eesti keele uhendverbide automaatsel tuvastamisel koige paremini. Teine suurem eesmark on katsetulemuste pohjal uurida, milline on korpuse suuruse moju statistikute toole. Lisaks palju testitud nimetatud summeetrilistele statistikutele rakendan psuhholoogiliselt paremini pohjendatud asummeetrilisi statistikuid ning toon valja nende eelised summeetriliste statistikute ees.

查看原文本刊更多论文

求助全文

约1分钟内获得全文求助全文

来源期刊