{"title":"StatiStiLiSed meetodid ühendverbide tuvaStamiSeL tekStikorpuSeSt","authors":"Eleri Aedmaa","doi":"10.5128/ERYA11.03","DOIUrl":null,"url":null,"abstract":"DOI: http://dx.doi.org/10.5128/ERYa11.03 Artiklis vordlen sonadevahelise seose tugevuse mootmise statistilisi meetodeid, mida kasutatakse arvutilingvistikas pusiuhendite tuvastamiseks. Too pohieesmark on rakendada viit summeetrilist statistikut – t-skoori, vastastikuse informatsiooni vaartust, hii-ruut-statistikut, log-toepara funktsiooni ja minimaalset tundlikkust – erineva suurusega korpuste peal ja valja selgitada, milline meetod tootab eesti keele uhendverbide automaatsel tuvastamisel koige paremini. Teine suurem eesmark on katsetulemuste pohjal uurida, milline on korpuse suuruse moju statistikute toole. Lisaks palju testitud nimetatud summeetrilistele statistikutele rakendan psuhholoogiliselt paremini pohjendatud asummeetrilisi statistikuid ning toon valja nende eelised summeetriliste statistikute ees.","PeriodicalId":35118,"journal":{"name":"Eesti Rakenduslingvistika Uhingu Aastaraamat","volume":"24 1","pages":"37-54"},"PeriodicalIF":0.0000,"publicationDate":"2015-04-23","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Eesti Rakenduslingvistika Uhingu Aastaraamat","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5128/ERYA11.03","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0
Abstract
DOI: http://dx.doi.org/10.5128/ERYa11.03 Artiklis vordlen sonadevahelise seose tugevuse mootmise statistilisi meetodeid, mida kasutatakse arvutilingvistikas pusiuhendite tuvastamiseks. Too pohieesmark on rakendada viit summeetrilist statistikut – t-skoori, vastastikuse informatsiooni vaartust, hii-ruut-statistikut, log-toepara funktsiooni ja minimaalset tundlikkust – erineva suurusega korpuste peal ja valja selgitada, milline meetod tootab eesti keele uhendverbide automaatsel tuvastamisel koige paremini. Teine suurem eesmark on katsetulemuste pohjal uurida, milline on korpuse suuruse moju statistikute toole. Lisaks palju testitud nimetatud summeetrilistele statistikutele rakendan psuhholoogiliselt paremini pohjendatud asummeetrilisi statistikuid ning toon valja nende eelised summeetriliste statistikute ees.