{"title":"汇编爱沙尼亚语词联想词典:从零开始到数据库","authors":"Ene Vainik","doi":"10.5128/ERYA14.14","DOIUrl":null,"url":null,"abstract":"The present paper describes the project titled “The Dictionary of Word Associations in Estonian” undertaken by the author at the Institute of the Estonian Language. The general aim of the Dictionary is to provide insights into Estonians’ common-sense mind. It is meant to be a tool of self-reflection for Estonian native speakers and a guide for the foreigners who are eager enough to make themselves familiar with the Estonian cultural patterns of thought. The Dictionary will be published online. The number of keywords was initially limited to approximately 800. Specific emphasis is given to the stage of data collection by implementing the principles of citizen science. *** Eesti keele assotsiatsioonisonastiku loomine: tuhjast kohast andmebaasini Artiklis kirjeldatakse “Eesti keele assotsiatsioonisonastiku” loomise esimesi etappe kavandamisest kuni algandameid sisaldava andmebaasini. Esmalt antakse ulevaade pohimoistetest (assotsiatsioon, sona-assotsiatsioon, assotsiatsioonisonastik vs. assotsiatsiooninormid) ja kirjanduses kasutatavast terminoloogiast. Jargneb ulevaade sona-assotsiatsioonide uurimise ajaloost ja tuuakse valja sonastikuprojekti teoreetilised eeldused: a) sonu iseloomustavad nende seosed teiste sonadega; b) nende seoste valjatoomine on oluline leksikograafiline ulesanne; c) assotsiatsioone saab tuvastada uksnes inimeste testimise teel. Jargnevas osas kirjeldatakse tehtud toid ja pohjendatakse praktilisi valikuid. Lahti seletatakse marksonastiku ja testide koostamise pohimotted, kodanikuteaduse kampaania kaivitamise vajadus inimeste varbamiseks ning selle kulg. Artikli viimases osas pohjendatakse valikut andmete talletamise osas (relatsiooniline baas), kirjeldatakse andmebaasi struktuuri ning andmete impordi protseduure. Tabel 2 annab arvulise ulevaate sonastiku aluseks olevast andmebaasist. Artikli lopus arutletakse tehtud valikute eeliste ja norkuste ule. Andmete kogumist kodanikuteaduse raames loeti onnestunud ettevotmiseks, seda nii jarjest kasvava osalemisaktiivsuse kui ka sooritamisedukuse mottes (vt tabel 1). Kuna kodanikuteaduse partnerid kalduvad olema naissoost ja korgema haridusega, siis kontrolliti nende tegurite moju statistilise analuusiga. Tulemused naitasid, et sugu, iga ja amet vastuste stereotuupsust ei mojutanud, kull aga korgem haridustase. Seega on kogutud andmestikus toenaoliselt uldpopulatsioonist stereotuupsemad seosed, mida autor luges aga pigem eeliseks, kuna sonastiku eesmark ongi just koguda tuupilisemaid seoseid ja ainukordsed vastused jaavad andmete suure mahu tottu igal juhul sonastikust valja. Koik vastused koos andmetega vastajate soo, ea, hariduse jm kohta jaavad andmebaasi alles tulevasteks uuringuteks.","PeriodicalId":35118,"journal":{"name":"Eesti Rakenduslingvistika Uhingu Aastaraamat","volume":"45 1","pages":"229-245"},"PeriodicalIF":0.0000,"publicationDate":"2018-04-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":"{\"title\":\"Compiling the Dictionary of Word Associations in Estonian: From scratch to the database\",\"authors\":\"Ene Vainik\",\"doi\":\"10.5128/ERYA14.14\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"The present paper describes the project titled “The Dictionary of Word Associations in Estonian” undertaken by the author at the Institute of the Estonian Language. The general aim of the Dictionary is to provide insights into Estonians’ common-sense mind. It is meant to be a tool of self-reflection for Estonian native speakers and a guide for the foreigners who are eager enough to make themselves familiar with the Estonian cultural patterns of thought. The Dictionary will be published online. The number of keywords was initially limited to approximately 800. Specific emphasis is given to the stage of data collection by implementing the principles of citizen science. *** Eesti keele assotsiatsioonisonastiku loomine: tuhjast kohast andmebaasini Artiklis kirjeldatakse “Eesti keele assotsiatsioonisonastiku” loomise esimesi etappe kavandamisest kuni algandameid sisaldava andmebaasini. Esmalt antakse ulevaade pohimoistetest (assotsiatsioon, sona-assotsiatsioon, assotsiatsioonisonastik vs. assotsiatsiooninormid) ja kirjanduses kasutatavast terminoloogiast. Jargneb ulevaade sona-assotsiatsioonide uurimise ajaloost ja tuuakse valja sonastikuprojekti teoreetilised eeldused: a) sonu iseloomustavad nende seosed teiste sonadega; b) nende seoste valjatoomine on oluline leksikograafiline ulesanne; c) assotsiatsioone saab tuvastada uksnes inimeste testimise teel. Jargnevas osas kirjeldatakse tehtud toid ja pohjendatakse praktilisi valikuid. Lahti seletatakse marksonastiku ja testide koostamise pohimotted, kodanikuteaduse kampaania kaivitamise vajadus inimeste varbamiseks ning selle kulg. Artikli viimases osas pohjendatakse valikut andmete talletamise osas (relatsiooniline baas), kirjeldatakse andmebaasi struktuuri ning andmete impordi protseduure. Tabel 2 annab arvulise ulevaate sonastiku aluseks olevast andmebaasist. Artikli lopus arutletakse tehtud valikute eeliste ja norkuste ule. Andmete kogumist kodanikuteaduse raames loeti onnestunud ettevotmiseks, seda nii jarjest kasvava osalemisaktiivsuse kui ka sooritamisedukuse mottes (vt tabel 1). Kuna kodanikuteaduse partnerid kalduvad olema naissoost ja korgema haridusega, siis kontrolliti nende tegurite moju statistilise analuusiga. Tulemused naitasid, et sugu, iga ja amet vastuste stereotuupsust ei mojutanud, kull aga korgem haridustase. Seega on kogutud andmestikus toenaoliselt uldpopulatsioonist stereotuupsemad seosed, mida autor luges aga pigem eeliseks, kuna sonastiku eesmark ongi just koguda tuupilisemaid seoseid ja ainukordsed vastused jaavad andmete suure mahu tottu igal juhul sonastikust valja. Koik vastused koos andmetega vastajate soo, ea, hariduse jm kohta jaavad andmebaasi alles tulevasteks uuringuteks.\",\"PeriodicalId\":35118,\"journal\":{\"name\":\"Eesti Rakenduslingvistika Uhingu Aastaraamat\",\"volume\":\"45 1\",\"pages\":\"229-245\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2018-04-19\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"3\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Eesti Rakenduslingvistika Uhingu Aastaraamat\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5128/ERYA14.14\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q2\",\"JCRName\":\"Arts and Humanities\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Eesti Rakenduslingvistika Uhingu Aastaraamat","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5128/ERYA14.14","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"Arts and Humanities","Score":null,"Total":0}
Compiling the Dictionary of Word Associations in Estonian: From scratch to the database
The present paper describes the project titled “The Dictionary of Word Associations in Estonian” undertaken by the author at the Institute of the Estonian Language. The general aim of the Dictionary is to provide insights into Estonians’ common-sense mind. It is meant to be a tool of self-reflection for Estonian native speakers and a guide for the foreigners who are eager enough to make themselves familiar with the Estonian cultural patterns of thought. The Dictionary will be published online. The number of keywords was initially limited to approximately 800. Specific emphasis is given to the stage of data collection by implementing the principles of citizen science. *** Eesti keele assotsiatsioonisonastiku loomine: tuhjast kohast andmebaasini Artiklis kirjeldatakse “Eesti keele assotsiatsioonisonastiku” loomise esimesi etappe kavandamisest kuni algandameid sisaldava andmebaasini. Esmalt antakse ulevaade pohimoistetest (assotsiatsioon, sona-assotsiatsioon, assotsiatsioonisonastik vs. assotsiatsiooninormid) ja kirjanduses kasutatavast terminoloogiast. Jargneb ulevaade sona-assotsiatsioonide uurimise ajaloost ja tuuakse valja sonastikuprojekti teoreetilised eeldused: a) sonu iseloomustavad nende seosed teiste sonadega; b) nende seoste valjatoomine on oluline leksikograafiline ulesanne; c) assotsiatsioone saab tuvastada uksnes inimeste testimise teel. Jargnevas osas kirjeldatakse tehtud toid ja pohjendatakse praktilisi valikuid. Lahti seletatakse marksonastiku ja testide koostamise pohimotted, kodanikuteaduse kampaania kaivitamise vajadus inimeste varbamiseks ning selle kulg. Artikli viimases osas pohjendatakse valikut andmete talletamise osas (relatsiooniline baas), kirjeldatakse andmebaasi struktuuri ning andmete impordi protseduure. Tabel 2 annab arvulise ulevaate sonastiku aluseks olevast andmebaasist. Artikli lopus arutletakse tehtud valikute eeliste ja norkuste ule. Andmete kogumist kodanikuteaduse raames loeti onnestunud ettevotmiseks, seda nii jarjest kasvava osalemisaktiivsuse kui ka sooritamisedukuse mottes (vt tabel 1). Kuna kodanikuteaduse partnerid kalduvad olema naissoost ja korgema haridusega, siis kontrolliti nende tegurite moju statistilise analuusiga. Tulemused naitasid, et sugu, iga ja amet vastuste stereotuupsust ei mojutanud, kull aga korgem haridustase. Seega on kogutud andmestikus toenaoliselt uldpopulatsioonist stereotuupsemad seosed, mida autor luges aga pigem eeliseks, kuna sonastiku eesmark ongi just koguda tuupilisemaid seoseid ja ainukordsed vastused jaavad andmete suure mahu tottu igal juhul sonastikust valja. Koik vastused koos andmetega vastajate soo, ea, hariduse jm kohta jaavad andmebaasi alles tulevasteks uuringuteks.