- Book学术

发布求助

文献互助智能选刊最新文献

ASYA STUDIES Pub Date : 2023-05-10 DOI:10.31455/asya.1204136

Bilgit Sağlam, F. Özek

{"title":"LEVENSHTEIN UZAKLIK ÖLÇEĞİNE GÖRE ÇAĞDAŞ TÜRK YAZI DİLLERİNİN FONETİK UZAKLIĞI","authors":"Bilgit Sağlam, F. Özek","doi":"10.31455/asya.1204136","DOIUrl":null,"url":null,"abstract":"Bu çalışmanın temel amacı Oğuz grubu yazı dillerinin birbirlerine karşı fonetik uzaklıklarını tespit etmektir. Çalışmada fonetik uzaklıkların tespiti için bilgisayarlı dil bilim alanında sıkça kullanılan niceliksel ölçüm tekniklerinden Levenshtein uzaklık algoritması kullanılmıştır. Bu bağlamda, çalışmanın Türkiye’deki lehçe bilim araştırmalarında kullanılabilecek bir yöntemi tanıtarak ilgili alanda yeni değerlendirmelerin yapılması adına katkı sunması hedeflenmektedir. \nVladimir Levenshtein tarafından geliştirilen ve birçok alanda kullanılan Levenshtein uzaklık algoritması, bir sözcük dizisini diğerine dönüştürürken kullanılabilecek ekleme, çıkarma ve yer değiştirme işlemlerinden matematiksel olarak en az işlem gerektiren sayısal değeri tespit etmede kullanılan bir algoritmadır. Levenshtein uzaklık algoritması, lehçe bilim çalışmalarında ilk olarak Brett Kessler tarafından kullanılmıştır. Bu çalışmadaki ilk denemenin başarılı olmasının ardından birçok lehçe bilimcinin algoritmaya ilgisi artmış, aynı yöntemle birçok dil değişkesinin fonetik uzaklığını ele alan çalışmalar yapılmıştır. \nBu çalışmada Türkiye Türkçesi, Azerbaycan Türkçesi, Türkmen Türkçesinin birbirlerine fonetik uzaklığı Levenshtein uzaklık algoritması ile ölçülecektir. Çalışmanın genellenebilir sonuçlar vermesi adına Türkçe Sıklık Sözlüğü’ne göre en sık kullanılan 40 fiil ve 13 tematik başlıktan (hayvan, beden, yiyecek, giyim, ulaşım, aile, madde, zaman, spor, tabiat, hava, meslek ve renk) 216 adet isim olmak üzere toplam 256 Türkçe madde başı sözcük belirlenmiştir. Sözcükler hedef dillere ana dili konuşurları tarafından tercüme edilmiştir. Sözcükler, ana dili konuşurlarına seslettirilmiş ve sözcük telaffuzları uluslararası fonetik alfabeye aktarılmıştır. Kaynak dilden her sözcük ile hedef dildeki karşılığı LUA ile hesaplanarak sözcüklerin fonetik uzaklıkları tespit edilmişir. Örnek setindeki tüm sözcük çiftlerine bu işlem uygulandıktan sonra hesaplanan ortalama değer temel alınarak Oğuz grubu Türk yazı dillerinin birbirlerine olan ortalama fonetik uzaklığı hesaplanmıştır.","PeriodicalId":104140,"journal":{"name":"ASYA STUDIES","volume":"10 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-05-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"ASYA STUDIES","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.31455/asya.1204136","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

本研究的主要目的是确定奥古斯语族文字之间的语音距离。在研究中，使用了计算机语言学领域常用的定量测量技术之一--莱文斯坦距离算法来确定语音距离。在此背景下，本研究旨在介绍一种可用于土耳其方言学研究的方法，并为相关领域的新评估做出贡献。列文士坦距离算法由弗拉基米尔-列文士坦（Vladimir Levenshtein）提出，并在许多领域得到应用，该算法用于确定在将一个词序列转换为另一个词序列时，加法、减法和置换运算中需要最少数学运算的数值。莱文斯坦距离算法由布雷特-凯斯勒（Brett Kessler）首次用于方言学研究。在这项研究中首次尝试成功后，许多方言学家对该算法的兴趣与日俱增，并用同样的方法对许多语言变体的语音距离进行了研究。在本研究中，将用列文什泰因距离算法测量土耳其土耳其语、阿塞拜疆土耳其语和土库曼土耳其语之间的语音距离。为了使研究结果具有普遍性，根据《土耳其语词频词典》，将使用最常用的 40 个动词和 13 个主题词（动物、身体、食物、服装、交通、家庭、物质、时间、运动、自然、天气、职业和颜色）。共识别出 256 个土耳其语单词，其中 216 个为名词。这些单词由母语人士翻译成目标语言。这些单词由母语人士发音，并将其发音转换为国际音标。使用 LUA 计算源语言中每个单词与其目标语言对应单词之间的语音距离。在对样本集中的所有词对进行计算后，根据计算出的平均值计算出奥古斯语系突厥语系文字之间的平均语音距离。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

LEVENSHTEIN UZAKLIK ÖLÇEĞİNE GÖRE ÇAĞDAŞ TÜRK YAZI DİLLERİNİN FONETİK UZAKLIĞI

Bu çalışmanın temel amacı Oğuz grubu yazı dillerinin birbirlerine karşı fonetik uzaklıklarını tespit etmektir. Çalışmada fonetik uzaklıkların tespiti için bilgisayarlı dil bilim alanında sıkça kullanılan niceliksel ölçüm tekniklerinden Levenshtein uzaklık algoritması kullanılmıştır. Bu bağlamda, çalışmanın Türkiye’deki lehçe bilim araştırmalarında kullanılabilecek bir yöntemi tanıtarak ilgili alanda yeni değerlendirmelerin yapılması adına katkı sunması hedeflenmektedir. Vladimir Levenshtein tarafından geliştirilen ve birçok alanda kullanılan Levenshtein uzaklık algoritması, bir sözcük dizisini diğerine dönüştürürken kullanılabilecek ekleme, çıkarma ve yer değiştirme işlemlerinden matematiksel olarak en az işlem gerektiren sayısal değeri tespit etmede kullanılan bir algoritmadır. Levenshtein uzaklık algoritması, lehçe bilim çalışmalarında ilk olarak Brett Kessler tarafından kullanılmıştır. Bu çalışmadaki ilk denemenin başarılı olmasının ardından birçok lehçe bilimcinin algoritmaya ilgisi artmış, aynı yöntemle birçok dil değişkesinin fonetik uzaklığını ele alan çalışmalar yapılmıştır. Bu çalışmada Türkiye Türkçesi, Azerbaycan Türkçesi, Türkmen Türkçesinin birbirlerine fonetik uzaklığı Levenshtein uzaklık algoritması ile ölçülecektir. Çalışmanın genellenebilir sonuçlar vermesi adına Türkçe Sıklık Sözlüğü’ne göre en sık kullanılan 40 fiil ve 13 tematik başlıktan (hayvan, beden, yiyecek, giyim, ulaşım, aile, madde, zaman, spor, tabiat, hava, meslek ve renk) 216 adet isim olmak üzere toplam 256 Türkçe madde başı sözcük belirlenmiştir. Sözcükler hedef dillere ana dili konuşurları tarafından tercüme edilmiştir. Sözcükler, ana dili konuşurlarına seslettirilmiş ve sözcük telaffuzları uluslararası fonetik alfabeye aktarılmıştır. Kaynak dilden her sözcük ile hedef dildeki karşılığı LUA ile hesaplanarak sözcüklerin fonetik uzaklıkları tespit edilmişir. Örnek setindeki tüm sözcük çiftlerine bu işlem uygulandıktan sonra hesaplanan ortalama değer temel alınarak Oğuz grubu Türk yazı dillerinin birbirlerine olan ortalama fonetik uzaklığı hesaplanmıştır.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

ASYA STUDIES

自引率

0.00%

发文量