ASYA STUDIES Pub Date : 2023-05-10 DOI:10.31455/asya.1204136
Bilgit Sağlam, F. Özek
{"title":"LEVENSHTEIN UZAKLIK ÖLÇEĞİNE GÖRE ÇAĞDAŞ TÜRK YAZI DİLLERİNİN FONETİK UZAKLIĞI","authors":"Bilgit Sağlam, F. Özek","doi":"10.31455/asya.1204136","DOIUrl":null,"url":null,"abstract":"Bu çalışmanın temel amacı Oğuz grubu yazı dillerinin birbirlerine karşı fonetik uzaklıklarını tespit etmektir. Çalışmada fonetik uzaklıkların tespiti için bilgisayarlı dil bilim alanında sıkça kullanılan niceliksel ölçüm tekniklerinden Levenshtein uzaklık algoritması kullanılmıştır. Bu bağlamda, çalışmanın Türkiye’deki lehçe bilim araştırmalarında kullanılabilecek bir yöntemi tanıtarak ilgili alanda yeni değerlendirmelerin yapılması adına katkı sunması hedeflenmektedir. \nVladimir Levenshtein tarafından geliştirilen ve birçok alanda kullanılan Levenshtein uzaklık algoritması, bir sözcük dizisini diğerine dönüştürürken kullanılabilecek ekleme, çıkarma ve yer değiştirme işlemlerinden matematiksel olarak en az işlem gerektiren sayısal değeri tespit etmede kullanılan bir algoritmadır. Levenshtein uzaklık algoritması, lehçe bilim çalışmalarında ilk olarak Brett Kessler tarafından kullanılmıştır. Bu çalışmadaki ilk denemenin başarılı olmasının ardından birçok lehçe bilimcinin algoritmaya ilgisi artmış, aynı yöntemle birçok dil değişkesinin fonetik uzaklığını ele alan çalışmalar yapılmıştır. \nBu çalışmada Türkiye Türkçesi, Azerbaycan Türkçesi, Türkmen Türkçesinin birbirlerine fonetik uzaklığı Levenshtein uzaklık algoritması ile ölçülecektir. Çalışmanın genellenebilir sonuçlar vermesi adına Türkçe Sıklık Sözlüğü’ne göre en sık kullanılan 40 fiil ve 13 tematik başlıktan (hayvan, beden, yiyecek, giyim, ulaşım, aile, madde, zaman, spor, tabiat, hava, meslek ve renk) 216 adet isim olmak üzere toplam 256 Türkçe madde başı sözcük belirlenmiştir. Sözcükler hedef dillere ana dili konuşurları tarafından tercüme edilmiştir. Sözcükler, ana dili konuşurlarına seslettirilmiş ve sözcük telaffuzları uluslararası fonetik alfabeye aktarılmıştır. Kaynak dilden her sözcük ile hedef dildeki karşılığı LUA ile hesaplanarak sözcüklerin fonetik uzaklıkları tespit edilmişir. Örnek setindeki tüm sözcük çiftlerine bu işlem uygulandıktan sonra hesaplanan ortalama değer temel alınarak Oğuz grubu Türk yazı dillerinin birbirlerine olan ortalama fonetik uzaklığı hesaplanmıştır.","PeriodicalId":104140,"journal":{"name":"ASYA STUDIES","volume":"10 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-05-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"ASYA STUDIES","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.31455/asya.1204136","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

本研究的主要目的是确定奥古斯语族文字之间的语音距离。在研究中,使用了计算机语言学领域常用的定量测量技术之一--莱文斯坦距离算法来确定语音距离。在此背景下,本研究旨在介绍一种可用于土耳其方言学研究的方法,并为相关领域的新评估做出贡献。列文士坦距离算法由弗拉基米尔-列文士坦(Vladimir Levenshtein)提出,并在许多领域得到应用,该算法用于确定在将一个词序列转换为另一个词序列时,加法、减法和置换运算中需要最少数学运算的数值。莱文斯坦距离算法由布雷特-凯斯勒(Brett Kessler)首次用于方言学研究。在这项研究中首次尝试成功后,许多方言学家对该算法的兴趣与日俱增,并用同样的方法对许多语言变体的语音距离进行了研究。在本研究中,将用列文什泰因距离算法测量土耳其土耳其语、阿塞拜疆土耳其语和土库曼土耳其语之间的语音距离。为了使研究结果具有普遍性,根据《土耳其语词频词典》,将使用最常用的 40 个动词和 13 个主题词(动物、身体、食物、服装、交通、家庭、物质、时间、运动、自然、天气、职业和颜色)。共识别出 256 个土耳其语单词,其中 216 个为名词。这些单词由母语人士翻译成目标语言。这些单词由母语人士发音,并将其发音转换为国际音标。使用 LUA 计算源语言中每个单词与其目标语言对应单词之间的语音距离。在对样本集中的所有词对进行计算后,根据计算出的平均值计算出奥古斯语系突厥语系文字之间的平均语音距离。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
LEVENSHTEIN UZAKLIK ÖLÇEĞİNE GÖRE ÇAĞDAŞ TÜRK YAZI DİLLERİNİN FONETİK UZAKLIĞI
Bu çalışmanın temel amacı Oğuz grubu yazı dillerinin birbirlerine karşı fonetik uzaklıklarını tespit etmektir. Çalışmada fonetik uzaklıkların tespiti için bilgisayarlı dil bilim alanında sıkça kullanılan niceliksel ölçüm tekniklerinden Levenshtein uzaklık algoritması kullanılmıştır. Bu bağlamda, çalışmanın Türkiye’deki lehçe bilim araştırmalarında kullanılabilecek bir yöntemi tanıtarak ilgili alanda yeni değerlendirmelerin yapılması adına katkı sunması hedeflenmektedir. Vladimir Levenshtein tarafından geliştirilen ve birçok alanda kullanılan Levenshtein uzaklık algoritması, bir sözcük dizisini diğerine dönüştürürken kullanılabilecek ekleme, çıkarma ve yer değiştirme işlemlerinden matematiksel olarak en az işlem gerektiren sayısal değeri tespit etmede kullanılan bir algoritmadır. Levenshtein uzaklık algoritması, lehçe bilim çalışmalarında ilk olarak Brett Kessler tarafından kullanılmıştır. Bu çalışmadaki ilk denemenin başarılı olmasının ardından birçok lehçe bilimcinin algoritmaya ilgisi artmış, aynı yöntemle birçok dil değişkesinin fonetik uzaklığını ele alan çalışmalar yapılmıştır. Bu çalışmada Türkiye Türkçesi, Azerbaycan Türkçesi, Türkmen Türkçesinin birbirlerine fonetik uzaklığı Levenshtein uzaklık algoritması ile ölçülecektir. Çalışmanın genellenebilir sonuçlar vermesi adına Türkçe Sıklık Sözlüğü’ne göre en sık kullanılan 40 fiil ve 13 tematik başlıktan (hayvan, beden, yiyecek, giyim, ulaşım, aile, madde, zaman, spor, tabiat, hava, meslek ve renk) 216 adet isim olmak üzere toplam 256 Türkçe madde başı sözcük belirlenmiştir. Sözcükler hedef dillere ana dili konuşurları tarafından tercüme edilmiştir. Sözcükler, ana dili konuşurlarına seslettirilmiş ve sözcük telaffuzları uluslararası fonetik alfabeye aktarılmıştır. Kaynak dilden her sözcük ile hedef dildeki karşılığı LUA ile hesaplanarak sözcüklerin fonetik uzaklıkları tespit edilmişir. Örnek setindeki tüm sözcük çiftlerine bu işlem uygulandıktan sonra hesaplanan ortalama değer temel alınarak Oğuz grubu Türk yazı dillerinin birbirlerine olan ortalama fonetik uzaklığı hesaplanmıştır.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信