Türkçe Doğal Dil İşleme: Ses Bilgisi ve Morfolojik Analiz

M. Karaca, Şafak Bayır
{"title":"Türkçe Doğal Dil İşleme: Ses Bilgisi ve Morfolojik Analiz","authors":"M. Karaca, Şafak Bayır","doi":"10.61112/jiens.1472513","DOIUrl":null,"url":null,"abstract":"Bu çalışmada Türkçe Doğal Dil İşleme teknikleriyle 230 cümlenin ses bilgisi ve morfolojik analizi gerçekleştirilmiştir. İşlemlerde Zemberek’le entegre şekilde çalışan Visual Studio ortamında ve C# dilinde geliştirilen yazılım kullanılmıştır. Zemberek’te bulunan 130 ekten 120’sinin Türkçe dil bilgisindeki ek karşılıkları belirlenmiştir. Zemberek eklerinden 13’ü kök adı, 46’sı çekim eki, 39’u yapım eki ve 22 tanesi diğer eklerdir (birleşik fiil, fiilden sıfat fiil ve fiilden zarf fiil türeten). Veri kümesindeki 230 cümlenin 744 kelimeden oluştuğu, kelimelerin ortalama 5.30 harf ve 2.26 heceli olduğu, hecelerin yaklaşık yarısının ünsüz-ünlü birleşiminden oluşan CV hece türünde bulunduğu ve kelimelerin yarısından fazlası için Zemberek tarafından 1 çözümleme üretildiği belirlenmiştir. Ayrıca, kelimelerin yarısının ek almadığı, çekim eklerinin diğer ek türlerinden daha çok kullanıldığı, yapım eklerinden sonra yapım veya çekim eklerinin, diğer eklerden (birleşik fiil ve fiilden sıfat fiil türeten) veya çekim eklerinden sonra ise yalnızca çekim eklerinin geldiği tespit edilmiştir. İsim türündeki kelime sayısının diğer türlerdeki kelime sayısından, ünlü ve ünsüz uyum kurallarına uyan kelime sayısının uymayan kelime sayısından daha yüksek olduğu görülmüştür.","PeriodicalId":306664,"journal":{"name":"Journal of Innovative Engineering and Natural Science","volume":"92 3","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-07-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of Innovative Engineering and Natural Science","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.61112/jiens.1472513","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Bu çalışmada Türkçe Doğal Dil İşleme teknikleriyle 230 cümlenin ses bilgisi ve morfolojik analizi gerçekleştirilmiştir. İşlemlerde Zemberek’le entegre şekilde çalışan Visual Studio ortamında ve C# dilinde geliştirilen yazılım kullanılmıştır. Zemberek’te bulunan 130 ekten 120’sinin Türkçe dil bilgisindeki ek karşılıkları belirlenmiştir. Zemberek eklerinden 13’ü kök adı, 46’sı çekim eki, 39’u yapım eki ve 22 tanesi diğer eklerdir (birleşik fiil, fiilden sıfat fiil ve fiilden zarf fiil türeten). Veri kümesindeki 230 cümlenin 744 kelimeden oluştuğu, kelimelerin ortalama 5.30 harf ve 2.26 heceli olduğu, hecelerin yaklaşık yarısının ünsüz-ünlü birleşiminden oluşan CV hece türünde bulunduğu ve kelimelerin yarısından fazlası için Zemberek tarafından 1 çözümleme üretildiği belirlenmiştir. Ayrıca, kelimelerin yarısının ek almadığı, çekim eklerinin diğer ek türlerinden daha çok kullanıldığı, yapım eklerinden sonra yapım veya çekim eklerinin, diğer eklerden (birleşik fiil ve fiilden sıfat fiil türeten) veya çekim eklerinden sonra ise yalnızca çekim eklerinin geldiği tespit edilmiştir. İsim türündeki kelime sayısının diğer türlerdeki kelime sayısından, ünlü ve ünsüz uyum kurallarına uyan kelime sayısının uymayan kelime sayısından daha yüksek olduğu görülmüştür.
土耳其语自然语言处理:语音和词形分析
本研究利用土耳其语自然语言处理技术对 230 个句子进行了语音和形态分析。在这一过程中,使用了在 Visual Studio 环境和 C# 语言中开发的软件,该软件与 Zemberek 兼容。在 Zemberek 中的 130 个词缀中,确定了其中 120 个在土耳其语语法中的对应词缀。在 Zemberek 词缀中,13 个是词根名称,46 个是词折词缀,39 个是结构词缀,22 个是其他词缀(复合动词、形容动词和副动词)。经测定,数据集中的 230 个句子由 744 个单词组成,单词平均有 5.30 个字母和 2.26 个音节,大约一半的音节是由辅音-元音组合而成的 CV 音节,Zemberek 对一半以上的单词进行了 1 次解码。此外,还确定有一半的单词不带后缀,偏正后缀的使用多于其他后缀类型,构词后缀或偏正后缀位于构词后缀之后,只有偏正后缀位于其他后缀(从复合动词和动词派生出形容动词)或偏正后缀之后。名词类型的词数多于其他类型的词数,符合元音和辅音和谐规则的词数多于不符合元音和辅音和谐规则的词数。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信