{"title":"Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme","authors":"Abdulkadir Karaca, Özlem Aydin","doi":"10.17341/gazimmfd.963240","DOIUrl":null,"url":null,"abstract":"Günümüzde, büyük veri içinden istenilen bilgiyi kapsayan doğru içeriklere kısa sürede ulaşabilmek önemli bir ihtiyaçtır. İçeriklere ait başlıkların bu ihtiyacı karşılamada olumlu bir etkisi bulunmaktadır. Ancak yanıltıcı başlıklar olması durumunda bu bir dezavantaja dönüşebilmektedir. Bu çalışmada, güncel doğal dil işleme ve derin öğrenme teknolojilerini kullanarak Türkçe metinleri en iyi özetler biçimde ve daha yönlendirici Türkçe başlıkların üretilmesi amaçlanmaktadır. \n \nÇalışmada yaklaşık 52.000 Türkçe haber metni ve başlığını içeren bir derlem kullanılmıştır. Derlemdeki haber metinleri ve başlıkları modelin doğru eğitilebilmesi için bazı ön işlemlerden geçirilmiştir. Daha insansı ve özgün sonuçlar elde etmek amacıyla genel ve soyut özetleme teknikleri çözüm yöntemleri olarak tercih edilmiştir. Eğitim modeli olarak, 2017 yılında yayınlanan ve doğal dil işleme alanında en son teknoloji olarak kabul edilen transformatör mimarisi tabanlı kodlayıcı-kod çözücü derin öğrenme mimarisi kullanılmıştır. Bu model, derin öğrenme kütüphanelerinden TensorFlow ve Keras kullanılarak geliştirilmiştir. Derin öğrenme çalışmalarında yüksek sistem gereksinimlerini karşılayan Google Colab aracılığı ile 20 ve 25 dönem eğitilerek sonuç üretilmiştir. Eğitim süresi toplam 3.5 saat gibi kısa bir sürede tamamlanmıştır. \n \nEğitilen model, 20 ve 25 eğitim dönemi sonunda sırayla 75% ve 85% oranında eğitim başarımı elde etmiştir. Eğitimde kullanılan veri kümesinin tamamı, eğitilen model ile tekrar üretilmiştir. Bu deneyde başarı ölçütleri olarak, genellikle özetleme görevlerinde tercih edilen ROUGE-1 metriği, BLEU ve ikisinin harmonik ortalaması olan F1 skoru tercih edilmiştir. ROUGE-1, BLEU ve F1 skoru, 20 eğitim dönemi sonunda sırayla %59, %54 ve %55 iken, 25 eğitim dönemi sonunda sırayla %77, %70 ve %73 olarak ölçülmüştür. \n \nTransformatör mimarisinin başlık üretme probleminde kullanımının, bu alandaki mevcut çalışmalarda kullanılan derlemlere kıyasla daha az eğitim içeriğiyle çözüm üretebildiği ve diğer derin öğrenme mimarileri ile yapılan çalışmalara göre dilbilgisel ve anlamsal olarak daha başarılı sonuçlar elde edildiği gözlemlenmiştir.","PeriodicalId":51103,"journal":{"name":"Journal of the Faculty of Engineering and Architecture of Gazi University","volume":"1 1","pages":""},"PeriodicalIF":1.0000,"publicationDate":"2023-03-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of the Faculty of Engineering and Architecture of Gazi University","FirstCategoryId":"5","ListUrlMain":"https://doi.org/10.17341/gazimmfd.963240","RegionNum":4,"RegionCategory":"工程技术","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"ENGINEERING, MULTIDISCIPLINARY","Score":null,"Total":0}
引用次数: 0
Abstract
Günümüzde, büyük veri içinden istenilen bilgiyi kapsayan doğru içeriklere kısa sürede ulaşabilmek önemli bir ihtiyaçtır. İçeriklere ait başlıkların bu ihtiyacı karşılamada olumlu bir etkisi bulunmaktadır. Ancak yanıltıcı başlıklar olması durumunda bu bir dezavantaja dönüşebilmektedir. Bu çalışmada, güncel doğal dil işleme ve derin öğrenme teknolojilerini kullanarak Türkçe metinleri en iyi özetler biçimde ve daha yönlendirici Türkçe başlıkların üretilmesi amaçlanmaktadır.
Çalışmada yaklaşık 52.000 Türkçe haber metni ve başlığını içeren bir derlem kullanılmıştır. Derlemdeki haber metinleri ve başlıkları modelin doğru eğitilebilmesi için bazı ön işlemlerden geçirilmiştir. Daha insansı ve özgün sonuçlar elde etmek amacıyla genel ve soyut özetleme teknikleri çözüm yöntemleri olarak tercih edilmiştir. Eğitim modeli olarak, 2017 yılında yayınlanan ve doğal dil işleme alanında en son teknoloji olarak kabul edilen transformatör mimarisi tabanlı kodlayıcı-kod çözücü derin öğrenme mimarisi kullanılmıştır. Bu model, derin öğrenme kütüphanelerinden TensorFlow ve Keras kullanılarak geliştirilmiştir. Derin öğrenme çalışmalarında yüksek sistem gereksinimlerini karşılayan Google Colab aracılığı ile 20 ve 25 dönem eğitilerek sonuç üretilmiştir. Eğitim süresi toplam 3.5 saat gibi kısa bir sürede tamamlanmıştır.
Eğitilen model, 20 ve 25 eğitim dönemi sonunda sırayla 75% ve 85% oranında eğitim başarımı elde etmiştir. Eğitimde kullanılan veri kümesinin tamamı, eğitilen model ile tekrar üretilmiştir. Bu deneyde başarı ölçütleri olarak, genellikle özetleme görevlerinde tercih edilen ROUGE-1 metriği, BLEU ve ikisinin harmonik ortalaması olan F1 skoru tercih edilmiştir. ROUGE-1, BLEU ve F1 skoru, 20 eğitim dönemi sonunda sırayla %59, %54 ve %55 iken, 25 eğitim dönemi sonunda sırayla %77, %70 ve %73 olarak ölçülmüştür.
Transformatör mimarisinin başlık üretme probleminde kullanımının, bu alandaki mevcut çalışmalarda kullanılan derlemlere kıyasla daha az eğitim içeriğiyle çözüm üretebildiği ve diğer derin öğrenme mimarileri ile yapılan çalışmalara göre dilbilgisel ve anlamsal olarak daha başarılı sonuçlar elde edildiği gözlemlenmiştir.
今天,重要的是,如果您从大数据中获得所需的信息,您就可以快速访问正确的内容。内部领导人对这一需求产生了积极影响。但如果出现虚假的头条新闻,它可能会演变成一场灾难。在这项工作中,土耳其语文本旨在利用当前的自然语言处理和深度学习技术产生最佳功能和指导土耳其文能力。在工作中,使用了大约52000条土耳其新闻文本和标题。为了在模型中正确地训练新闻文本和标题,已经实现了一些初步过程。人们选择了更多的人类和私人后果作为通用和机器人自我控制技术的解决方案。作为一种教育模式,2017年自然语言处理领域接受的最后一项技术已经被一位基于transformer架构的高度编码的代码解决架构师使用。该模型是从使用TensorFlow和Keras的深度学习库中开发的。Derinöğrenmeçalışmalarında yüksek系统gereksimlerini karşılayan Google Colab aracılığıile 20 ve 25 dönem eğitilerek sonuçüretilmiştir。教育的总时长很快就完成了3.5个小时。在培训期结束时,教育模式分别达到75%和85%。教育中使用的整个数据库都是由经过训练的模型重建的。在这个实验中,成功测量通常倾向于ROUGE-1米、BLEU和F1分数,两者的平均值一致。在20个训练期结束时测量ROUGE-1、BLEU和F1得分,分别为59%、54%、55%,在25个训练期终止时分别为77%、70%和73%。与该领域现有研究中使用的经验教训以及与其他深度学习架构师进行的研究相比,变压器架构师的主要生产问题的使用在语言方面得到了观察,并取得了显著更成功的结果。
期刊介绍:
Gazi University Journal of the Faculty of Engineering and Architecture; Engineering qualifications described below and in the field of architecture research papers and invited articles by scanning is considered to be Turkish.