Derin makine öğrenmesi metoduyla sosyal medya verilerine dayalı seçim sonucu tahmini

İbrahim Sabuncu, Eda Şen
{"title":"Derin makine öğrenmesi metoduyla sosyal medya verilerine dayalı seçim sonucu tahmini","authors":"İbrahim Sabuncu, Eda Şen","doi":"10.15295/bmij.v9i4.1957","DOIUrl":null,"url":null,"abstract":"Bu çalışmanın amacı, sosyal medya verilerinden yararlanarak politikacıların oy oranlarının günlük değişiminin ve seçim sonucunun tahmin edilebilirliğinin araştırılmasıdır. Bu amaçla yapılan çalışmada, 3 Kasım 2020 ABD seçimine katılan adaylar hakkında 01.07.2020- 03.11.2020 tarihleri arasında paylaşılan 20.746.834 adet tweet RapidMiner programı ile Twitter platformundan toplanmıştır. Twitter’dan toplanan verilere, Vader algoritması ile duygu analizleri yapılmıştır. Tweetler, pozitif, negatif, NPS (pozitif-negatif) ve nötr duygu kategorilerine göre gruplandırılmıştır. Duygu kategorilerine ayrılmış tweet sayıları kullanılarak, günlük oy oranlarını ve seçim sonucunu tahmin etmek için altı farklı makine öğrenmesine dayalı tahmin modeli oluşturulmuştur. Tahmin modellerinde, bağımsız değişkenler adaylar hakkında paylaşılan duygu kategorilerine göre ayrılmış günlük Twitter verisidir. Bağımlı değişkenler ise anket ve ekonomik göstergelere dayalı yapılmış, adayların günlük oy oranı tahminleridir. Tahmin modelleri 109 günlük veri ile eğitilmiştir. En doğru sonucu veren tahmin modeli Derin Makine Öğrenmesi (Deep Machine Learning) algoritması kullanılarak, seçim sonucu %1,7 hata payıyla tahmin edilebilmiştir. Bu çalışma, Twitter’daki çok çeşitli manipülasyonlara rağmen, makine öğrenmesi aracılığıyla, Twitter’ın halen politik eğilimlerin takibi ve seçim sonuçları tahmininde kullanılabilecek bir veri kaynağı olabileceğini göstermektedir.","PeriodicalId":333522,"journal":{"name":"Business & Management Studies: An International Journal","volume":"19 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-12-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Business & Management Studies: An International Journal","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.15295/bmij.v9i4.1957","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Bu çalışmanın amacı, sosyal medya verilerinden yararlanarak politikacıların oy oranlarının günlük değişiminin ve seçim sonucunun tahmin edilebilirliğinin araştırılmasıdır. Bu amaçla yapılan çalışmada, 3 Kasım 2020 ABD seçimine katılan adaylar hakkında 01.07.2020- 03.11.2020 tarihleri arasında paylaşılan 20.746.834 adet tweet RapidMiner programı ile Twitter platformundan toplanmıştır. Twitter’dan toplanan verilere, Vader algoritması ile duygu analizleri yapılmıştır. Tweetler, pozitif, negatif, NPS (pozitif-negatif) ve nötr duygu kategorilerine göre gruplandırılmıştır. Duygu kategorilerine ayrılmış tweet sayıları kullanılarak, günlük oy oranlarını ve seçim sonucunu tahmin etmek için altı farklı makine öğrenmesine dayalı tahmin modeli oluşturulmuştur. Tahmin modellerinde, bağımsız değişkenler adaylar hakkında paylaşılan duygu kategorilerine göre ayrılmış günlük Twitter verisidir. Bağımlı değişkenler ise anket ve ekonomik göstergelere dayalı yapılmış, adayların günlük oy oranı tahminleridir. Tahmin modelleri 109 günlük veri ile eğitilmiştir. En doğru sonucu veren tahmin modeli Derin Makine Öğrenmesi (Deep Machine Learning) algoritması kullanılarak, seçim sonucu %1,7 hata payıyla tahmin edilebilmiştir. Bu çalışma, Twitter’daki çok çeşitli manipülasyonlara rağmen, makine öğrenmesi aracılığıyla, Twitter’ın halen politik eğilimlerin takibi ve seçim sonuçları tahmininde kullanılabilecek bir veri kaynağı olabileceğini göstermektedir.
本研究旨在利用社交媒体数据调查政治人物得票率的每日变化以及选举结果的可预测性。本研究使用 RapidMiner 程序从 Twitter 平台收集了 20,746,834 条推文,这些推文是在 2020 年 7 月 1 日至 2020 年 11 月 3 日期间分享的,内容涉及参加 2020 年 11 月 3 日美国大选的候选人。使用 Vader 算法对从 Twitter 收集到的数据进行了情感分析。推文按照正面、负面、NPS(正面-负面)和中性情感类别进行分组。利用按情绪类别分类的推文数量,创建了六个不同的基于机器学习的预测模型,以预测每日投票率和选举结果。在预测模型中,自变量是根据对候选人的情绪分类的每日推特数据。因变量是根据民意调查和经济指标预测的候选人每日得票率。预测模型用 109 天的数据进行了训练。最准确的预测模型是深度机器学习算法,它对选举结果的预测误差率为 1.7%。这项研究表明,尽管 Twitter 上存在各种操纵行为,但通过机器学习,Twitter 仍然可以成为跟踪政治趋势和预测选举结果的数据源。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信