Типологія задач машинного аналізу текстів у сучасній соціології

Sotsiologichni studiyi Pub Date : 2021-12-01 DOI:10.29038/2306-3971-2021-02-41-48

Roman Kyrychenko

{"title":"Типологія задач машинного аналізу текстів у сучасній соціології","authors":"Roman Kyrychenko","doi":"10.29038/2306-3971-2021-02-41-48","DOIUrl":null,"url":null,"abstract":"У статті розглянуто можливості використання сучасних методів обробки текстів для соціологічного аналізу. Основну увагу приділено трьом завданням, які наразі можна вирішити засобами обчислювального аналізу текстів: аналіз змістовної близькості, моделювання тем та сентимент-аналіз (аналіз тональностей). В останні роки методи обробки природної мови настільки прогресували, що це дає змогу соціологам автоматично фіксувати семантику текстів, порівнювати її в часі, групувати на підставі схожості. Також це уможливлює масштабування аналізу великих масивів документів, що відкриває нову сторінку в розвитку контент-аналізу, за якої ми наближаємося до відмови від ручного кодування документів, а дослідники зможуть сконцентруватися на аналізі. Ми продемонстрували ці можливості на прикладі аналізу новин із ресурсу «Українська правда» за 2001–2020 рр. Методи, застосовані в статті, дали нам змогу повністю автоматизовано виявити, які семантичні зрушення щодо слів, пов’язаних із діяльністю правоохоронних органів, відбувалися під дією соціальних факторів протягом останніх двадцяти років. Також ми згрупували новини за основними темами повідомлень про поліцію в матеріалах видання й проаналізували, чи змінювалося ставлення до неї протягом його існування.","PeriodicalId":33169,"journal":{"name":"Sotsiologichni studiyi","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2021-12-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sotsiologichni studiyi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.29038/2306-3971-2021-02-41-48","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

У статті розглянуто можливості використання сучасних методів обробки текстів для соціологічного аналізу. Основну увагу приділено трьом завданням, які наразі можна вирішити засобами обчислювального аналізу текстів: аналіз змістовної близькості, моделювання тем та сентимент-аналіз (аналіз тональностей). В останні роки методи обробки природної мови настільки прогресували, що це дає змогу соціологам автоматично фіксувати семантику текстів, порівнювати її в часі, групувати на підставі схожості. Також це уможливлює масштабування аналізу великих масивів документів, що відкриває нову сторінку в розвитку контент-аналізу, за якої ми наближаємося до відмови від ручного кодування документів, а дослідники зможуть сконцентруватися на аналізі. Ми продемонстрували ці можливості на прикладі аналізу новин із ресурсу «Українська правда» за 2001–2020 рр. Методи, застосовані в статті, дали нам змогу повністю автоматизовано виявити, які семантичні зрушення щодо слів, пов’язаних із діяльністю правоохоронних органів, відбувалися під дією соціальних факторів протягом останніх двадцяти років. Також ми згрупували новини за основними темами повідомлень про поліцію в матеріалах видання й проаналізували, чи змінювалося ставлення до неї протягом його існування.

查看原文本刊更多论文

现代社会学中机器文本分析任务的类型学

本文探讨了运用现代文本处理方法进行社会学分析的可能性。主要关注的是现在可以通过文本的计算分析来解决的三个任务：内容接近度分析、主题化和感知分析。近年来，自然语言处理取得了长足的进步，使社会学家能够自动固定文本的语义，及时进行比较，并根据相似性对其进行分组。它还允许大规模的文档量被放大，为内容分析的开发打开了新的一页，我们拒绝对文档进行手动编码，研究人员可以专注于分析。例如，我们通过分析2001-2020年期间乌克兰真相资源的新闻，展示了这些可能性。文章中使用的方法使我们能够自动检测与执法机构的活动相关的单词的语义运动，在过去的20年里，它是在社会因素的影响下发生的。我们还将有关警方信息的主要主题的新闻分组在出版材料中，并观察其一生中是否发生了变化。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Sotsiologichni studiyi

自引率

0.00%

发文量

审稿时长

10 weeks