Н. А. Куликовська, Артур Тіменко, В. Є. Трохимчук, М. Б. Ільяшенко
{"title":"研究分析文本数据语气的方法","authors":"Н. А. Куликовська, Артур Тіменко, В. Є. Трохимчук, М. Б. Ільяшенко","doi":"10.35546/kntu2078-4481.2024.1.31","DOIUrl":null,"url":null,"abstract":"Актуальність теми дослідження визначається лавиноподібним зростанням обсягів неструктурованих текстових даних в Інтернеті та потребою в ефективних методах аналізу тональності. Мета роботи – систематично вивчити сучасний стан методології аналізу тональності, порівняти провідні підходи і окреслити подальші перспективи. У статті детально проаналізовано популярні бібліотеки Python для обробки природної мови – NLTK, spaCy, TextBlob, Gensim. Порівняння проведено за критеріями обчислювальної ефективності, зручності використання, гнучкості екстракції ознак та можливостей кастомізації. Методологічне ядро дослідження становить експериментальне порівняння NLTK і TextBlob для класифікації тональності україномовних текстів. Оцінки можуть варіюватися в залежності від конкретного сценарію використання та налаштувань. NLTK, де він може бути більш точним, коли його правильно налаштовано, але вимагає більше зусиль у налаштуванні. TextBlob, навпаки, є більш простим для використання, але може бути менш точним для спеціалізованих завдань. Результати засвідчили переваги TextBlob у швидкодії та NLTK у точності. Аналіз тональності має величезний потенціал для вдосконалення аналітичних можливостей в багатьох сферах – від оптимізації бізнес-процесів до протидії поширенню фейкових новин. Подальші дослідження повинні фокусуватися на розробці спеціалізованих рішень під конкретні прикладні задачі.Визначено перспективи вдосконалення етичних принципів аналізу тексту, урахування лінгвістичного та культурного контексту, а також інтеграції функціоналу аналізу тональності в системи підтримки прийняття рішень.","PeriodicalId":518826,"journal":{"name":"Вісник Херсонського національного технічного університету","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2024-05-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"ДОСЛІДЖЕННЯ МЕТОДІВ АНАЛІЗУ ТОНАЛЬНОСТІ ТЕКСТОВИХ ДАНИХ\",\"authors\":\"Н. А. Куликовська, Артур Тіменко, В. Є. Трохимчук, М. Б. Ільяшенко\",\"doi\":\"10.35546/kntu2078-4481.2024.1.31\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Актуальність теми дослідження визначається лавиноподібним зростанням обсягів неструктурованих текстових даних в Інтернеті та потребою в ефективних методах аналізу тональності. Мета роботи – систематично вивчити сучасний стан методології аналізу тональності, порівняти провідні підходи і окреслити подальші перспективи. У статті детально проаналізовано популярні бібліотеки Python для обробки природної мови – NLTK, spaCy, TextBlob, Gensim. Порівняння проведено за критеріями обчислювальної ефективності, зручності використання, гнучкості екстракції ознак та можливостей кастомізації. Методологічне ядро дослідження становить експериментальне порівняння NLTK і TextBlob для класифікації тональності україномовних текстів. Оцінки можуть варіюватися в залежності від конкретного сценарію використання та налаштувань. NLTK, де він може бути більш точним, коли його правильно налаштовано, але вимагає більше зусиль у налаштуванні. TextBlob, навпаки, є більш простим для використання, але може бути менш точним для спеціалізованих завдань. Результати засвідчили переваги TextBlob у швидкодії та NLTK у точності. Аналіз тональності має величезний потенціал для вдосконалення аналітичних можливостей в багатьох сферах – від оптимізації бізнес-процесів до протидії поширенню фейкових новин. Подальші дослідження повинні фокусуватися на розробці спеціалізованих рішень під конкретні прикладні задачі.Визначено перспективи вдосконалення етичних принципів аналізу тексту, урахування лінгвістичного та культурного контексту, а також інтеграції функціоналу аналізу тональності в системи підтримки прийняття рішень.\",\"PeriodicalId\":518826,\"journal\":{\"name\":\"Вісник Херсонського національного технічного університету\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-05-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Вісник Херсонського національного технічного університету\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.35546/kntu2078-4481.2024.1.31\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Вісник Херсонського національного технічного університету","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.35546/kntu2078-4481.2024.1.31","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
ДОСЛІДЖЕННЯ МЕТОДІВ АНАЛІЗУ ТОНАЛЬНОСТІ ТЕКСТОВИХ ДАНИХ
Актуальність теми дослідження визначається лавиноподібним зростанням обсягів неструктурованих текстових даних в Інтернеті та потребою в ефективних методах аналізу тональності. Мета роботи – систематично вивчити сучасний стан методології аналізу тональності, порівняти провідні підходи і окреслити подальші перспективи. У статті детально проаналізовано популярні бібліотеки Python для обробки природної мови – NLTK, spaCy, TextBlob, Gensim. Порівняння проведено за критеріями обчислювальної ефективності, зручності використання, гнучкості екстракції ознак та можливостей кастомізації. Методологічне ядро дослідження становить експериментальне порівняння NLTK і TextBlob для класифікації тональності україномовних текстів. Оцінки можуть варіюватися в залежності від конкретного сценарію використання та налаштувань. NLTK, де він може бути більш точним, коли його правильно налаштовано, але вимагає більше зусиль у налаштуванні. TextBlob, навпаки, є більш простим для використання, але може бути менш точним для спеціалізованих завдань. Результати засвідчили переваги TextBlob у швидкодії та NLTK у точності. Аналіз тональності має величезний потенціал для вдосконалення аналітичних можливостей в багатьох сферах – від оптимізації бізнес-процесів до протидії поширенню фейкових новин. Подальші дослідження повинні фокусуватися на розробці спеціалізованих рішень під конкретні прикладні задачі.Визначено перспективи вдосконалення етичних принципів аналізу тексту, урахування лінгвістичного та культурного контексту, а також інтеграції функціоналу аналізу тональності в системи підтримки прийняття рішень.