{"title":"ДОСЛІДЖЕННЯ АЛГОРИТМІВ МОРФОЛОГІЧНОГО АНАЛІЗУ У DLP-СИСТЕМАХ ДЛЯ ЗАПОБІГАННЯ ВИТОКУ ІНФОРМАЦІЇ","authors":"А.В. Близнюк","doi":"10.36994/2788-5518-2022-02-04-16","DOIUrl":null,"url":null,"abstract":"У статті досліджується використання морфологічного методу аналізу текстової інформації в системах протидії витоку інформації. Дається визначення поняттю морфологічного аналізу в DLP-система та аналізується актуальність проблеми забезпечення інформаційної безпеки в сучасному світі з постійним розвитком цифровізації. Досліджуються проблеми та особливості морфологічного аналізу враховуючи особливості різних мов. У зв'язку з особливостями української та російської мови, які найчастіше використовуються в нашому інформаційному просторі, і наявністю великої кількості слів винятків в них, здійснення морфологічного аналізу може бути ускладнене. Для подолання цих труднощів існує можливість вибору методу морфологічного аналізу. У статті алгоритми морфологічного аналізу текстової інформації порівнюються за основними характеристиками, зокрема точність визначення слова при морфологічному аналізі, можливість алгоритму до самонавчання, а також часові затрати на впровадження і налаштування того чи іншого методу в робочу діяльність компанії. Описані переваги та недоліки різних підходів до реалізації, наведені структурні особливості алгоритмів стемінгу - який полягає у виокремленні основної частини слова без закінчення та суфіксу, а не тільки у виділенні кореня, їх приклади та програмні рішення, які доступні на ринку.","PeriodicalId":165726,"journal":{"name":"Інфокомунікаційні та комп’ютерні технології","volume":"3 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-02-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Інфокомунікаційні та комп’ютерні технології","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.36994/2788-5518-2022-02-04-16","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
У статті досліджується використання морфологічного методу аналізу текстової інформації в системах протидії витоку інформації. Дається визначення поняттю морфологічного аналізу в DLP-система та аналізується актуальність проблеми забезпечення інформаційної безпеки в сучасному світі з постійним розвитком цифровізації. Досліджуються проблеми та особливості морфологічного аналізу враховуючи особливості різних мов. У зв'язку з особливостями української та російської мови, які найчастіше використовуються в нашому інформаційному просторі, і наявністю великої кількості слів винятків в них, здійснення морфологічного аналізу може бути ускладнене. Для подолання цих труднощів існує можливість вибору методу морфологічного аналізу. У статті алгоритми морфологічного аналізу текстової інформації порівнюються за основними характеристиками, зокрема точність визначення слова при морфологічному аналізі, можливість алгоритму до самонавчання, а також часові затрати на впровадження і налаштування того чи іншого методу в робочу діяльність компанії. Описані переваги та недоліки різних підходів до реалізації, наведені структурні особливості алгоритмів стемінгу - який полягає у виокремленні основної частини слова без закінчення та суфіксу, а не тільки у виділенні кореня, їх приклади та програмні рішення, які доступні на ринку.