{"title":"ALGORITHMISATION OF DATA PROCESSING AND PREPARATION FOR BUILDING PREDICTIVE ANALYTICS MODELS","authors":"П.Ю. Гусев, А.В. Таволжанский","doi":"10.36622/1729-6501.2024.20.2.002","DOIUrl":null,"url":null,"abstract":"решается задача алгоритмизации обработки данных для их дальнейшего использования в моделях предиктивного анализа. Показаны достоинства применения моделей предиктивной аналитики, такие как увеличение производительности, снижение риска и оптимизация затрат, а также возникающие сложности, в частности, трудоёмкость обработки исходной информации. Для решения обозначенной проблемы приводится алгоритм, представленный в виде блок-схемы, которая условно поделена на три уровня. На первом уровне происходит первичное получение информации и её перевод в доступный язык программных средств. Операции второго уровня предназначены для снижения влияния факторов, негативно сказывающихся на качестве итоговой модели. На третьем уровне данные трансформируются и видоизменяются для более удобного их использования. Для каждого уровня приведены наиболее распространённые действия с данными, показаны варианты их применения. Рассмотрена реализация предложенного алгоритма для системы обучения модели предиктивной аналитики на примере электрогенератора. На практике показана возможность не строгого следования предписаниям, а выбора операций под конкретную задачу, что позволяет достичь большей гибкости и эффективности в работе. После необходимой подготовки было проведено исследование выбросов для изучения нештатных режимов работы системы, которые представляют интерес, в соответствии с постановкой задачи\n the paper presents the problem of algorithmizing of data processing for further use in predictive analytics models. The advantages of using predictive analytics models, such as increased productivity, risk reduction and cost optimization, are shown, as well as the difficulties that arise, in particular the labor-intensive processing of raw data. To solve this problem, an algorithm is presented in the form of a flowchart, which is roughly divided into three levels. The first level involves the initial obtaining of information and its translation into the available language of software tools. The operations of the second level are aimed at reducing the influence of factors that negatively affect the quality of the final model. At the third level, data is transformed and modified for more convenient use. For each level, the most common operations with data are given and examples of their use are shown. An example of the implementation of the proposed algorithm for the predictive analytics model training system on the example of an electric generator is considered. In practice, it is shown that it is possible not to strictly follow the rules, but to select operations for a specific problem, which allows to achieve greater flexibility and efficiency in work. After the necessary preparations, emission research has been carried out to study the abnormal system operation modes that are of interest according to the problem statement","PeriodicalId":515253,"journal":{"name":"ВЕСТНИК ВОРОНЕЖСКОГО ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА","volume":" 10","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-07-05","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"ВЕСТНИК ВОРОНЕЖСКОГО ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.36622/1729-6501.2024.20.2.002","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
решается задача алгоритмизации обработки данных для их дальнейшего использования в моделях предиктивного анализа. Показаны достоинства применения моделей предиктивной аналитики, такие как увеличение производительности, снижение риска и оптимизация затрат, а также возникающие сложности, в частности, трудоёмкость обработки исходной информации. Для решения обозначенной проблемы приводится алгоритм, представленный в виде блок-схемы, которая условно поделена на три уровня. На первом уровне происходит первичное получение информации и её перевод в доступный язык программных средств. Операции второго уровня предназначены для снижения влияния факторов, негативно сказывающихся на качестве итоговой модели. На третьем уровне данные трансформируются и видоизменяются для более удобного их использования. Для каждого уровня приведены наиболее распространённые действия с данными, показаны варианты их применения. Рассмотрена реализация предложенного алгоритма для системы обучения модели предиктивной аналитики на примере электрогенератора. На практике показана возможность не строгого следования предписаниям, а выбора операций под конкретную задачу, что позволяет достичь большей гибкости и эффективности в работе. После необходимой подготовки было проведено исследование выбросов для изучения нештатных режимов работы системы, которые представляют интерес, в соответствии с постановкой задачи
the paper presents the problem of algorithmizing of data processing for further use in predictive analytics models. The advantages of using predictive analytics models, such as increased productivity, risk reduction and cost optimization, are shown, as well as the difficulties that arise, in particular the labor-intensive processing of raw data. To solve this problem, an algorithm is presented in the form of a flowchart, which is roughly divided into three levels. The first level involves the initial obtaining of information and its translation into the available language of software tools. The operations of the second level are aimed at reducing the influence of factors that negatively affect the quality of the final model. At the third level, data is transformed and modified for more convenient use. For each level, the most common operations with data are given and examples of their use are shown. An example of the implementation of the proposed algorithm for the predictive analytics model training system on the example of an electric generator is considered. In practice, it is shown that it is possible not to strictly follow the rules, but to select operations for a specific problem, which allows to achieve greater flexibility and efficiency in work. After the necessary preparations, emission research has been carried out to study the abnormal system operation modes that are of interest according to the problem statement