ALGORITHMISATION OF DATA PROCESSING AND PREPARATION FOR BUILDING PREDICTIVE ANALYTICS MODELS

П.Ю. Гусев, А.В. Таволжанский
{"title":"ALGORITHMISATION OF DATA PROCESSING AND PREPARATION FOR BUILDING PREDICTIVE ANALYTICS MODELS","authors":"П.Ю. Гусев, А.В. Таволжанский","doi":"10.36622/1729-6501.2024.20.2.002","DOIUrl":null,"url":null,"abstract":"решается задача алгоритмизации обработки данных для их дальнейшего использования в моделях предиктивного анализа. Показаны достоинства применения моделей предиктивной аналитики, такие как увеличение производительности, снижение риска и оптимизация затрат, а также возникающие сложности, в частности, трудоёмкость обработки исходной информации. Для решения обозначенной проблемы приводится алгоритм, представленный в виде блок-схемы, которая условно поделена на три уровня. На первом уровне происходит первичное получение информации и её перевод в доступный язык программных средств. Операции второго уровня предназначены для снижения влияния факторов, негативно сказывающихся на качестве итоговой модели. На третьем уровне данные трансформируются и видоизменяются для более удобного их использования. Для каждого уровня приведены наиболее распространённые действия с данными, показаны варианты их применения. Рассмотрена реализация предложенного алгоритма для системы обучения модели предиктивной аналитики на примере электрогенератора. На практике показана возможность не строгого следования предписаниям, а выбора операций под конкретную задачу, что позволяет достичь большей гибкости и эффективности в работе. После необходимой подготовки было проведено исследование выбросов для изучения нештатных режимов работы системы, которые представляют интерес, в соответствии с постановкой задачи\n the paper presents the problem of algorithmizing of data processing for further use in predictive analytics models. The advantages of using predictive analytics models, such as increased productivity, risk reduction and cost optimization, are shown, as well as the difficulties that arise, in particular the labor-intensive processing of raw data. To solve this problem, an algorithm is presented in the form of a flowchart, which is roughly divided into three levels. The first level involves the initial obtaining of information and its translation into the available language of software tools. The operations of the second level are aimed at reducing the influence of factors that negatively affect the quality of the final model. At the third level, data is transformed and modified for more convenient use. For each level, the most common operations with data are given and examples of their use are shown. An example of the implementation of the proposed algorithm for the predictive analytics model training system on the example of an electric generator is considered. In practice, it is shown that it is possible not to strictly follow the rules, but to select operations for a specific problem, which allows to achieve greater flexibility and efficiency in work. After the necessary preparations, emission research has been carried out to study the abnormal system operation modes that are of interest according to the problem statement","PeriodicalId":515253,"journal":{"name":"ВЕСТНИК ВОРОНЕЖСКОГО ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА","volume":" 10","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-07-05","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"ВЕСТНИК ВОРОНЕЖСКОГО ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.36622/1729-6501.2024.20.2.002","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

решается задача алгоритмизации обработки данных для их дальнейшего использования в моделях предиктивного анализа. Показаны достоинства применения моделей предиктивной аналитики, такие как увеличение производительности, снижение риска и оптимизация затрат, а также возникающие сложности, в частности, трудоёмкость обработки исходной информации. Для решения обозначенной проблемы приводится алгоритм, представленный в виде блок-схемы, которая условно поделена на три уровня. На первом уровне происходит первичное получение информации и её перевод в доступный язык программных средств. Операции второго уровня предназначены для снижения влияния факторов, негативно сказывающихся на качестве итоговой модели. На третьем уровне данные трансформируются и видоизменяются для более удобного их использования. Для каждого уровня приведены наиболее распространённые действия с данными, показаны варианты их применения. Рассмотрена реализация предложенного алгоритма для системы обучения модели предиктивной аналитики на примере электрогенератора. На практике показана возможность не строгого следования предписаниям, а выбора операций под конкретную задачу, что позволяет достичь большей гибкости и эффективности в работе. После необходимой подготовки было проведено исследование выбросов для изучения нештатных режимов работы системы, которые представляют интерес, в соответствии с постановкой задачи the paper presents the problem of algorithmizing of data processing for further use in predictive analytics models. The advantages of using predictive analytics models, such as increased productivity, risk reduction and cost optimization, are shown, as well as the difficulties that arise, in particular the labor-intensive processing of raw data. To solve this problem, an algorithm is presented in the form of a flowchart, which is roughly divided into three levels. The first level involves the initial obtaining of information and its translation into the available language of software tools. The operations of the second level are aimed at reducing the influence of factors that negatively affect the quality of the final model. At the third level, data is transformed and modified for more convenient use. For each level, the most common operations with data are given and examples of their use are shown. An example of the implementation of the proposed algorithm for the predictive analytics model training system on the example of an electric generator is considered. In practice, it is shown that it is possible not to strictly follow the rules, but to select operations for a specific problem, which allows to achieve greater flexibility and efficiency in work. After the necessary preparations, emission research has been carried out to study the abnormal system operation modes that are of interest according to the problem statement
数据处理的算法化和建立预测分析模型的准备工作
解决了为在预测分析模型中进一步使用而进行数据处理的算法问题。使用预测分析模型的优势,如提高生产率、降低风险和优化成本,以及由此产生的困难,特别是原始数据的劳动密集型处理。为了解决这个问题,本文以流程图的形式介绍了一种算法,该算法有条件地分为三个层次。第一层是初始接收信息,并将其转换为软件工具的可用语言。第二级的操作旨在减少对最终模型质量产生负面影响的因素。在第三层,对数据进行转换和修改,以便更方便地使用。每个层次都给出了最常见的数据操作,并显示了其应用的变体。以发电机为例,考虑了预测分析模型训练系统的拟议算法的实施。在实践中,可以不严格按照规定进行操作,而是针对特定任务选择操作,这样可以提高工作的灵活性和效率。在进行了必要的准备工作后,进行了排放研究,以调查系统的异常运行模式,根据问题陈述,本文提出了数据处理的算法化问题,以便进一步用于预测分析模型。文中介绍了使用预测分析模型的优势,如提高生产率、降低风险和优化成本,以及由此产生的困难,特别是处理原始数据的劳动密集型工作。为了解决这个问题,本文以流程图的形式介绍了一种算法,大致分为三个层次。第一层是初步获取信息,并将其转换为软件工具的可用语言。第二级的操作旨在减少对最终模型质量产生负面影响的因素。在第三层,对数据进行转换和修改,以便更方便地使用。对于每个层次,我们都给出了最常见的数据操作,并举例说明其使用方法。以发电机为例,介绍了预测分析模型训练系统的拟议算法实施实例。实践表明,可以不严格遵循规则,而是针对具体问题选择操作,这样可以提高工作的灵活性和效率。在做了必要的准备工作后,根据问题陈述进行了发射研究,以研究人们感兴趣的异常系统运行模式
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信