高频心电图特征用于分类

П. Н. Подкур, Н. К. Смоленцев
{"title":"高频心电图特征用于分类","authors":"П. Н. Подкур, Н. К. Смоленцев","doi":"10.25699/sssb.2023.48.2.005","DOIUrl":null,"url":null,"abstract":"Для записи электрокардиограммы (ЭКГ) в настоящее время используются электрокардиографы высокого разрешения с частотой дискретизации до 20 кГц. Однако при автоматическом анализе ЭКГ считается, что верхняя граничная частота кардиосигнала, заметно влияющая на его форму не превышает 100 Гц. Поэтому частоты выше 100 Гц обычно считаются шумовыми и их удаляют при помощи различных фильтров для сглаживания сигнала. Ясно, что при удалении высокочастотных колебаний теряется большая часть информации, зарегистрированная кардиографом. Поэтому возникает вопрос о том, несет ли эта часть сигнала ЭКГ полезную для диагностики информацию. Как известно, вейвлет-анализ позволяет разложить сигнал на несколько компонент, выделяя сглаженную часть сигнала и высокочастотные компоненты. При этом каждая высокочастотная вейвлет-компонента имеет свой частотный диапазон. Числовые характеристики (признаки) высокочастотных компонент отражают информацию, которая теряется при сглаживании. Целью работы является изучение вопроса о том, какие из признаков несут наибольшую информацию и могут быть использованы в задачах классификации и диагностики. В работе используется вейвлет-разложение ЭКГ и вычисление признаков в системе MATLAB и MATLAB Wavelet Toolbox. Для классификации и нахождения наиболее информативных признаков используется метод опорных векторов (SVM) пакета scikit-learn для машинного обучения в Python. Найдены наиболее информативные признаки, которые обеспечивают точность разделения классов более 85%. Самым информативным признаком является средняя основная частота в узле (3,2) пакетного разложения. Поэтому эта частота и другие информативные признаки имеют диагностическое значение и могут быть использованы в классификации и диагностике в качестве новых дополнительных характеристик ЭКГ.\n To record electrocardiograms (ECG), high-resolution electrocardiographs with sampling rates up to 20 kHz are currently used. However, in the automatic analysis of the ECG, it is considered that the upper limiting frequency of the cardiosignal, which noticeably affects its shape, does not exceed 100 Hz. Therefore, frequencies above 100 Hz are usually considered noise and are removed using various filters to smooth the signal. It is clear that when high-frequency oscillations are removed, most of the information recorded by the cardiograph is lost. Therefore, the question arises as to whether this part of the ECG signal carries useful information. As you know, wavelet-analysis allows you to decompose the signal into several components, highlighting the smoothed part of the signal and high-frequency components. In addition, each high-frequency wavelet component has its own frequency range. The numerical characteristics (features) of the high-frequency components represent the information that is lost during smoothing. The aim of the work is to study the question of which of the features carry the most information and can be used in the problems of classification and diagnostics. The work uses ECG wavelet-decomposition and feature calculation in the MATLAB system and MATLAB Wavelet Toolbox. To classify and find the most informative features, the support vector machine (SVM) of the scikit-learn package for machine learning in Python is used. The most informative features are found, which provide an accuracy of class separation of more than 85%. The most informative feature is the average main frequency at the node (3,2) of the wavelet-packet expansion. Therefore, this frequency and other informative features are of diagnostic value and can be used in classification and diagnosis as new additional ECG characteristics.","PeriodicalId":133432,"journal":{"name":"Южно-Сибирский научный вестник","volume":"118 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"HIGH-FREQUENCY ECG Features FOR CLASSIFICATION\",\"authors\":\"П. Н. Подкур, Н. К. Смоленцев\",\"doi\":\"10.25699/sssb.2023.48.2.005\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Для записи электрокардиограммы (ЭКГ) в настоящее время используются электрокардиографы высокого разрешения с частотой дискретизации до 20 кГц. Однако при автоматическом анализе ЭКГ считается, что верхняя граничная частота кардиосигнала, заметно влияющая на его форму не превышает 100 Гц. Поэтому частоты выше 100 Гц обычно считаются шумовыми и их удаляют при помощи различных фильтров для сглаживания сигнала. Ясно, что при удалении высокочастотных колебаний теряется большая часть информации, зарегистрированная кардиографом. Поэтому возникает вопрос о том, несет ли эта часть сигнала ЭКГ полезную для диагностики информацию. Как известно, вейвлет-анализ позволяет разложить сигнал на несколько компонент, выделяя сглаженную часть сигнала и высокочастотные компоненты. При этом каждая высокочастотная вейвлет-компонента имеет свой частотный диапазон. Числовые характеристики (признаки) высокочастотных компонент отражают информацию, которая теряется при сглаживании. Целью работы является изучение вопроса о том, какие из признаков несут наибольшую информацию и могут быть использованы в задачах классификации и диагностики. В работе используется вейвлет-разложение ЭКГ и вычисление признаков в системе MATLAB и MATLAB Wavelet Toolbox. Для классификации и нахождения наиболее информативных признаков используется метод опорных векторов (SVM) пакета scikit-learn для машинного обучения в Python. Найдены наиболее информативные признаки, которые обеспечивают точность разделения классов более 85%. Самым информативным признаком является средняя основная частота в узле (3,2) пакетного разложения. Поэтому эта частота и другие информативные признаки имеют диагностическое значение и могут быть использованы в классификации и диагностике в качестве новых дополнительных характеристик ЭКГ.\\n To record electrocardiograms (ECG), high-resolution electrocardiographs with sampling rates up to 20 kHz are currently used. However, in the automatic analysis of the ECG, it is considered that the upper limiting frequency of the cardiosignal, which noticeably affects its shape, does not exceed 100 Hz. Therefore, frequencies above 100 Hz are usually considered noise and are removed using various filters to smooth the signal. It is clear that when high-frequency oscillations are removed, most of the information recorded by the cardiograph is lost. Therefore, the question arises as to whether this part of the ECG signal carries useful information. As you know, wavelet-analysis allows you to decompose the signal into several components, highlighting the smoothed part of the signal and high-frequency components. In addition, each high-frequency wavelet component has its own frequency range. The numerical characteristics (features) of the high-frequency components represent the information that is lost during smoothing. The aim of the work is to study the question of which of the features carry the most information and can be used in the problems of classification and diagnostics. The work uses ECG wavelet-decomposition and feature calculation in the MATLAB system and MATLAB Wavelet Toolbox. To classify and find the most informative features, the support vector machine (SVM) of the scikit-learn package for machine learning in Python is used. The most informative features are found, which provide an accuracy of class separation of more than 85%. The most informative feature is the average main frequency at the node (3,2) of the wavelet-packet expansion. Therefore, this frequency and other informative features are of diagnostic value and can be used in classification and diagnosis as new additional ECG characteristics.\",\"PeriodicalId\":133432,\"journal\":{\"name\":\"Южно-Сибирский научный вестник\",\"volume\":\"118 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-04-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Южно-Сибирский научный вестник\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.25699/sssb.2023.48.2.005\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Южно-Сибирский научный вестник","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25699/sssb.2023.48.2.005","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

目前正在使用高分辨率的心电图记录,频率高达20千赫。然而,在自动分析心电图时,人们认为心脏信号的上限频率不超过100赫兹。因此,超过100赫兹的频率通常被认为是噪声的,并通过不同的滤波器将其移除。很明显,当你移除高频振荡时,心脏监测器记录的大部分信息就会丢失。这就引出了一个问题,这部分心电图信号是否提供了有用的诊断信息。如你所知,wavlet分析允许将信号分解成多个组件,突出信号的平滑部分和高频组件。然而,每个高频波组件都有自己的频率范围。高频分量的数字特征(特征)反映了在平滑过程中丢失的信息。这项工作的目的是研究哪些指标携带最多信息,可以用于分类和诊断任务。它使用wavlet——心电图分解和MATLAB和MATLAB Wavelet Toolbox中的特征计算。在Python中,scikit-learn工具包(SVM)用于计算机学习。发现了最具启发性的特征,这些特征提供了85%以上的分离准确性。信息最丰富的特征是节点(3.2)的平均主频率。因此,频率和其他信息特征具有诊断意义,可以用于分类和诊断,作为心电图的新补充特征。到记录电(ECG),高高的重新配置电与20 kHz是可弯曲的。However,在automatic分析中,它被连接到cardiignal的有限值,当它被命名为100 Hz的时候。Therefore, frequencies above 100 Hz是一种协同的声音,也是一种协同的声音。这是《迷失》中信息记录最丰富的记录之一。Therefore, question arises是“签名carries useful信息”的一部分。如你所知,wavelet-analysis allows,你解构了签名的七合奏部分,高超的合奏部分。在addition, each高自由度wavelet公司自己的自由放养等级。数字充电器(features)是信息丢失的地方。这首歌是关于恐惧的问题,可以在经典和diagnostics的问题上使用。在MATLAB系统和MATLAB wavelet Toolbox中使用的歌曲“ECG wavelet”和“feature”。这是经典的,最后是最伟大的信息体验,这是一个科学包在Python是used。最重要的信息是它的基础,当它被证明是一个更高层次的层次时,85%。最重要的信息是在wavelet packer expansion的3.2个流程中最自由的感觉。Therefore,这个frequency和另一个信息共享的价值,可以在经典中使用和使用新的additionecg characteristics。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
HIGH-FREQUENCY ECG Features FOR CLASSIFICATION
Для записи электрокардиограммы (ЭКГ) в настоящее время используются электрокардиографы высокого разрешения с частотой дискретизации до 20 кГц. Однако при автоматическом анализе ЭКГ считается, что верхняя граничная частота кардиосигнала, заметно влияющая на его форму не превышает 100 Гц. Поэтому частоты выше 100 Гц обычно считаются шумовыми и их удаляют при помощи различных фильтров для сглаживания сигнала. Ясно, что при удалении высокочастотных колебаний теряется большая часть информации, зарегистрированная кардиографом. Поэтому возникает вопрос о том, несет ли эта часть сигнала ЭКГ полезную для диагностики информацию. Как известно, вейвлет-анализ позволяет разложить сигнал на несколько компонент, выделяя сглаженную часть сигнала и высокочастотные компоненты. При этом каждая высокочастотная вейвлет-компонента имеет свой частотный диапазон. Числовые характеристики (признаки) высокочастотных компонент отражают информацию, которая теряется при сглаживании. Целью работы является изучение вопроса о том, какие из признаков несут наибольшую информацию и могут быть использованы в задачах классификации и диагностики. В работе используется вейвлет-разложение ЭКГ и вычисление признаков в системе MATLAB и MATLAB Wavelet Toolbox. Для классификации и нахождения наиболее информативных признаков используется метод опорных векторов (SVM) пакета scikit-learn для машинного обучения в Python. Найдены наиболее информативные признаки, которые обеспечивают точность разделения классов более 85%. Самым информативным признаком является средняя основная частота в узле (3,2) пакетного разложения. Поэтому эта частота и другие информативные признаки имеют диагностическое значение и могут быть использованы в классификации и диагностике в качестве новых дополнительных характеристик ЭКГ. To record electrocardiograms (ECG), high-resolution electrocardiographs with sampling rates up to 20 kHz are currently used. However, in the automatic analysis of the ECG, it is considered that the upper limiting frequency of the cardiosignal, which noticeably affects its shape, does not exceed 100 Hz. Therefore, frequencies above 100 Hz are usually considered noise and are removed using various filters to smooth the signal. It is clear that when high-frequency oscillations are removed, most of the information recorded by the cardiograph is lost. Therefore, the question arises as to whether this part of the ECG signal carries useful information. As you know, wavelet-analysis allows you to decompose the signal into several components, highlighting the smoothed part of the signal and high-frequency components. In addition, each high-frequency wavelet component has its own frequency range. The numerical characteristics (features) of the high-frequency components represent the information that is lost during smoothing. The aim of the work is to study the question of which of the features carry the most information and can be used in the problems of classification and diagnostics. The work uses ECG wavelet-decomposition and feature calculation in the MATLAB system and MATLAB Wavelet Toolbox. To classify and find the most informative features, the support vector machine (SVM) of the scikit-learn package for machine learning in Python is used. The most informative features are found, which provide an accuracy of class separation of more than 85%. The most informative feature is the average main frequency at the node (3,2) of the wavelet-packet expansion. Therefore, this frequency and other informative features are of diagnostic value and can be used in classification and diagnosis as new additional ECG characteristics.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信