Analysis of Short Time Series in Gene Expression Tasks

A. Kirshners, A. Borisov
{"title":"Analysis of Short Time Series in Gene Expression Tasks","authors":"A. Kirshners, A. Borisov","doi":"10.2478/v10143-010-0056-0","DOIUrl":null,"url":null,"abstract":"Analysis of Short Time Series in Gene Expression Tasks The article analyzes various clustering approaches that are used in gene expression tasks. The chosen approaches are portrayed and examined from the viewpoint of use of data mining clustering algorithms. The article provides a short description of working principles and characteristics of the examined methods and algorithms and the data sets used in the experiments. The article presents results of the experiments that are directly connected to the use of clustering algorithms in processing of short time series in bioinformatics tasks, solving gene expression problems as well as provides conclusions and evaluations of each used approach. An analysis of future possibilities to build a new method that is based on data mining approaches and principles but solves bioinformatics tasks that are associated with processing of short time series and the achieved results are interpreted in a way that is easy to perceive for bioinformatics experts, is presented. Īsu laika rindu analīze gēnu ekspresijas uzdevumos Rakstā tiek analizētas un aplūkotas hierarhiskās un sadalošās klasterizācijas pieejas, kuras tiek izmantotas gēnu ekspresijas uzdevumos. Izvēlētās pieejas ir aplūkotas un analizētas no datu ieguves klasterizācijas algoritmu izmantošanas iespēju pielietojuma. Rakstā tiek īsi aprakstīti aplūkojamo metožu un algoritmu darbības principi, raksturīgākās iezīmes un eksperimentos izmantotās datu kopas. Uz atrasto klasteru bāzes tiek veidoti paraugmodeļi jeb klastera objektu vidējo vērtību novērtējums katrā laika momentā. Balstoties uz atrastajiem paraugmodeļiem tiek veikta salīdzinošā analīze. Uzskaitīti ir eksperimentu rezultāti, kas tieši saistīti ar klasterizācijas algoritmu izmantošanu apstrādājot īsas laika rindas bioinformātikā, risinot gēnu ekspresijas uzdevumus. Izdarīti secinājumi un veikti novērtējumi par katru no izmantotajām pieejām. Analizētas nākotnes iespējas jaunas metodes izveidei, kas balstītos uz datu ieguves pieejām un principiem, bet risinātu bioinformātikas uzdevumus, kuri saistīti ar īsu laika rindu apstrādi un iegūtie rezultāti tiktu interpretēti bioinformātikas speciālistiem saprotamā veidā. Анализ коротких временных рядов в задачах экспрессии генов В статье проведен анализ и обзор кластеризации на основе методов иерархии и разбиения, которые используются в задачах экспрессии генов. Выбранные методы анализируются и рассматриваются с точки зрения применения возможностей использования кластеризационных алгоритмов в задачах добычи данных. В статье кратко изложен принцип работы рассматриваемых методов и алгоритмов, а также - характерные черты и используемые в экспериментах выборки данных. На основе определенных кластеров образуются прототипы, которые указывают на среднее значение объектов в кластере, в каждой временной точке. На основе полученных прототипов произведен сравнительный анализ. Приведены результаты экспериментов, которые связаны с использованием кластеризационных алгоритмов при обработке коротких временных рядов в области биоинформатики, решая задачи экспрессии генов. Сделаны выводы и произведена оценка каждого использованного подхода. Проанализированы возможные подходы к разработке в будущем нового метода, который основывается на принципах добычи данных, но в то же время решает задачи биоинформатики. Эти задачи связаны с обработкой коротких временных рядов, и полученные результаты должны интерпретироваться в виде, понятном для специалистов биоинформатики.","PeriodicalId":211660,"journal":{"name":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","volume":"31 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.2478/v10143-010-0056-0","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Analysis of Short Time Series in Gene Expression Tasks The article analyzes various clustering approaches that are used in gene expression tasks. The chosen approaches are portrayed and examined from the viewpoint of use of data mining clustering algorithms. The article provides a short description of working principles and characteristics of the examined methods and algorithms and the data sets used in the experiments. The article presents results of the experiments that are directly connected to the use of clustering algorithms in processing of short time series in bioinformatics tasks, solving gene expression problems as well as provides conclusions and evaluations of each used approach. An analysis of future possibilities to build a new method that is based on data mining approaches and principles but solves bioinformatics tasks that are associated with processing of short time series and the achieved results are interpreted in a way that is easy to perceive for bioinformatics experts, is presented. Īsu laika rindu analīze gēnu ekspresijas uzdevumos Rakstā tiek analizētas un aplūkotas hierarhiskās un sadalošās klasterizācijas pieejas, kuras tiek izmantotas gēnu ekspresijas uzdevumos. Izvēlētās pieejas ir aplūkotas un analizētas no datu ieguves klasterizācijas algoritmu izmantošanas iespēju pielietojuma. Rakstā tiek īsi aprakstīti aplūkojamo metožu un algoritmu darbības principi, raksturīgākās iezīmes un eksperimentos izmantotās datu kopas. Uz atrasto klasteru bāzes tiek veidoti paraugmodeļi jeb klastera objektu vidējo vērtību novērtējums katrā laika momentā. Balstoties uz atrastajiem paraugmodeļiem tiek veikta salīdzinošā analīze. Uzskaitīti ir eksperimentu rezultāti, kas tieši saistīti ar klasterizācijas algoritmu izmantošanu apstrādājot īsas laika rindas bioinformātikā, risinot gēnu ekspresijas uzdevumus. Izdarīti secinājumi un veikti novērtējumi par katru no izmantotajām pieejām. Analizētas nākotnes iespējas jaunas metodes izveidei, kas balstītos uz datu ieguves pieejām un principiem, bet risinātu bioinformātikas uzdevumus, kuri saistīti ar īsu laika rindu apstrādi un iegūtie rezultāti tiktu interpretēti bioinformātikas speciālistiem saprotamā veidā. Анализ коротких временных рядов в задачах экспрессии генов В статье проведен анализ и обзор кластеризации на основе методов иерархии и разбиения, которые используются в задачах экспрессии генов. Выбранные методы анализируются и рассматриваются с точки зрения применения возможностей использования кластеризационных алгоритмов в задачах добычи данных. В статье кратко изложен принцип работы рассматриваемых методов и алгоритмов, а также - характерные черты и используемые в экспериментах выборки данных. На основе определенных кластеров образуются прототипы, которые указывают на среднее значение объектов в кластере, в каждой временной точке. На основе полученных прототипов произведен сравнительный анализ. Приведены результаты экспериментов, которые связаны с использованием кластеризационных алгоритмов при обработке коротких временных рядов в области биоинформатики, решая задачи экспрессии генов. Сделаны выводы и произведена оценка каждого использованного подхода. Проанализированы возможные подходы к разработке в будущем нового метода, который основывается на принципах добычи данных, но в то же время решает задачи биоинформатики. Эти задачи связаны с обработкой коротких временных рядов, и полученные результаты должны интерпретироваться в виде, понятном для специалистов биоинформатики.
基因表达任务中的短时间序列分析
基因表达任务中的短时间序列分析本文分析了用于基因表达任务的各种聚类方法。从使用数据挖掘聚类算法的角度对所选择的方法进行了描述和检查。本文简要介绍了所检测的方法和算法的工作原理和特点,以及实验中使用的数据集。本文介绍了与使用聚类算法处理生物信息学任务中的短时间序列、解决基因表达问题直接相关的实验结果,并提供了每种使用方法的结论和评估。分析了未来建立一种基于数据挖掘方法和原理的新方法的可能性,但解决了与短时间序列处理相关的生物信息学任务,并以一种易于生物信息学专家理解的方式解释了所取得的结果。Īsu laika rindu analytuz gēnu ekspresijas uzdevumos rakstajek analizētas un aplūkotas hierarhiskās un sadalošās klasterizācijas pieejas, kuras tiek izmantotas gēnu ekspresijas uzdevumos。Izvēlētās pieejas ir aplūkotas un analizētas no datu ieguves klasterizācijas算法izmantošanas iespēju pielietojuma。rakstunitiek īsi aprakstu īti aplūkojamo metožu unalgoritmu darbī as principi, raksturīgākās iezi īmes uneksperimentos izmantotās datu kopas。Uz atrasto klasteru bāzes tiek veidoti paraugmodeļi jeb klastera object jektu vidējo vērtību novērtējums katrā laika momentu。Balstoties uz atrastajem paraugmodeļiem tiek veikta salīdzinošā analyze z。Uzskaitīti红外eksperimentu rezultā钛、ka领带š我saistīti ar klasterizā比赛algoritmu izmantoš阿奴apstrādā记īsas莱卡犬rinda最大bioinformā下来ā,risinot gēνekspresijas uzdevumus。izdar ī i secinājumi un veikti novērtējumi par katru no izmantotajām pieejām。Analizētas nākotnes iespējas jaunas medes izveidei, kas balstostuz uz datu ieguves pieejām unprinciple, bet risinātu bioinformātikas uzdevumus, kuri saistosti ar īsu laika rindu apstrādi un iegūtie rezultāti tiktu interpretēti bioinformātikas speciālistiem saprotamuveidi。АнализкороткихвременныхрядоввзадачахэкспрессиигеновВстатьепроведенанализиобзоркластеризациинаосновеметодовиерархиииразбиения,которыеиспользуютсявзадачахэкспрессиигенов。Выбранныеметодыанализируютсяирассматриваютсясточкизренияприменениявозможностейиспользованиякластеризационныхалгоритмоввзадачахдобычиданных。Встатьекраткоизложенпринципработырассматриваемыхметодовиалгоритмов,атакже——характерныечертыииспользуемыевэкспериментахвыборкиданных。Наосновеопределенныхкластеровобразуютсяпрототипы,которыеуказываютнасреднеезначениеобъектоввкластере,вкаждойвременнойточке。Наосновеполученныхпрототиповпроизведенсравнительныйанализ。Приведенырезультатыэкспериментов,которыесвязанысиспользованиемкластеризационныхалгоритмовприобработкекороткихвременныхрядоввобластибиоинформатики,решаязадачиэкспрессиигенов。Сделанывыводыипроизведенаоценкакаждогоиспользованногоподхода。Проанализированывозможныеподходыкразработкевбудущемновогометода,которыйосновываетсянапринципахдобычиданных,новтожевремярешаетзадачибиоинформатики。Этизадачисвязанысобработкойкороткихвременныхрядов。иполученныерезультатыдолжныинтерпретироватьсяввиде,понятномдляспециалистовбиоинформатики。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信