将 python 作为重建和分析全基因组代谢模型的工具

A. Isimov, G. Admanova, A. Sarzhigitova, N. Kemalova, B. Bakytzhankyzy
{"title":"将 python 作为重建和分析全基因组代谢模型的工具","authors":"A. Isimov, G. Admanova, A. Sarzhigitova, N. Kemalova, B. Bakytzhankyzy","doi":"10.53729/mv-as.2023.04.03","DOIUrl":null,"url":null,"abstract":"The cost reduction of high-throughput technologies has led to the development of data analysis methods that deal with the increasing availability of omics datasets. Constraint-based genome-scale metabolic modeling is an example of such a method. It uses omics data and biochemical networks, a mechanistic framework to combine omics data, to describe steady-state metabolic flux distributions. Therefore, a system of mass balance equations is created that can be solved via linear programming. To date, most software for constraint-based genome-scale modeling has relied on MATLAB, a popular proprietary programming language. However, Matlab has issues when dealing with the integration of omics datasets and modeling complex biological processes beyond metabolism. In contrast, Python, an object-oriented open-source programming language, is a better choice for solving these issues. It has a relatively easy syntax, offers an extensive community, and allows seamless integration of omics datasets. Owing to these factors, Python is a good emerging tool for constraint-based genome-scale metabolic modeling. This review aims to provide an introduction and systematic overview of Python-based tools for constraint-based genome-scale metabolic modeling. We installed, checked the documentation, and tried to use each tool described in the review. We grouped each tool into one of the three categories (GEM reconstruction and maintenance, phenotype simulation, or visualization software) and provided detailed tool and concept explanations when necessary. Снижение затрат на технологии с высокой пропускной способностью привело к разработке методов анализа данных, которые учитывают растущую доступность наборов данных omics. Примером такого метода является метаболическое моделирование в масштабе генома, основанное на ограничениях. Он использует данные omics и биохимические сети, а механистическая структура для объединения данных omics для описания стационарных распределений метаболических потоков. Таким образом, создается система уравнений баланса массы, которая может быть решена с помощью линейного программирования. На сегодняшний день большинство программных средств для моделирования генома на основе ограничений опирается на MATLAB, популярный проприетарный язык программирования. Однако у Matlab возникают проблемы при интеграции наборов данных omics и моделировании сложных биологических процессов, выходящих за рамки метаболизма. Напротив, Python, объектно-ориентированный язык программирования с открытым исходным кодом, является лучшим выбором для решения этих проблем. Он имеет относительно простой синтаксис, предлагает обширное сообщество и обеспечивает бесшовную интеграцию наборов данных omics. Благодаря этим факторам, Python является хорошим появляющимся инструментом для моделирования метаболизма в масштабе генома на основе ограничений. Цель этого обзора - представить введение и систематический обзор инструментов на базе Python для метаболического моделирования в масштабе генома на основе ограничений. Мы установили, проверили документацию и попробовали использовать каждый инструмент, описанный в обзоре. Мы сгруппировали каждый инструмент в одну из трех категорий (геномная метаболическая реконструкция и поддержание, моделирование фенотипа или программное обеспечение для визуализации) и при необходимости предоставили подробные пояснения к инструменту и концепции.","PeriodicalId":507045,"journal":{"name":"МИКРОБИОЛОГИЯ ЖӘНЕ ВИРУСОЛОГИЯ","volume":"238 ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-12-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"PYTHON КАК ИНСТРУМЕНТ ДЛЯ РЕКОНСТРУКЦИИ И АНАЛИЗА МЕТАБОЛИЧЕСКОЙ МОДЕЛИ В МАСШТАБЕ ГЕНОМА\",\"authors\":\"A. Isimov, G. Admanova, A. Sarzhigitova, N. Kemalova, B. Bakytzhankyzy\",\"doi\":\"10.53729/mv-as.2023.04.03\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"The cost reduction of high-throughput technologies has led to the development of data analysis methods that deal with the increasing availability of omics datasets. Constraint-based genome-scale metabolic modeling is an example of such a method. It uses omics data and biochemical networks, a mechanistic framework to combine omics data, to describe steady-state metabolic flux distributions. Therefore, a system of mass balance equations is created that can be solved via linear programming. To date, most software for constraint-based genome-scale modeling has relied on MATLAB, a popular proprietary programming language. However, Matlab has issues when dealing with the integration of omics datasets and modeling complex biological processes beyond metabolism. In contrast, Python, an object-oriented open-source programming language, is a better choice for solving these issues. It has a relatively easy syntax, offers an extensive community, and allows seamless integration of omics datasets. Owing to these factors, Python is a good emerging tool for constraint-based genome-scale metabolic modeling. This review aims to provide an introduction and systematic overview of Python-based tools for constraint-based genome-scale metabolic modeling. We installed, checked the documentation, and tried to use each tool described in the review. We grouped each tool into one of the three categories (GEM reconstruction and maintenance, phenotype simulation, or visualization software) and provided detailed tool and concept explanations when necessary. Снижение затрат на технологии с высокой пропускной способностью привело к разработке методов анализа данных, которые учитывают растущую доступность наборов данных omics. Примером такого метода является метаболическое моделирование в масштабе генома, основанное на ограничениях. Он использует данные omics и биохимические сети, а механистическая структура для объединения данных omics для описания стационарных распределений метаболических потоков. Таким образом, создается система уравнений баланса массы, которая может быть решена с помощью линейного программирования. На сегодняшний день большинство программных средств для моделирования генома на основе ограничений опирается на MATLAB, популярный проприетарный язык программирования. Однако у Matlab возникают проблемы при интеграции наборов данных omics и моделировании сложных биологических процессов, выходящих за рамки метаболизма. Напротив, Python, объектно-ориентированный язык программирования с открытым исходным кодом, является лучшим выбором для решения этих проблем. Он имеет относительно простой синтаксис, предлагает обширное сообщество и обеспечивает бесшовную интеграцию наборов данных omics. Благодаря этим факторам, Python является хорошим появляющимся инструментом для моделирования метаболизма в масштабе генома на основе ограничений. Цель этого обзора - представить введение и систематический обзор инструментов на базе Python для метаболического моделирования в масштабе генома на основе ограничений. Мы установили, проверили документацию и попробовали использовать каждый инструмент, описанный в обзоре. Мы сгруппировали каждый инструмент в одну из трех категорий (геномная метаболическая реконструкция и поддержание, моделирование фенотипа или программное обеспечение для визуализации) и при необходимости предоставили подробные пояснения к инструменту и концепции.\",\"PeriodicalId\":507045,\"journal\":{\"name\":\"МИКРОБИОЛОГИЯ ЖӘНЕ ВИРУСОЛОГИЯ\",\"volume\":\"238 \",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-12-19\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"МИКРОБИОЛОГИЯ ЖӘНЕ ВИРУСОЛОГИЯ\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.53729/mv-as.2023.04.03\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"МИКРОБИОЛОГИЯ ЖӘНЕ ВИРУСОЛОГИЯ","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.53729/mv-as.2023.04.03","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

高通量技术成本的降低促进了数据分析方法的发展,这些方法可以处理越来越多的 omics 数据集。基于约束的基因组尺度代谢建模就是这种方法的一个例子。它使用全息数据和生化网络(一种结合全息数据的机理框架)来描述稳态代谢通量分布。因此,可以创建一个质量平衡方程系统,并通过线性规划来求解。迄今为止,大多数基于约束的基因组尺度建模软件都依赖于 MATLAB(一种流行的专有编程语言)。然而,Matlab 在处理 omics 数据集的整合和新陈代谢以外的复杂生物过程建模时存在问题。相比之下,面向对象的开源编程语言 Python 是解决这些问题的更好选择。它的语法相对简单,拥有广泛的社区,可以无缝集成 omics 数据集。由于这些因素,Python 是基于约束的基因组尺度代谢建模的一个很好的新兴工具。本综述旨在介绍和系统概述基于 Python 的约束基因组尺度代谢建模工具。我们安装、检查了文档,并尝试使用了综述中描述的每个工具。我们将每个工具分为三类(GEM 重建和维护、表型模拟或可视化软件),并在必要时提供了详细的工具和概念解释。 随着高通量技术成本的降低,数据分析方法也随之发展起来,这些方法考虑到了omics数据集日益增长的可用性。这种方法的一个例子是基于基因组尺度约束的代谢建模。它利用全息数据和生化网络,以及一个机理框架,结合全息数据来描述代谢通量的稳态分布。这就产生了一个质量平衡方程系统,可以通过线性规划来求解。迄今为止,大多数基于约束条件的基因组建模软件都依赖于 MATLAB(一种流行的专有编程语言)。然而,Matlab 在整合全息数据集和模拟新陈代谢以外的复杂生物过程时存在问题。相比之下,开源的面向对象编程语言 Python 是解决这些问题的更好选择。它的语法相对简单,拥有一个庞大的社区,并能无缝集成 omics 数据集。这些因素使 Python 成为基于约束的基因组尺度代谢建模的新兴工具。本综述旨在介绍和系统概述基于 Python 的约束基因组尺度代谢建模工具。我们安装、检查了文档,并试用了综述中描述的每个工具。我们将每种工具分为三类(基因组代谢重建和维护、表型建模或可视化软件),并在适当的地方提供了详细的工具和概念解释。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
PYTHON КАК ИНСТРУМЕНТ ДЛЯ РЕКОНСТРУКЦИИ И АНАЛИЗА МЕТАБОЛИЧЕСКОЙ МОДЕЛИ В МАСШТАБЕ ГЕНОМА
The cost reduction of high-throughput technologies has led to the development of data analysis methods that deal with the increasing availability of omics datasets. Constraint-based genome-scale metabolic modeling is an example of such a method. It uses omics data and biochemical networks, a mechanistic framework to combine omics data, to describe steady-state metabolic flux distributions. Therefore, a system of mass balance equations is created that can be solved via linear programming. To date, most software for constraint-based genome-scale modeling has relied on MATLAB, a popular proprietary programming language. However, Matlab has issues when dealing with the integration of omics datasets and modeling complex biological processes beyond metabolism. In contrast, Python, an object-oriented open-source programming language, is a better choice for solving these issues. It has a relatively easy syntax, offers an extensive community, and allows seamless integration of omics datasets. Owing to these factors, Python is a good emerging tool for constraint-based genome-scale metabolic modeling. This review aims to provide an introduction and systematic overview of Python-based tools for constraint-based genome-scale metabolic modeling. We installed, checked the documentation, and tried to use each tool described in the review. We grouped each tool into one of the three categories (GEM reconstruction and maintenance, phenotype simulation, or visualization software) and provided detailed tool and concept explanations when necessary. Снижение затрат на технологии с высокой пропускной способностью привело к разработке методов анализа данных, которые учитывают растущую доступность наборов данных omics. Примером такого метода является метаболическое моделирование в масштабе генома, основанное на ограничениях. Он использует данные omics и биохимические сети, а механистическая структура для объединения данных omics для описания стационарных распределений метаболических потоков. Таким образом, создается система уравнений баланса массы, которая может быть решена с помощью линейного программирования. На сегодняшний день большинство программных средств для моделирования генома на основе ограничений опирается на MATLAB, популярный проприетарный язык программирования. Однако у Matlab возникают проблемы при интеграции наборов данных omics и моделировании сложных биологических процессов, выходящих за рамки метаболизма. Напротив, Python, объектно-ориентированный язык программирования с открытым исходным кодом, является лучшим выбором для решения этих проблем. Он имеет относительно простой синтаксис, предлагает обширное сообщество и обеспечивает бесшовную интеграцию наборов данных omics. Благодаря этим факторам, Python является хорошим появляющимся инструментом для моделирования метаболизма в масштабе генома на основе ограничений. Цель этого обзора - представить введение и систематический обзор инструментов на базе Python для метаболического моделирования в масштабе генома на основе ограничений. Мы установили, проверили документацию и попробовали использовать каждый инструмент, описанный в обзоре. Мы сгруппировали каждый инструмент в одну из трех категорий (геномная метаболическая реконструкция и поддержание, моделирование фенотипа или программное обеспечение для визуализации) и при необходимости предоставили подробные пояснения к инструменту и концепции.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信