蛋白化学计量建模的工业评估:预测激酶的药物靶点亲和力

Astrid Stroobants , Lewis H. Mervin , Ola Engkvist , Graeme R. Robb
{"title":"蛋白化学计量建模的工业评估:预测激酶的药物靶点亲和力","authors":"Astrid Stroobants , Lewis H. Mervin , Ola Engkvist , Graeme R. Robb","doi":"10.1016/j.ailsci.2023.100079","DOIUrl":null,"url":null,"abstract":"","PeriodicalId":72304,"journal":{"name":"Artificial intelligence in the life sciences","volume":"4 ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"An industrial evaluation of proteochemometric modelling: Predicting drug-target affinities for kinases\",\"authors\":\"Astrid Stroobants , Lewis H. Mervin , Ola Engkvist , Graeme R. Robb\",\"doi\":\"10.1016/j.ailsci.2023.100079\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"\",\"PeriodicalId\":72304,\"journal\":{\"name\":\"Artificial intelligence in the life sciences\",\"volume\":\"4 \",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-01-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Artificial intelligence in the life sciences\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://www.sciencedirect.com/science/article/pii/S2667318523000235\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Artificial intelligence in the life sciences","FirstCategoryId":"1085","ListUrlMain":"https://www.sciencedirect.com/science/article/pii/S2667318523000235","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

据报道,深度学习蛋白化学计量(PCM)模型在公共基准数据集上取得了优异的性能。然而,许多论文对常用的评估指标表示怀疑,认为它们不能反映真正的前瞻性预测能力。本研究的目的是根据专有数据对最先进的PCM模型的性能进行全面评估,并评估其作为激酶抑制剂虚拟筛选工具的潜力。虽然该模型已被证明在公共基准数据集上实现了0.48的均方根误差,但在本研究中,观察到专有数据集的总体性能受损,使用时间分割策略,均方根误差为0.85,皮尔逊相关系数为0.65。我们假设,更有限的性能可以部分归因于在工业环境中观察到的化学空间随着时间的推移而发生的变化,而在基准数据集上更常用的更宽松的随机配体分裂策略没有考虑到这一点。PCM模型的总体性能在统计上与多任务模型相似,仅略优于KNN和随机森林PCM模型。对性能进行了全面分析,以捕捉竞争性激酶抑制剂设计中面临的关键挑战,这揭示了PCM建模的关键局限性。例如,该模型对研究不足的靶标的预测能力较差,评估配体选择性和混杂性的能力有限,与多任务模型或随机森林PCM模型相比,性能没有提高。总的来说,这些发现表明,与不太复杂的模型(如多任务模型或随机森林PCM模型)相比,本研究中评估的PCM模型并没有提供显著的好处,作为工业环境中激酶抑制剂的虚拟筛选工具。总之,这项研究强调了通过使用更严格的拆分策略、更广泛的基准测试和更全面的性能分析来超越传统指标,对PCM模型进行更稳健的评估的必要性。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
An industrial evaluation of proteochemometric modelling: Predicting drug-target affinities for kinases
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
Artificial intelligence in the life sciences
Artificial intelligence in the life sciences Pharmacology, Biochemistry, Genetics and Molecular Biology (General), Computer Science Applications, Health Informatics, Drug Discovery, Veterinary Science and Veterinary Medicine (General)
CiteScore
5.00
自引率
0.00%
发文量
0
审稿时长
15 days
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信