数据库

注册

 

发新话题 回复该主题

iScience不确定性量化问题我们可以 [复制链接]

1#
哪个医院白癜风好治 https://disease.39.net/bjzkbdfyy/240412/c9oekn7.html

年8月19日,中科院上海药物所郑明月等人在iScience杂志发表文章Uncertaintyquantification:Canwetrustartificialintelligenceindrugdiscovery,总结了AI药物发现中不确定性量化问题的最新研究方法以及代表性应用。

摘要

近年来,计算机模型已被广泛用于加速药物发现过程。然而,这些模型中的大多数只能在训练集覆盖的有限化学空间(适用性域)内给出可靠的预测,对超出适用性域的样品的预测并不可靠,甚至会对药物设计决策过程带来误导。

不确定性量化(Uncertaintyquantification,UQ)问题是自主药物设计中的重要问题。通过量化模型预测的置信水平,可以定量表示预测的可靠性,以帮助研究人员进行分子推理和实验设计。

本文总结了不确定性量化的最新方法,并强调了如何将其用于药物设计和发现项目。此外,还概述了不确定性量化在药物发现中的四个代表性应用场景。

前言

人工智能和其他数据驱动的方法正在重塑药物发现和设计流程。对于具有大量训练数据的任务,监督学习可以有效地映射输入和输出之间的关系。一个典型的场景是基于一级序列预测蛋白质结构,其中AlphaFold2被认为已经解决了这个半个世纪的问题。然而,在大多数药物设计任务中,可用于训练的数据的数量通常是有限的。训练数据与测试数据分布的不一致可能导致模型产生不可靠的输出,这可能会对药物设计的决策程序产生不利影响。

图1Softmax函数给出的概率不能被可靠地视为是预测的置信度

图1B显示的是模型在训练集和测试集上给出的概率。可以看出,该模型在训练部分拟合良好,但在测试部分给出了过于自信的错误预测。

评估UQ方法的质量比较困难,因为这与应用场景和用户的目标相关。但总的来说,UQ方法的排名和校准能力是被

分享 转发
TOP
发新话题 回复该主题