人工智能在药物研发中的应用(上):AI与制药场景如何相互“适配”?
近年来,人工智能(AI)已经被广泛应用于多个行业,彻底改变了社会生活的许多领域。
在制药这一传统行业,AI也已经有了诸多应用。AI逐渐应用于药物发现的靶点发现,虚拟筛选,化合物设计与合成,ADME-T性质和理化性质预测,药物临床试验设计、管理、患者招募,药物警戒应用和真实世界证据生成等多个流程和环节。
那么,AI应用于制药的逻辑是什么?AI会如何改变药物研发?如何应对制药行业的效率挑战?本文分为上下篇,本篇重点介绍AI在制药行业多场景中展开及面临的挑战。
制药受困
从制药行业的困境说起。
在过去的数十年里,许多科学、技术和管理因素都取得了巨大进步,这有助于提高药物研发的生产率(R&D)。然而,自1950年以来,每10亿美元研发投入获得批准的新药数量几乎每9年减少一半,该趋势在60年间非常稳定,被称为制药行业的反摩尔定律(Eroom’s Law)。新药的开发成本越来越高,药物研发面临着严重的生产力危机。
对于反摩尔定律主要有三种解释,即低垂果实假设(好摘的果子被摘走了)、监管障碍假设(新药申报的监管要求不断增高)、研发模式问题。前两种解释都是客观事实难以改变,那么,是否有更好的药物研发模式?这是制药行业一直在思考的问题。
制药行业在遭遇生产力困境的同时,也面临着数据困境。
随着全社会数字化信息化的快速推进、药物研发设备的升级和长期的积累,可用的药物研发数据越来越多,以至于在一定时间范围内无法使用常规方法和软件工具分析和处理所有数据。传统的统计学在浩瀚的大数据面前越来越力不从心。制药企业正在经历数字化转型,大量的数据产生。于是,日益增长的数据处理的需求,与现有数据分析能力之间的矛盾,推动制药行业寻求新出路。
AI的橄榄枝
2016年3月,AI程序AlphaGo大胜韩国著名棋手李世石,是AI发展历史上的里程碑事件。这一事件加快了AI在社会生活多个领域的探索和应用,也让制药行业看到了提高药物研发生产率的希望。2016年后,AI在制药行业的技术测试大量开展。实验科学不再是唯一选项,以数据为中心的药物发现逐渐走上舞台。
在随后的几年时间里,AI制药逐渐 "升温",概念验证研究持续不断、大量的资本涌入AI驱动的生物技术初创公司、制药公司与AI生物技术公司和AI技术供应商之间的合作越来越多。一些领先的制药公司的高管认为,AI不仅仅是一个先导化合物发现的工具,而且是一个促进生物学研究、发现新的生物靶点和开发新的疾病模型的更通用的工具。
AI在制药的多场景中展开
数年间,AI已经被尝试应用于药物研发的几乎所有流程和环节,主要有以下方面:
靶点确认。靶点确认是药物开发中的关键步骤,也是最复杂的步骤之一。目前已知的药物靶点绝大多数为蛋白质,通过机器学习的方法,从蛋白质原始信息中提取特征,构建准确稳定的模型进行功能的推断、预测和分类,已经成为靶点研究的重要手段。从患者的样本中、海量的生物医学资料中提取基因组学、蛋白质组学、代谢组学等多组学数据,借助深度学习来分析非疾病和疾病状态之间的差异,也可用来发现对疾病有影响的蛋白质。
基于表型的药物发现。在过去的三十多年里,基于靶点的药物发现都是药物发现的主要方法。近年来,基于表型的药物发现(直接使用生物系统进行新药筛选)受到关注。机器学习可以在表型筛选中将细胞表型与化合物作用方式联系起来,获得靶点、信号通路或遗传疾病关联的聚类。而AI强大的图像处理能力,能够将生物系统的所有形态特征整合,系统研究药物潜在的作用方式和信号通路,扩展对于疾病的生物学认识。
分子生成。机器学习方法可以产生新的小分子。AI可以通过对海量的化合物或者药物分子的学习,获得化合物分子结构和成药性方面的规律,进而根据这些规律生成很多自然界从未存在过的化合物作为候选药物分子,有效构建拥有一定规模且高质量的分子库。
化学反应设计。AI目前正在取得进展的化学领域之一是对化学反应和合成路线进行建模和预测。AI可以将分子结构映射为可以由机器学习算法处理的形式,根据已知化合物的结构,形成多条合成路线,并推荐最佳合成路线。反过来,在给定反应物的情况下,深度学习、迁移学习可以预测化学反应结果。AI还可用来探索新的化学反应。
化合物筛选。AI能够对化合物的化学结构与生物活性之间的关系进行建模,预测化合物的作用机制。一个典型的例子是MIT的研究人员基于深度学习发现了新的抗生素。研究人员训练了一个能够预测具有抗菌活性的分子的深层神经网络,在几天内筛选超过 1 亿个化合物,根据模型的预测分数对化合物进行排名,最终确定了8种与已知抗生素在结构上差别较大的抗生素。
ADMET性质预测。药代动力学性质不够理想,是临床研究阶段药物研发失败的主要原因之一。深度学习可以自动识别化合物的相关特征,评估数据集中多个ADMET参数之间的隐藏的关系和趋势,预测化合物的细胞渗透性和溶解性等性质。
药物临床试验。新药开发中资金投入最多的阶段是临床试验阶段,AI在临床试验的设计、管理、患者招募方面皆有应用潜力。自然语言处理技术可从各种结构化和非结构化数据类型中提取信息,找到符合临床试验入组标准的受试者;也可用于关联各种大型数据集,找到变量之间的潜在关系,改进患者与试验的匹配情况。诺华已使用机器学习算法监控和管理所有的临床试验。
药物警戒。AI将对传统的药物警戒带来冲击。随着监管要求的严格和患者安全意识的提高,药物警戒的工作量和成本大大增加。AI可以将药物不良反应从接收到报告的整个流程实现自动化,优化药物警戒的工作并降低成本。基于AI系统还有可能通过预测能力展开药物风险评估。
真实世界研究。AI的进步提供了分析大型多维RWD(真实世界数据)的新策略。AI能够识别真实世界数据中的内在关联,生成新的假设,也能为临床试验提供新的信息。最新的一个案例是,AI通过分析真实世界数据,可以找出不会影响试验的总生存期的风险比的入组标准,从而扩大临床试验的人群范围。
AI在药物研发中的应用还包括理化性质预测、药物重定向、制剂开发中的应用等。
问题显现
AI在药物研发中的应用远非一帆风顺,归结起来,是AI如何与制药场景相互“适配”的问题。
对制药行业来说,走AI的路,就要穿AI的鞋。AI方法对于其适用对象的相关条件有诸多要求。如同传统药物研发需要配备必要的硬件设备和必要的环境设施(如科学仪器设备、实验室等),基于AI的药物研发需要配备数据、算法、算力,其中对数据的要求最为严格。
传统的药物研发以实验科学为主。数十年来,药物研发数据的记录、治理和储存都以实验为核心,根据实验的需求来调整,数据是实验的“附属”。而AI作为虚拟科学、计算科学和数据科学范畴内的方法,直接从数据入手,将数据放在第一位,对于数据的格式、标准、质量、数量都有内在的要求。在这样的情况下,AI直接使用传统药物研发模式的数据往往遇到困难。
对AI来说,进入制药的主场,就应当遵循制药的规律。比如,药物的开发是一个多维同步优化的过程,鉴于数据的规模和复杂性,基于AI的药物研发往往需要重写机器学习算法,而不是简单地调用。AI与制药这一传统行业的核心业务深度融合,需更深刻的行业理解力和更高的技术准确率。AI虽然已经可以从大量已知论文、实验数据中挖掘新的知识,改变了传统基于学术经验的研究方式,然而方法的准确性、可解释性、可重复性等还有待提高。
此外,传统的药物研发模式已有相对健全的监管政策、行业体系。作为一种新的模式,AI在制药行业的应用探索,也需要相应的行业政策和体系来规范和引导。(智药邦 侯小龙)
(责任编辑:陆悦)
分享至
右键点击另存二维码!