背景
打分函数广泛应用于基于结构的计算辅助药物设计,其通过定量化评估药-靶的相互作用为药物研发中的药效评估提供理论依据[1-5],提高活性化合物甄别的效率。定量评估药物与靶标蛋白的相互作用通常分为两步,一步是对接处理(docking process),主要指构象搜索,找出潜在的binding pose;另一步是打分处理(scoring process),通常指打分,预测药-靶结合力。大部分打分函数并不基于完整的物理模型而作近似处理,因此往往不严格遵循多体扩展理论,守恒定律,对称不变性等,甚至有些基于知识的打分函数的表达式完全不含物理意义。事实上,作为应用于药物高通量筛选场景下的一种工具,大部分打分函数以效率为中心,通过近似的手段追求精度与效率的平衡[6]。
打分函数分类
从上世纪的90年代起,已报道的打分函数已经有超过一百种。先前已有一些工作综述过打分函数的分类,比如将打分函数分为基于力场的,基于经验的,基于知识的三种类型。近年来随着这个领域的研究不断深化,一些新的技术比如机器学习的引入带来的描述符的引入,加上基于经验的打分函数的表达式与基于力场的表达式的相似性,原有的打分函数分类描述会让初涉此领域的研究人员感到迷惑,因此王任小课题组在2015年结合打分函数研究的进展,对打分函数做出了新的分类的阐述[6]。其将打分函数大致进行了以下四类的阐述:分别是基于物理(力场)的打分函数,基于经验(回归)的打分函数,基于平均力势(知识)的打分函数,基于描述符(机器学习)的打分函数。下面通过推导原理与代表性的函数表达式对四种打分函数作进一步的介绍。
基于物理(physics-based)的打分函数
按传统划分此类打分函数是基于力场的打分函数。
能量函数推导形式
基于明确物理意义的物理模型推导。能量函数家族由基于实验数据拟合的力场函数,基于第一性原理的量化计算函数,基于连续介质的溶剂模型等组成。
下面举一个典型的表达式例子: