基于配体的药物设计(Ligand‐based drug design, LBDD)#

基本概念#

基于结构的药物设计(SBDD):在已知生物大分子靶点结构的情况下,直接考虑药物与靶点的相互作用来进行药物设计。量体裁衣。

基于配体的药物设计(LBDD):在生物靶点结构未知的情况下,通过研究与靶点具有特异性结合配体的结构信息,发现先导化合物的方法。量衣裁衣。

基于配体的药物设计(LBDD):

  • 定量构效关系(QSAR):

    • 二维定量构效关系(2D‐QSAR) Hansch方法

    • 三维定量构效关系(3D‐QSAR) CoMFA方法

  • 相似性搜索

  • 药效团模型(Pharmacophore)

药效团模型 Pharmacophore model#

药效团的基本概念#

一个特定受体的药物小分子都具有某种特定的特征结构,换句话说,只要具备这些特征,一个化合物就有可能是这个受体潜在药物分子。这些特征点的集合,我们就称之为药效团。

药效团的由来

  • 药物分子与受体靶点发生作用时,要与靶点产生几何匹配和能量匹配,此时药物分子的构象称为活性构象(药效构象)。

  • 药物分子中的基团对于活性的影响不同,有些基团的变化对药物与靶点之间的相互作用影响很大,有些则影响不大。

  • 对于这种差异的研究,人们发现具有相同活性的分子往往具有相同的某些特征。

  • 只要具备这些特征,一个化合物就有可能是这个受体的潜在药物分子。

药效团(Pharmacophore),是指药物分子中可以与受体结合位点形成氢键、静电、疏水等非键相互作用的原子或原子团,及其相互之间的空间关系。具体官能团

IUPAC对药效团的定义:药效团是和特异的靶标结合并引发(或阻断)靶标生物响应所必需的一组立体和电子特征。抽象特征

药效团从结构层面上揭示了药物与受体结合并启动药理活性的微观特征,也就是说,一组活性分子共同呈现特定的药理活性的基础是由于有相同的药效团特征和分布

药效团模型方法

  • 药效团模型方法一般包括两个层面的内容:即药效团模型的建立和基于药效团模型的数据库搜索。

  • 药效团模型的建立仅仅是得到药效团模型。

  • 通过药效团模型,希望能够找到新的先导化合物,这就需要采用基于药效团模型的数据库搜索。

  • 通过数据库搜索,来寻找包含特定药效团特征的化合物,这些具有特定药效团特征的化合物可能具有相应的生物活性。

药效特征元素

进行药效团模建的前提是发现和确证配体含有的药效特征元素(药效团特征)

  • 典型的药效团特征一般用球体来表示,球心为准确位置,半径为可偏离的范围。具体特征包括:氢键供体、氢键受体、正电中心、负电中心、疏水中心、芳环中心、排除体积、形状约束等。此外,还包括有自定义的其它特征。

氢键供体(hydrogen bond donor)

主要包括H以及与之相连的O和N,一般包括:

  • 非酸性羟基(非羧酸或酚类中的羟基)。羧酸、酚类中的羟基之所以显酸性是由于羟基中氧的未成对p电子与苯环、羰基形成p‐π共轭体系,致使氧上电子云密度降低,氢很容易解离。

  • 氨基。

  • 次氨基,但不包括三氟甲基硫酰胺和四唑中的次氨基。

氢键受体(hydrogen bond accepter)

广义来讲,任何带有孤对电子的原子,如N、O、F、S。在一般的药效团模型方法中,仅考虑药物分子中最常见的氢键受体形式,包括:

  • sp3或sp2杂化的O(与C等原子以单键或双键相连的O)

  • 与C以双键形式相连的S

  • 与C以双键或三键相连的N

氢键的方向性

由于配体与受体之间的氢键相互作用一般具有明确的方向性,因此一般都采用两个点来描述氢键特征,一个点表示氢键特征中重原子的空间位置,而另一个点表示氢键给体或受体的矢量方向。

对于氢键受体,矢量方向一般为重原子和其上孤对电子连线的方向。

对于氢键给体,矢量方向为重原子和与之相连的氢原子形成键的方向。

疏水中心(hydrophobic area)

配体与受体上的疏水基团总是倾向于形成紧密的疏水堆积作用,形成疏水性内核。

  • 疏水相互作用本质上包含了熵效应和范德华相互作用。

  • 疏水基团一般由非极性原子组成,有疏水相互作用的片段很多,如甲基、乙基、苯环等。

  • 在药效团模型方法中,只需要用一个点表示。

芳环中心(aromatic ring)

芳环可以参与药物分子和蛋白受体之间的π电子离域系统的π‐π相互作用。

  • 芳环中心主要包括五元和六元芳环,如噻吩、苯环等。

  • 芳环需要由两个参量来定义:一个参量是芳环的空间位置,即芳环中所有原子的几何中心;另一个参量是芳环平面矢量方向,一般用垂直于芳环平面的矢量来描述。

电荷中心(charge interaction)

配体上的电荷中心是指配体上的带电基团,由于具有较多的部分电荷,这些基团往往可以和受体形成盐桥或较强的静电吸引作用。

  • 电荷中心既可以是带有电荷的原子,也可以是在生理pH下会发生电离的中性基团,如氨基、羧基。

  • π电子离域系统,如羧酸盐、胍基、脒基等也可能形成电荷中心。

正电荷中心

  • 带正电荷的原子

  • 伯、仲、叔脂肪胺中的N原子

  • 氮‐氮双取代的脒基中的亚胺N原子或四氮取代的胍基中的亚胺N原子

  • 至少含有一个未取代氢原子的脒基中的N原子中心或至少含有一个未取代氢原子的胍基中的N原子中心。

负电荷中心

  • 带负电荷的原子

  • 三氟甲基磺酰胺中的N原子

  • 羧酸、亚磺酸或磷酸中羟基氧和氧代氧的原子中心

  • 磷酸二酯和磷酸酯中羟基和氧代氧的原子中心

  • 硫酸和磺酸中羟基氧和两个氧代氧的原子中心

  • 磷酸单酯和磷酸中氧代氧和两个羟基氧的原子中心

  • 四唑中的氨基氮原子

几何约束

药效特征元素可以抽象为点(如:疏水中心、电荷中心)、线(如:氢键)、面(如:芳环)的形式。一个完整的药效团模型中除了必须包含药效特征元素之外,还需要包括药效特征元素之间的空间约束,这些约束是指各特征元素的位置约束,各特征元素之间的距离、角度、取向等。

排除体积(excluded volumes)

  • 在配体和受体相互作用时,在配体的某些取代位置上存在某些原子或原子团可能会和受体产生不利的原子碰撞,这些位置上的原子或原子团占有的位置就构成排除体积。

  • 在排除体积中存在原子或原子团会大大降低化合物的活性。

药效团模型的应用#

  • 虚拟筛选

  • 全新药物设计

  • 先导物优化

  • 多靶点药物设计

  • 骨架跃迁

  • 靶点预测(反向找靶)

常用的药效团模型构建工具

  • Catalyst DS

  • DISCO(distance comparison) Sybyl

  • GASP(genetic algorithm similarity program) Sybyl

  • Phase Schrodinger

  • LigandScout

  • Pharmacophore in MOE

Discovery studio中的药效团模型#

药效团模型#

药效团模型

药效团模型

基于配体

HipHop Hypogen

基于受体

Structure‐based Pharmacophore(SBP)

基于复合物

Complex‐based Pharmacophore(CBP)

_images/146.png

基于配体的药效团模型构建与筛选的基本步骤

_images/145.png
  1. 活性化合物的选择及药效特征元素的定义

  • 对于用来搭建药效团模型的化合物,其结构刚性要大一些,即分子的构象要少一些,这样叠合得到的药效团模型会较为明确。

  • 所选分子应该具有尽量多的结构多样性。如果药效团识别方法只能识别分子公共的药效特征,则选择的分子要具有尽量高的活性。

  • 如果药效团识别方法可以根据药效团模型和分子之间的叠合情况对分子的活性进行定量的预测,则选择的分子需要具有准确的生物活性。

  1. 构象分析

  • 对每个化合物都要进行构象分析,得到在某一能量范围内的构象。

  • 这个能量范围一般是根据经验来指定,比如在CATALYST中,默认条件下,构象分析会保留和最低能量构象相差20kcal/mol之内的所有构象。

  • 构象分析保留的构象要尽量少一些。

  • 在一般的药效团识别软件中,都会对保留的构象数有明确的限制。

  1. 分子叠合和药效团映射

  • 得到药效团特征元素以及构象以后,就需要对这些构象进行叠合以找到共同的药效团模型。

  • 在叠合时,药效特征元素作为分子间叠合的叠合点。

  • 分子叠合往往会提供多个药效团,或者说分子存在多种公共的药效特征元素空间分布形式。

  • 要想得到较为明确的药效团模型,则要尽量选择结构差别较大的分子。

  1. 药效团模型的修正

  • 分子叠合得到的药效团往往不是最优的,可能还需要根据自己的经验和其他实验或计算的结果对药效团模型做进一步的修正。比如加入排除体积和形状限制。

基于配体的药效团#

  • HipHop:基于分子共同特征的药效团模型。用于发现一系列配体小分子所共有的化学特征,并基于这些共同特性结构的比对叠合自动生成药效团模型,用户可以使用共有的特征药效团去搜索化合物数据库来寻找可能的先导分子

HipHop对于训练集的要求

  • 输入的分子结构具有多样性

  • 化合物数目值2~32个,6个左右比较理想

  • 输入的结构需知活性强弱(强、中、弱)

  • 需要包含principal和MaxOmitFeat性质参数

principal和MaxOmitFeat性质参数意义

  • Principal 属性定义了分子的活性水平:

数值

活性水平

描述内容

2

有活性

参考分子,分子中所有化学特征在构建药效团模型时都要考虑。

1

中等活性

定位药效团特征元素时需要考虑该化合物的构象空间。

0

非活性

该分子在定位药效团特征元素时不考虑,用于选择性地定义排除体积。

  • MaxOmitFeat 属性定义了每个分子中允许不与药效团模型匹配的特征元素的个数:

数值

描述内容

0

构建的药效团模型中所有特征元素都必需与化合物匹配上。

1

构建的药效团模型中允许有1 个特征元素不与化合物匹配。

2

构建的药效团模型中所有特征元素都无需与化合物匹配。

‐1

考虑所有药效团特征元素的子集

  • HypoGen:具有活性预测能力的药效团。可以基于一系列针对特定生物靶标具有明确活性数值的化合物构建出具有活性预测能力的药效团模型。该算法首先构建得到活性分子能共享而非活性分子则不能共享的初始药效团模型,然后再经过模拟退火进行模型的进一步优化。最终构建得到的模型可以预测化合物的活性,以及指导化合物的优化以提高其活性。

HypoGen对训练集分子的要求

  • 分子结构兼具多样性

  • 分子的活性值至少跨越4个数量级

  • 每个数量级的活性分子至少3个,化合物总数在16~31个

  • 结构类似的化合物之间活性相差至少一个数量级

  • 活性相似的化合物之间结构不同

  • 需要包含Activ和Uncert性质参数

HypoGen算法流程

  1. “构建”步骤

  • 识别活性分子

  • 识别活性最大的两个分子的所有药效团

  • 用活性分子筛选药效团

  1. “删除”步骤

  • 由“构建”步骤产生的药效团如果出现在大部分非活性分子中,删除

  1. 优化步骤

HipHop和HypoGen的区别

HipHop

HypoGen

训练集数量

2~32

〉16

训练集是否有活性

全是活性分子

活性分子与非活性分子

活性值

不需要

需要

模型的类型

定性,只基于公共特征

定量,可预测活性值

模型的比较

训练集分子结构多样性

训练集分子结构和活性多样性

药效特征元素的个数

最多10个

最多5个

基于受体结构的药效团——Structure Based Pharmacophore (SBP)#

SBP:基于经典的LUDI算法,从已知或假设的蛋白活性位点的特性直接得到相互作用位点图(feature interaction map),并且将这个信息转化成适用于快速三维数据库检索的药效团模型。

SBP 方法首先通过对活性部位的分析产生特征相互作用图,特征相互作用图用于反映可能的配体与蛋白之间的合理的相互作用,接着通过特征相互作用图产生药效团模型,进一步利用药效团模型发现潜在的活性化合物。

SBP操作流程

  1. 导入蛋白结构及定义活性位点

  2. 产生相互作用模型及药效团模型

  3. 对feature聚类

  4. 产生最终模型

Complex Based Pharmacophore (CBP)#

CBP:基于LigandScout算法,通过识别受体‐配体相互作用的关键特性构建药效团模型进行先导物的发现与优化

该类药效团从受体配体间的相互作用出发,能更加准确直接地反应出它们之间的药效团特征

基于CBP的重要应用——反向找靶

一个分子与多个代表各靶标蛋白的药效团模型相互匹配,按照打分高低来判定可能与哪个靶标相互作用

PharmaDB:市场上最大的受体‐配体复合物药效团数据库

  • 共25万多个药效团模型

  • 基于scPDB中16000多个复合物晶体结构

药效团模型的验证#

药效团模型的好坏直接影响经虚拟筛选后得到的候选化合物质量。为此,有必要进行药效团模型的验证,其目的就是为了评价所构建的药效团模型能否准确的将活性化合物与非活性化合物区分开。目前主要的验证方法有 3 种:

  • Fischer’s randomization 验证方法

  • 测试集验证方法

  • Decoy 验证方法

Fischer’s randomization验证方法是用于检测我们所构建的模型是否具有较好的统计关联。在该方法中,原有训练集中所有化合物与各自的活性关系将会被自动打乱,并进行随机的重新分配,从而组成新的训练集。在参数设置和方法与之前相同的前提下,利用新的训练集构建药效团。统计显著性利用以下公式计算:Significance = 100(1‐(1+x)/y) 其中,x表示随机产生的药效团total cost值低于原始训练集的数目;y表示包括原始药效团在内的所有药效团数目。

_images/147.webp

如右图,19组随机得到的药效团模型其total cost值均明显高于初始模型(Hypo1),即说明该模型的统计显著性远远优于其它所有随机得到的药效团模型。

测试集验证:一个成功的药效团不仅要求能准确预测训练集中所有分子的活性,而且还必须具备准确预测训练集以外活性化合物活性的能力。

  • 故需要选取一定数量(多于10个),具有一定活性梯度且不存在于训练集中的活性分子组成测试集

  • 使用测试集分子预测模型的筛选能力,q^2越接近于1,预测能力越强

_images/148.webp

Decoy Set 诱饵分子数据集验证:是指通过已知化合物与非活性化合物建立decoy set,该数据集可验证该药效团模型对于活性化合物和非活性化合物的区分能力。模型筛选性能参数:命中率(hit rate)、富集因子(Enrichment Factor,EF)与ROC曲线(Receiver Operating Characteristic Curve, ROC Curve)

Decoy有一个现成的网站,可直接下载测试文件 http://dude.docking.org/

药效团模型方法vs定量构效关系方法#

药效团模型可以基于不同类的化合物,它得到的是与生物活性有关的重要的药效团特征,这组药效团特征是对配体小分子活性特征的抽象与简化,因此药效团模型方法可以用于寻找结构全新的先导化合物。

定量构效关系方法一般是基于母体相似的同系列化合物,它得到的是化合物结构和活性之间的定量关系,这个定量关系一般只能用于先导化合物的改造。

总结#

_images/149.png

药效团模型的构建和验证实验#

实验目的:#

  1. 掌握基于分子共同特征的药效团模型(HipHop)的构建和验证。

  2. 掌握基于复合物的药效团(CBP)模型的构建和结果分析。

实验原理:#

使用 Discovery Studio 软件进行基于分子共同特征的药效团模型(HipHop)和基于复合物的药效团(CBP)模型的构建,验证和结果分析。

HipHop:基于分子共同特征的药效团模型。用于发现一系列配体小分子所共有的化学特征,并基于这些共同特性结构的比对叠合自动生成药效团模型,用户可以使用共有的特征药效团去搜索化合物数据库来寻找可能的先导分子。

CBP:基于 LigandScout 算法,通过识别受体‐配体相互作用的关键特性构建药效团模型进行先导物的发现与优化。该类药效团从受体配体间的相互作用出发,能更加准确直接地反应出它们之间的药效团特征。

本实验所用软件环境:

  • DS Version:19.1.0.18287

  • PP Version:19.1.0.1963

  • DS Client Version:19.1.0.18287

  • OS Distribution:Windows

  • OS Version:10.0.22000

实验步骤:#

◆ 基于分子共同特征的药效团模型的构建和验证

  1. 训练集分子的准备:本实验中使用老师提供的 5HT2c_ligands.sd 训练集

  2. 药效团特征元素的选取:

    药效特征元素的定义:点击 Discovery Studio 软件上的 Pharmacophores → Edit and Cluster Features → Feature Mapping 进行药效特征元素的定义。设置参数如下图。

    _images/150.png

    药效特征元素的查看:点击 Discovery Studio 软件上的 Pharmacophores → Edit and Cluster Features → Current Feature → All Features 进行药效特征元素的查看。

  3. Common Feature Pharmacophore 的构建:点击 Discovery Studio 软件上的Pharmacophores → Create Pharmacophores Automatically → Common Feature Pharmacophore Generation 进行 Common Feature Pharmacophore 的构建。设置参数如下图,使用老师提供的 Decoy 数据集 active_ligandsDecoy 数据集 inactive_ligands 进行药效团验证。

_images/151.png
  1. 外部测试集分析:合并老师提供的 Decoy 数据集 active_ligands 与 Decoy 数据集 inactive_ligands(也就是复制 Decoy 数据集 active_ligands 中的全部分子,然后粘贴到 Decoy 数据集 inactive_ligands 中,或者直接 下载已经合并好的文件 ),点击 Discovery Studio 软件上的 Pharmacophores → Search, Screen and Profile → Ligand Profile 进行外部测试集的分析,设置参数如下。Input Ligands 选择前面合并的数据集,Input File Pharmacophores 选择之前运行 Common Feature Pharmacophore 构建流程所得到的 Output 文件夹中的所有模型。(按 SHIFT-选取)

_images/152.png

◆ 基于复合物的药效团模型的构建和结果分析

  1. 蛋白的准备:本实验中使用老师提供的 2irz.pdb 蛋白 。点击 Discovery Studio 软件上菜单栏上的 Structure→ Crystal Cell→ Remove Cell 进行晶胞的去除。点击Macromolecules → Prepare Protein → Prepare Protein,设置参数如下,来进行蛋白结构的准备得到新窗口 2IRZ_prep 。接下来的操作都是在新的窗口当中进行。

_images/153.png
  1. 配体的准备:从 2IRZ_prep 窗口中剪切 2IRZ 自带的配体(名称为Ligand1,在Ligand Groups中)粘贴到新窗口中,并重命名为 Ligand。(重命名的操作:点击选中 2irz 并单击鼠标右键,选择最后一项 Attribute of 2irz…,出现下图对话框,将 Name 改为 Ligand)

_images/154.png
  1. 药效团模型的构建:点击 Discovery Studio 软件上的 Pharmacophores → Create Pharmacophores Automatically → Receptor-Ligand Pharmacophore Generation 进行药效团模型的构建,设置参数如下。再把配体小分子再复制粘贴到结果窗口,观察药效团与配体小分子的匹配情况。

_images/155.png

实验结果:#

基于分子共同特征的药效团模型的构建和验证:

  1. 药效特征元素的定义的结果

  2. Common Feature Pharmacophore 的构建的结果

  3. 外部测试集分析的结果

基于复合物的药效团模型的构建和结果分析:

  1. 蛋白的准备

  2. 药效团模型的构建

讨论:#

参与基于分子共同特征的药效团模型的构建的六个分子:

_images/156.png

这些分子结构具有多样性,包含principal和MaxOmitFeat性质参数,都有强活性。

从 HipHop 模型验证结果可以看出,HipHop 模型的敏感度很好,但是特异性很差,用于药物筛选时,可能会错误的把无活性的化合物认为潜在的Hit,但是应该不会错过潜在的Hit。其中名为 Pharmacophore_1 的药效团在验证中的表现最好,因为 AUC 值最大。