收藏 分享(赏)

蛋白激酶CK2天然产物类抑制剂的定量构效关系研究_张雪文.pdf

上传人:哎呦****中 文档编号:354732 上传时间:2023-03-22 格式:PDF 页数:7 大小:1.32MB
下载 相关 举报
蛋白激酶CK2天然产物类抑制剂的定量构效关系研究_张雪文.pdf_第1页
第1页 / 共7页
蛋白激酶CK2天然产物类抑制剂的定量构效关系研究_张雪文.pdf_第2页
第2页 / 共7页
蛋白激酶CK2天然产物类抑制剂的定量构效关系研究_张雪文.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷 第 期 年 月北京生物医学工程 .基金项目:北京市自然科学基金()、国家自然科学基金()资助作者单位:北京工业大学环境与生命学部(北京)通信作者:张娜。:.蛋白激酶 天然产物类抑制剂的定量构效关系研究张雪文 张娜 李春华 孙国辉 赵丽娇 钟儒刚摘要目的构建 天然产物类抑制剂的定量构效关系(,)模型,揭示影响该类抑制剂活性的结构因素,为新型 抑制剂的开发提供理论基础和实验依据。方法 基于文献报道的 个多骨架 天然产物类抑制剂,采用遗传算法(,)联合多元线性回归(,)方法,建立了基于优选的 描述符的 模型,以留一法交叉验证系数 以及相关系数 作为模型内部验证的评价指标;通过 和 评估模型的

2、外部预测能力。结果 最优 模型由 个描述符组成,基于训练集内部验证的统计学参数为.、.;基于测试集外部验证的统计学参数为.、.,表明该模型具有较高的可靠性和预测能力。结论 影响 天然产物类抑制剂活性的分子描述符包括、以及。本研究可为新型 抗癌抑制剂的发现提供实验指导。关键词 蛋白激酶;天然产物类抑制剂;定量结构活性关系;遗传算法;多元线性回归:.中图分类号.文献标志码 文章编号()本文著录格式 张雪文,张娜,李春华,等 蛋白激酶 天然产物类抑制剂的定量构效关系研究北京生物医学工程,():,():,:(:.)【】,()(),.,.,.,【】;引言蛋白激酶 作为调控细胞增殖、分化及凋亡的关键因子,

3、通过磷酸化多种底物而参与诱导细胞生长、抑制细胞凋亡及调控病毒蛋白功能等生理过程,与肿瘤及新型冠状病毒的发生、发展密切相关,以其为靶点的抗肿瘤及抗新冠病毒药物研发具有重要的临床应用价值。然而,其多数 竞争性抑制剂具有选择性差、毒副作用大及成药性低等缺陷,阻碍其进一步成为候选药物,且尚无相关药物上市。因此,靶向 的高活性且良好类药性的抗癌及抗病毒抑制剂仍亟待研发。天然产物及其类似物因具有良好的抗肿瘤、抗病毒和抗氧化等生物活性,而被认定为重要的药物先导化合物来源。目前,依据化合物分子骨架,天然产物类抑制剂主要包括蒽醌类、香豆素类、黄酮类以及鞣花酸和异甘草素等化合物。蒽醌类代表化合物是天然产物大黄素(

4、),其衍生物(.)对蛋白激酶 有较高的抑制活性和选择性。等合成了一系列香豆素类化合物,其中最有效的抑制剂为(.),其香豆素骨架可以降低蒽醌类所产生的副作用。等测定了 个黄酮类化合物对 的抑制活性,解析出芹菜素与玉米 的晶体复合物,为基于结构的黄酮类衍生物设计提供了思路。等运用基于受体的虚拟筛选技术,发现其羧基取代的黄酮类化合物表现出良好的 抑制活性(),并合成了一系列具有高抑制活性的含有卤素的羧基取代黄酮类化合物。国内李春梅等测定了槲皮素、杨梅黄酮等 种黄酮类化合物对人类 抑制活性,并深入分析了构效关系。鞣花酸()表现出较高的抑制活性()及较高选择性,对 及 均没有抑制活性。最近,本课题组运用

5、基于受体药效团的虚拟筛选技术,率先识别出了直链骨架的异甘草素对 具有较高的抑制活性(.)。由此可见,目前关于 天然产物类抑制剂的研究主要集中在具有新型化合物的筛选及活性测试方面,而对该类化合物构效关系进行综合且深入阐述分析的研究报道相对较少,有关影响其抑制活性的分子结构因素也尚不够明确,进而导致天然产物类衍生物的再开发存在一定的盲目性和随机性,大大限制了我国抗癌天然产物资源的合理开发及综合利用。定量 构 效 关 系(,)模型是指运用数理统计分析的方法来构建化学物质结构与生物活性之间关系模型,总结出生物活性与化学特征之间的变化规律,可实现对化合物的活性预测,进而有针对性地对化合物进行设计和改造,

6、在现代药物研发领域发挥重要的作用。本课题组曾运用基于配体和基于受体的方法构建了香豆素类衍生物的 模型,并根据模型设计了具有较高活性的三氟甲基香豆素类衍生物。此外,本课题组采用低能构象及分子对接构象叠合方法,构建了黄酮类化合物的构效关系模型,揭示取代基位置及性质与抑制活性之间的关系。等构建了苯并咪唑衍生物的 模型,并阐述了其结合机制及药效基团。然而,上述研究仅局限于单一骨架的某类化合物,分子样本数据集较小,所构建的模型仅识别出某类活性基团且适用范围有限。因此,本研究针对 天然产物类抑制剂,构建基于多骨架化合物的构效关系模型,进而识别出多样性的药效分子描述符,为基于天然产物骨架的新型先导化合物的优

7、化提供结构素材及理论指导。在本研究中,选取了文献,报道的北京生物医学工程 第 卷 个 天然产物类抑制剂,采用遗传算法(,)联合多元线性回归(,)方法,建立了优选的分子结构描述符与其蛋白激酶 抑制活性之间的 模型,进一步探讨影响抑制剂生物活性的主要分子结构因素,推测活性化合物所必备的关键理化性质,为新型 抑制剂的结构修饰提供了理论基础与技术指导。研究方法.化合物数据集所选取的 个 天然产物类抑制剂的分子骨架如图 所示,以化合物的 值作为 研究的因变量。综合考虑训练集和测试集中化合物的骨架及其抑制活性的相似度,按照化合物数量 的比例,将数据集分为训练集与测试集。其中训练集用于构建模型,而测试集用于

8、评价模型的预测能力。.化合物分子描述符的计算所有 化 合 物 的 分 子 结 构 均 由 .软件进行绘制,并使用默认转换程序转换为 构 象,运 用 模 块 进 行 结 构 优 化。软件(.)用以计算化合物的分子描述符。由于三维结构的构象复杂性,在此没有考虑三维描述符,只使用了具有明确物理化学意义的二维分子结构描述符。通过 .软件(,)筛除高度自相关(.)的描述符,得到 个 描述符用于构建 模型。最后使用 软件中的全子集和 模块对化合物进行描述符筛选。.模型构建与验证在全子集和 模块筛选出的描述符的基础上,采用 软件中的 普通最小二乘法(,)建立 模型。根据竞标规则,以留一法交叉验证系数()作为

9、适应性函数,衡量模型的稳健性,利用 将描述符的优化组合与 相结合,实现按要求自动挑选变量个数、自动挑选最佳变量并进行多元线性回归,返回指定个数的回归模型(即 模型),建模参数设置如下:种群大小、突变率、遗传数分别设置为、。经过反复的实验,得到了一组模型。然后采用 软件中的多标准决策(,)模块对生成模型的性能得分从 到 进行排序,其中 和 分别表示最差和最佳验证准则值,从而选择具有最佳 分数的 模型。通过内部和外部验证方法对模型准确度以及泛化能力进行评价。内部验证采用留一法交叉验证方法,关键参数主要有相关系数、调整系数 和均方根误差;采用 随机化方法检验 模型偶然相关的可能性(次迭代检验随机重排

10、的效应值拟合度)。进一步针对该模型进行基于测试集数据的外部验证,比较简单的方法是以一个统计量评价模型的预测能力,如使用、或 和 等。和外部验证相关系数平方 用于评估模型的外部预测性能。其计算公式如下:图 天然产物类抑制剂的分子骨架结构 第 期 张雪文,等:蛋白激酶 天然产物类抑制剂的定量构效关系研究 ()式中:表示测试集中每一个化合物实验值和预测值之间的方差和;表示测试集化合物实验值与训练集化合物的平均实验值之间的方差和。()()式中:表示测试集分子的实验值与预测值之间有截距的相关系数平方;表示无截距的相关系数平方。.模型的适用域评价根据 准则 定义的应用域,只有化合物落在模型的 内,它们的预

11、测值才被认为可靠,模型的 由杠杆距离和标准化方法定义。在原始变量空间中,化合物的杠杆作用被描述为 值(),警示杠杆值()为:()()式中:代表分子描述符的数量;是化合物用来建模的数量即训练集化合物的数量。对于化合物,则它不在模型的 内,将会被认为是一个结构异常值。此外,将标准残差值设定为.,如果化合物的预测值与实验值之比高于.,则将其识别为效应异常值。结果及分析.最优模型及其验证基于所筛选得到的 个分子描述符,运用 与 相结合的方法产生了 个 模型。在此基础上,利用 模块剔除具有相关性的模型,得到了 个之间相互独立的模型,并采用 模块对模型性能进行打分排序,最终选择打分最高,含有 个描述符的

12、号模型为最优模型:.()根据“”规则,模型训练集()与描述符()的比值()应不小于。本研究所得最优模型含有 个描述符,训练集含有 个化合物,满足此规则,表明描述符数量适当,不存在过度拟合现象,这些描述符之间的矩阵相关性分析结果见表,可知任意 个描述符之间的相关性均.,表明这些描述符之间不存在明显的共线性问题,有利于构建稳定的、预测能力较强的 模型。严格的 模型验证程序包括内部验证和外部验证。本研究中采用留一法交叉验证方法和 随机化验证进行内部验证,所得统计学参数如表 所示。一般来讲.且.意味着 模型具有较高的预测能力和统计学意义,该模型.,.,表明最优模型具有较高的可靠性和内部预测能力,同时较

13、低的和 值也证实了模型的可靠性且不存在任何偶然相关性。此外,根据 等的研究结论,如果模型满足以下条件则认为所建立的 模型是可接受的:().;()()表 最优模型中 个描述符的相关矩阵分析 描述符.北京生物医学工程 第 卷.和.或().和.,其中 是回归曲线经过原点的斜率。由表 可知,所建模型 .,.,().,说明该模型是可以接受的;等提出外部验证相关系数平方 大于.(该模型 为.),表明模型具有较高的外部预测能力。表 最优模型的内部验证和外部验证统计学参数 内部验证(训练集)外部验证(测试集).().基于最优模型针对训练集和测试集化合物进行活性预测,实验值与预测值的线性拟合图表明两者数值具有一

14、致性(图),说明该模型具有较高的预测能力。.模型的适用域与异常值分析最优模型的适用域如图 所示,所有化合物的预测活性均小于 个标准残差,训练集和测试集均未发现效应异常值,表明该 模型具有较高的预测能力。值得注意的是,训练集中的 个化合物 值均高于杠杆阈值(.)显示为结构异常值,原因在于它们含有乙基基团、磺酰基、四个环结构,与其他化合物的结构具有较大的差异性,因此被认定为结构异常值。但由于其预测误差值较小(分别为.、.、.、.、.),故其预测值仍可靠。图 实验值和预测值的线性拟合图 图 最优模型的 图 .最优 模型分析由式()可知,影响天然产物类抑制剂活性的主要 结 构 因 素 包 括 属 于

15、基 础 描 述 符 的、和,属于邻域对称性指数描述符的,属于矩阵描述符的 ,属于原子状态指数描述符的 以及属于二维频率指纹描述符的。所选描述符相应化学意义的详细说明可见分子描述符手册。由式()可知,与 抑制活性呈正相关的描述符包括:基于分子图形进行等价类计算得到的描述符,用于定义拓扑距离为(个键的距离)处潜在的氢键供体 受体原子(如氧、氮等)数量的第 期 张雪文,等:蛋白激酶 天然产物类抑制剂的定量构效关系研究原子对描述符,芳香环上 原子数目的描述符,基于 矩阵的描述符,用于评价配体受体的结合亲和力的描述符,用于衡量化合物的某种结构碎片对活性的影响的描述符 以及表示在相应的拓扑距离上 键的频率

16、的描述符 。与 抑制活性呈负相关的描述符包括:表示 型片段的描述符(本研究中 表示通过碳和 连接的、原子)。图 与分子描述符 及 相关的 抑制剂 讨论本研究通过构建 天然产物类抑制剂的 模型,识别出与化合物抑制活性相关的药效活性分子描述符。其中,表示芳香环上卤素原子的数目,作为正相关描述符,推测该卤素原子可与活性口袋的 或 形成卤键作用,从而有利于提高化合物抑制活性。如化合物(.)含有两个氯原子,其抑制活性优于不含卤素的化合物(.)。之前的研究中苯环咪唑类化合物 的 和 位卤素原子分别与铰链区残基 和 形成相互作用 也 可 以 证 实 这 一 点。对 于 正 相 关 描 述 符,化合物(.中 )位上的羟基与 位羧基上的羰基氧原子和羟基氧原子分别形成两个 描述符,而化合物(.)的 位不含羟基,未形成 描述符,因此其抑制活性较低于化合物。等设计、合成的一系列具有不同取代基的三环喹啉类化合物,其中化合物(,.)的活性分别是化合物的(,)和(,)的 和 倍,也说明该描述符与抑制活性呈正相关这一结论相一致。结论本研究选取 种蛋白激酶 天然产物类抑制剂作为数据集,利用 和 相结合方法建立了 模型,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2