最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

化学信息学论文

来源:动视网 责编:小OO 时间:2025-10-02 18:37:45
文档

化学信息学论文

化合物的结构与活性关系的模型与预测08#############摘要:查阅一篇有机分子合成与生物活性测试方面的文献。本文使用ChembioOffice、Gaussian、HyperChem、SPSS等软件,构建文献中每个化合物模型,搜寻最低能量构象并进行几何优化。在优化好的结构的基础上计算描述子。利用逐步回归选择描述子,建立线性模型。根据模型,设计具有潜在高活性的新化合物,并预测其活性。关键词:活性;模型;线性一、实验准备1.1文献查找与化合物的确定查阅JournalofMedicinalCh
推荐度:
导读化合物的结构与活性关系的模型与预测08#############摘要:查阅一篇有机分子合成与生物活性测试方面的文献。本文使用ChembioOffice、Gaussian、HyperChem、SPSS等软件,构建文献中每个化合物模型,搜寻最低能量构象并进行几何优化。在优化好的结构的基础上计算描述子。利用逐步回归选择描述子,建立线性模型。根据模型,设计具有潜在高活性的新化合物,并预测其活性。关键词:活性;模型;线性一、实验准备1.1文献查找与化合物的确定查阅JournalofMedicinalCh
化合物的结构与活性关系的模型与预测

08## ### ########

摘要:

查阅一篇有机分子合成与生物活性测试方面的文献。本文使用ChembioOffice、Gaussian 、HyperChem 、SPSS等软件,构建文献中每个化合物模型,搜寻最低能量构象并进行几何优化。在优化好的结构的基础上计算描述子。利用逐步回归选择描述子,建立线性模型。根据模型,设计具有潜在高活性的新化合物,并预测其活性。

关键词:活性;模型;线性

一、实验准备

1.1文献查找与化合物的确定

查阅Journal of Medicinal Chemistry中的相关文献,本文所研究的化合物来自参考文献①。本文所选化合物共19个,具有相同的骨架结构,各化合物之间具有较好的可比性。化合物的骨架结果如图1-1-1所示:

图1-1-1

各化合物的生物活性如图1-1-2所示:

图1-1-2

图1-1-2

根据R基的不同,分别组成下列19个化合物,各化合物结构如图1、17、18、20-35所示:

1 1718 20

21 22 2324 25 26

27 28

29 3031 32

33 34

35

观察以上19个化合物,可见各化合物所含原子数目较少,结构简单且不含有金属离子,无电荷,有明确的IC50值。运用软件进行各分子的模拟及计算时,比较简便,适合进行本次的论文练习,确定使用以上化合物。

1.2 主要应用软件介绍

1.2.1 ChembioOffice②

ChembioOffice 是由CambridgeSoft开发的综合性科学应用软件包。利用ChemBioOffice 可以方便的进行化学生物结构绘图、分子模型及仿真;可以将化合物名称直接转为结构图;也可以对已知结构的化合物命名,给出正确的化合物名称。

本次论文运用了ChembioOffice的其中两个模块:

ChemDraw模块- 化学结构绘图软件,是各论文期刊指定的格式。

Chem3D模块- 提供工作站级的3D分子轮廓图及分子轨道特性分析,并和数种量子化学软件结合在一起。由于Chem3D提供完整的界面及功能,已成为分子仿真分析最佳的前端开发环境。

1.2.2 Gaussian 03③

Gaussian 03是一个功能强大的量子化学综合软件包。其可执行程序可在不同型号的大型计算机,超级计算机,工作站和个人计算机上运行,并相应有不同的版本。高斯功能:过渡态能量和结构、键和反应能量、分子轨道、原子电荷和电势、振动频率、红外和拉曼光谱、核磁性质、极化率和超极化率、热力学性质、反应路径,计算可以对体系的基态或激发态执行。可以预测周期体系的能量,结构和分子轨道。因此,Gaussian可以作为功能强大的工具,用于研究许多化学领域的课题,例如取代基的影响,化学反应机理,势能曲面和激发能等等。

1.2.3 HyperChem④

HyperChem是一款以高质量,灵活易操作而闻名的分子模拟软件。通过利用3D 对量子化学计算,分子力学及动力学进行模拟动画,HyperChem 为提供比其它Windows 软件更多的模拟工具。

1.2.4 SPSS⑤

SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件,现在由IBM公司开发。应用于自然科学、技术科学、社会科学的各个领域。SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全,是世界上应用最广泛的专业统计软件。

二、实验步骤

2.1 分子结构优化

用ChemDraw画出分子结构图。

在Chem3D中先对分子进行MM2-Minimize Energy能量最小化处理;然后对各个可转动化学键进行Dihedral Driver-Single Angle Plot转动,选取能量最低点;接着进行MM2-Molecular Dynamisc动力学模拟;重复以上操作至分子能量最低,以获得分子的稳定的三维结构。

2.2 Gaussian运算

优化完成后,在Chem3D的Calculations-Gaussian Interface 选项中进行Minimize (Energy&Geometry)运算。在确认运算正常结束后,可进行下一步的提取电荷,前线轨道能量的参数。

本文选取Molecular Volume、链接取代基的原子的电荷和、取代基第一个原子电荷和、取代基总电荷、HOMO、次HOMO、LOMO、次LOMO以及HOMO-LOMO等9个数据为描述子,如图2-2-1所示:

2.3 其他描述子的运算

用Chem3D中的Calculations-Compute Properties、HyperChem等计算出其他相关参数共24个。包括:Mol Refractivity、Partition Coefficient、Balaban Index、Cluster Count、Molecular Topological Index 、Num Rotatable Bonds、Polar Surface Area、Angstroms Squared、Radius、Shape Attribute、Shape Coefficient、Sum Of Degrees、Sum Of Valence Degrees、Topological Diameter、Total Connectivity、Total Valence Connectivity、Wiener Index、Approx、Grid、Volume、Hydration Energy、Log P、Relractivity、Polarizability、Mass。

2.4 数据的初步整理

将以上运算所得的33个参数进行整理,并将所获得的参数整理制作成Excell表格。

三、实验数据的处理

3.1 用SPSS进行相关性分析

将整理好的34个描述子导入SPSS,计算它们之间的相关性。

将分析结果中相关性的绝对值大于0.8的两个描述子保留一个,以此对34个描述子进行取舍,共舍去Mol Refractivity、Cluster Count、Molecular Topological Index等17个描述子。得到不显著相关的描述子17个,如图3-1-1所示:

图3-1-1

3.2 用逐步回归(stepwise)进行变量选择

选取因变量为IC50(即VAR00001),其余16个描述子为自变量,用逐步回归法进行运算,适当调整F值。当F值进入2.25,删除2.00时,得到3个描述子,如表3-2-1所示:

表3-2-1

选择Model 3作为本论文的构建模型,该模型的R²如表3-2-2所示:

表3-2-2

R²>0.5,具有一定的预测性,可以建模。

表3-2-3F=9.2

线性方程的常数如表3-2-4所示:

表3-2-4

得逐步回归模型的方程为:

IC50=4.857*VAR00017-(7.348E-5)* VAR00013 -2327.850* VAR00008-248.571 (1)

n=19,R²=0.590,F=9.2

VAR00008即LOMO

VAR00013即Balaban Index

VAR00017即Polar Surface Area

3.3 留一法交叉验证

对建立的线性模型进行留一法交叉验证。新建一个SPSS文件,将每个化合物的IC50和前面得到的模型的三个描述子导入。依次删掉每一个化合物的相关数据,用剩下的化合物的数据建立linear的模型,得到新的4个常数,得到一个心得一元线性方程。将删除的化合物的三个描述子的数值对应带入相应的新方程,得到一个预测IC5O值。如图3-3-1所示:

图3-3-1

图3-3-1中,BO为常数项,BI为LOMO的系数,B2为Balaban Index的系数,B3为Polar Surface Area的系数。

以交叉验证系数Q ²作为评价模型预测能力的标准。

其中yi:文献IC50值yi^:留一法算出值

计算得Q²=0.594076626>0.5,该模型建立完毕。

四、高活性化合物的设计与预测

根据所得模型,结合参考文献的数据,在图1-1-1所示化合物的基础上,修改R基,设计一个新的化合物。如图4-1所示:

图4-1

利用ChembioOffice、Gaussian软件计算得LOMO、Balaban Index、Polar Surface Area 三个描述子分别为-0.01518、8239、76.04,代人方程(1)计算得IC50=90.75076128(nM),可见预测设计的新化合物具有良好的活性。

五、结论

本文使用ChembioOffice、Gaussian 、HyperChem 、SPSS等软件,构建了19个化合物的模型,计算最低能量构象并进行几何优化。在优化好的结构的基础上,应用分子力学(MM2)、逐步回归法、留一法、建立了一个拟合质量较高,预测性较好的分子活性预测方程。

本文选用LOMO、Balaban Index、Polar Surface Area三个描述子,建立出具有良好预测性的线性模型,并根据该模型设计了一个具有良好活性的新化合物,结果令人满意。

六、参考文献:

①. Discovery of (2,4-Dihydroxy-5-isopropylphenyl)-[5-(4-methylpiperazin-1-ylmethyl)-

1,3-dihydroisoindol-2-yl]methanone (AT13387), a Novel Inhibitor of the Molecular Chaperone Hsp90 by Fragment Based Drug Design†;January 15, 2010

②.百度百科ChembioOffice词条http://baike.baidu.com/view/2669842.htm

③.百度百科Gaussian词条http://baike.baidu.com/view/10158.htm

④.百度百科HyperChem词条http://baike.baidu.com/view/1513785.htm

⑤.百度百科SPSS词条http://baike.baidu.com/view/130328.htm

文档

化学信息学论文

化合物的结构与活性关系的模型与预测08#############摘要:查阅一篇有机分子合成与生物活性测试方面的文献。本文使用ChembioOffice、Gaussian、HyperChem、SPSS等软件,构建文献中每个化合物模型,搜寻最低能量构象并进行几何优化。在优化好的结构的基础上计算描述子。利用逐步回归选择描述子,建立线性模型。根据模型,设计具有潜在高活性的新化合物,并预测其活性。关键词:活性;模型;线性一、实验准备1.1文献查找与化合物的确定查阅JournalofMedicinalCh
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top