
0 蛋白质性质和结构分析
序列相似的蛋白质具有相似的三维结构;不同蛋白质中相同的结构域(domain)具有相似的功能。
蛋白质性质和结构分析软件
ExPASy(http://www.expasy.org ),蛋白质序列、性质、结构分析,包含许多分析工具
CBS(http://www.cbs.dtu.dk/services/ )
ANTHEPROT(http://antheprot-pbil.ibcp.fr/ )
DNAMAN(http://www.lynnon.com/ )
1 蛋白质一级结构分析
氨基酸序列、等电点(pI)、分子量(molecular weight, Mw)、疏水性(hydrophobicity)、二硫键等
1)蛋白质氨基酸序列、pI、Mw
ExPASy主页,选择“resourcesA..Z”中的“ProParam”软件,输入序列分析。
其他预测工具:compute pI/Mw(http://web.expasy.org/compute_pi/ )
http://web.expasy.org/aacompsim/ )
2)蛋白质的疏水性
ExPASy主页,选择“resourcesA..Z”中的“ProtScal”软件,输入序列并选择分析方法分析。
Window size:9表示左右各有4个氨基酸对中间那个氨基酸的影响,每9个氨基酸进行分析,即1-9、2-10、2-11这样的框架分析。由此可知,1-4个氨基酸和最后4个氨基酸是无法分析的,因为无法组成9个进行分析。
蓝色的字体代表选择的分析方法,选择不同的分析方法,所得的氨基酸数值有所不同。不同氨基酸的疏水性不同,疏水性越强数值越大,疏水性越弱数字越小,甚至可能为负数(即亲水性很强)。
该图即代表不同氨基酸对应的疏水性分值,以0为界,大于0代表疏水性强,否则,亲水性强。可分析该序列疏水性区域或亲水性区域,或综合判断整个氨基酸倾向于亲水性或是疏水性。
3)蛋白质的模体(motifs),超二级结构,2个或3个具有二级结构的肽段相互靠近形成的区域。
ExPASy主页,选择“resourcesA..Z”中的“PROSITE”软件主页提交蛋白序列(可同时预测《10条序列),选择输出格式,分析结果
4)保守结构域,生物大分子所具有的特定结构
ExPASy主页,选择“resourcesA..Z”中的“PROSITE”软件主页输入序列,可使用缺省参数,或去掉选择框
其他预测蛋白质结构域工具:
PFAM(http://pfam.sanger.ac.uk/ )主页选择“SEQUENCE SEARCH”,输入序列分析。
NCBI Conserved Domains(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi )
SMART(http://smart.embl-heidelberg.de/ )
PredictProtein(https://www.predictprotein.org/ )
2 蛋白质的二级结构
主要是指氢键维持的结构,如α-螺旋(α-helix)、β-折叠(β-sheet)、转角(turn)、环(loop)、无规则卷(random coil)
ExPASy主页,选择“resourcesA..Z”中的“SOPMA”软件(在ANTHEPROT栏目中选择SOPMA)。
其他预测工具:COILS(http://embnet.vital-it.ch/software/COILS_form.html )
3 蛋白质的三级结构
通过已知蛋白质结构推测未知蛋白质结构:BLAST检索(PDB数据库中),检索同源蛋白质结构;
通过分子建模(molecular modeling)分析蛋白质结构:
ExPASy主页,选择“resourcesA..Z”中的“Phyre2”软件
(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index )
SWISS-MODEL Worspace(http://swissmodel.expasy.org/workspace/ )提供多种建模方式
4 膜蛋白
膜蛋白分为:
整合/跨膜蛋白(integal/trans-membrane),穿过膜结构或位于膜结构中,一般是α-螺旋
锚定蛋白(membrane-anchored),直接锚定在膜表面(有时通过糖分子与膜相连)
外周蛋白(peripheral),在膜周围,与跨膜蛋白结合一起起作用
1)预测整合蛋白的跨膜区
ExPASy主页,选择“resourcesA..Z”中的“SOSUI”分析
其中分V1.11(单个预测)和V1.10(betch批量预测)这2个版本
其他分析软件:
DAS:分析原核生物蛋白质的跨膜结构 (http://www.sbc.su.se/~miklos/DAS/maindas.html)
TMpred:分析蛋白质的跨膜结构和在膜上的方向
(http://www.ch.embnet.org/software/TMPRED_form.html)
HMMTOP: 分析蛋白质跨膜结构和方向(http://www.enzim.hu/hmmtop/html/submit.html)
TopPred: 分析细胞膜蛋白拓扑结构(http://mobyle.pasteur.fr/cgi-bin/portal.py?#forms::toppred)
TMHMM: 分析蛋白质跨膜结构(http://www.cbs.dtu.dk/services/TMHMM/)
2)分析锚定蛋白GPI位点
ExPASy主页,选择“resourcesA..Z”中的“big-PI”分析
其他分析软件:
For Plant Proteins(http://mendel.imp.ac.at/gpi/plant_server.html)
For Animals Protein http://mendel.imp.ac.at/gpi/gpi_server.html
For Fungal Proteins http://mendel.imp.ac.at/gpi/fungi_server.html
5 翻译后修饰
信号肽序列,20-35个氨基酸、富含疏水氨基酸、至少带有一个正电荷氨基酸。
1)信号肽及其剪切位点分析
ExPASy主页,选择“resourcesA..Z”中的“SignaIP”分析,选择参考物种和分析方法分析。
C score即cleave score,表示被切割的可能性,在20-30之间出现了波峰,说明在该区域切割的可能性最大。
S score即表示为信号肽的可能性,从1-20之前都很高,说明20之前肯定是信号肽,而20-30之间分值明显下降,说明信号肽在该区域结束。
Y score是C与S综合考虑结果。
最后一句话,做出结论:最可能的切割位点在22-23之间。说明信号肽长度为1-22氨基酸。
其他网站:
分析革兰氏阴性菌脂蛋白信号肽LipoP http://www.cbs.dtu.dk/services/LipoP/
分析植物叶绿体信号肽ChloroP http://www.cbs.dtu.dk/services/ChloroP/
Signal-3L http://www.csbio.sjtu.edu.cn/bioinf/Signal-3L/
PrediSi http://www.predisi.de/
Phobius http://phobius.sbc.su.se/
PEPLip http://gpcr.biocomp.unibo.it/cgi/predictors/spep/pred_spepcgi.cgi
2)糖链连接点分析
糖链连接分为:O-连接(氧连接) N-连接(氮连接)
ExPASy主页,选择“resourcesA..Z”中的“NetOGlyc”分析O-连接
其中I-score > 0.5 说明该位点可能为0-连接。
其他预测工具:
http://chemdata.shu.edu.cn/gal_p/
http://comp.chem.nottingham.ac.uk/cgi-bin/glyco/bin/getparams.cgi
http://bioinformatics.cau.edu.cn/zzd_lab/CKSAAP_OGlySite/index.html
http://turing.cs.iastate.edu/EnsembleGly/predict.html
ExPASy主页,选择“resourcesA..Z”中的“NetNGlyc”分析N-连接
其他预测工具:
http://www.oppf.ox.ac.uk/opal/OPAL.php
http://www.hiv.lanl.gov/content/sequence/GLYCOSITE/glycosite.html
6 蛋白质的亚细胞定位
了解蛋白质的功能及互作。
PSORT主页(http://www.psort.org),选择分类,物种。
Mito指在细胞器,cytoskelton细胞器,dual localization双定位,cyto_nucl两种细胞器均存在,后面跟的数字越大即代表可能性越高。如本图中,在细胞器可能性19,很大。
双定位(dual localization )
其他工具:
CELLO:http://cello.life.nctu.edu.tw/
Subnuclear Compartments Prediction System:
http://array.bioengr.uic.edu/subnuclear.htm
Proteome Analyst Specialized Subcellular Localization Server:
http://webdocs.cs.ualberta.ca/~bioinfo/PA/Sub/
Lokero/TargetLoc/SherLoc2/MultiLoc2/YLoc:
http://abi.inf.uni-tuebingen.de/Research/Systems%20Biology/protein-subcellular-localization
TargetP:http://www.cbs.dtu.dk/services/TargetP/
Predotar:https://urgi.versailles.inra.fr/predotar/predotar.html
Protein Prowler:http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
7 化学因子作用蛋白定位
ExPASy主页,选择“resourcesA..Z”中的“Peptide Cutter”分析
