功能基因组学中的蛋白质组学方法
的有关信息介绍如下:这篇文章介绍一下功能基因组学研究中涉及的蛋白质组学方法。
我们都知道蛋白质的基础特性包括了转录后修饰、本地化和功能,除研究单个蛋白质之外,对数千个蛋白质进行高通量分析也是有可能的。这样的方法主要有三种:(1)使用酵母双杂交系统和其他技术识别蛋白质间的成对作用;(2)使用亲和色谱法和质谱分析法识别包含一个或多个蛋白质的蛋白复合体;(3)分析蛋白质通路。尽管蛋白质研究在各种模型生物上已经非常深入,但对酿酒酵母的研究则更为先进。
研究基因表达时需要使用正向遗传学和逆向遗传学,相似的框架可以应用到蛋白质组学上。正向蛋白质组学方法与蛋白质表征的经典方法相对应。一个生物系统被选择,例如从有或没有疾病的个体中提取出的人类细胞。然后通过质谱分析法等技术对蛋白质进行比较,识别出差异调控的蛋白质,并且通过更深入的研究推断出这些蛋白质的功能和在疾病中的可能角色。在逆向蛋白质组学中,起点是基因组序列,从中推断出基因、RNA转录和蛋白质产物。cDNA被获取并在不同的系统中表达,以便在蛋白质间交互作用和其他行为中评估其功能。
正向蛋白质组学方法和逆向蛋白质组学方法都会被应用以发现蛋白质的功能,这会涉及高通量技术及大量样本或蛋白质的试验。例如,在正向蛋白质组学方法“等压线标定相对和绝对定量”中,对于四个感兴趣的蛋白质样本,每个样本中1000个蛋白质的身份和相对数量都能被精确测定。蛋白质微阵列,类似于DNA微阵列,由亲和试剂(如特定抗体)组成,这些试剂链接到一个固定载体上。由于固定化蛋白质的结构和功能难以维持,这一技术还未得到广泛使用。组织微阵列代表了另外一种高通量的方法,这种方法特别适合于分子病理性研究。一个组织微阵列通常包含几百或上千个组织样本,这些组织样本以有序的方式固定在阵列上。这些样本可以并行探索以检测和量化DNA、RNA和蛋白质目标。
蛋白质间的相互作用
从作为酶到充当结构体,蛋白质为眼花缭乱各种各样的功能负责。在功能基因组学研究领域内一个始终如一的主题是:绝大多数蛋白质在网络内执行功能,并与其他蛋白质和其他生物分子产生联系。作为辨别蛋白质功能的基础方法,蛋白质之间成对的相互作用可以被表征。蛋白质通常与高亲和度的伙伴相互作用,两个已纯化的蛋白质间的相互作用可以通过许多方法测度出来,如:
(1)免疫共沉淀法。这种方法使用针对感兴趣的蛋白质的特定抗体将该蛋白连同有关的结合蛋白沉淀到试管底部。
(2)亲和色谱法。这种方法利用设计好的cDNA结构,在GST或其他标签(如多组氨基酸)框架内编码感兴趣的蛋白质,将谷胱甘肽共价附着的树脂与GST融合蛋白孵育,它与任何结合伙伴一起结合到树脂上。不相关的蛋白质被洗去,然后特定结合复合体也被洗去,最后蛋白质内容被识别。
(3)化学物质交联或紫外线辐射。某个蛋白质被允许与其伙伴结合,然后交叉结合被应用,最后相互作用被识别出来。
(4)表面等离子体共振(GE医疗BIAcore技术)。这种方法将蛋白质固定在表面,并测量相互作用蛋白质的动力学结合特性。
(5)均衡透析和过滤结合测定。在这种方法中,结合配体和自由配体(即蛋白质有或没有相互作用的伙伴)被分离和测定。
(6)荧光共振能量转移。即两个标记蛋白共享一个紧密的物理相互作用后产生的共振能量后的特征性变化。
某些相互作用以成对的方式发生:例如,哺乳动物合素与合素融合蛋白1结合在一起。除了合素结合蛋白外,合素也是其他多种复合体的成员。又比如,syntaxin 1a,、synaptobrevin-2/VAMP-2和SNAP-25紧密地结合为一个复合体,即使是在使大多数蛋白质变性的聚丙烯酰胺凝胶电泳的恶劣条件下,也使得它们能够作为一个三聚体进行迁移。如果纯化的合素被固定在一个柱形体上,并与鼠脑的提取物进行混合,就很有可能形成两个或多个独立的复合物。发现基因的相互作用可以提供更多有关基因的信息,这些基因的产物在通路或并行的相关通路中发挥功能。基因相互作用的数据对于那些特定蛋白质直接相互作用或形成蛋白质复合物的蛋白质提供较少的信息,但是它们比蛋白质通路成员中蛋白质和蛋白质复合体的研究提供更多的信息。
酵母双杂交系统
酵母双杂交系统是一种识别蛋白质间相互作用的高通量方法。这种方式极度通用,已被用于识别许多物种的蛋白质结合伙伴。它基于这样一种事实:即酵母GAL4转录因子由两个相互独立的激活和结合域组成。编码感兴趣的蛋白质的cDNA被融合到GAL4 DNA结构域。大量的cDNAs(由各种猎物组成的库)被克隆到包含GAL4激活域的载体中。单独来说,GAL4 DNA结构域没有激活因子。但是当诱饵与cDNA文库表达的另一个融合基因表达时,这两种蛋白质的接近使得GAL4报告基因的转录成为可能。“双杂交”系统指的是两种重组蛋白,它们必须相互作用。
除了使用诱饵蛋白筛选库的策略外,酵母双杂交系统也被用于测度已知的诱饵蛋白与单个克隆的猎物蛋白之间的相互作用。通过这种方式,许多蛋白质间的相互作用被测度出来。与筛选库相比较,这种方法的优点在于系统地测试蛋白质间相互作用的可能矩阵,而其缺点在于不会发现在复杂cDNA库中可能发现的新的相互作用的伙伴。
酵母双杂交系统被用于分析酿酒酵母中所有可能的成对的蛋白质间的相互作用。2000年时有学者描述了涉及1004个酵母蛋白质的957个相互作用,同时有另外的学者确定了3278个蛋白质中的4549个相互作用,这些数据集对于识别蛋白质相互作用的可能通路非常有用。令人奇怪的是,仅仅20%的数据是重叠的。这些数据集之间缺乏调和或许要归因于在研究中生理条件的差异 ,或者是由于假阳性或假阴性的来源不同。其他高通量酵母双杂交试验已被应用到果蝇和其他生物体上。
这一试验策略需要一些假设,其中包括了假阳性结果和假阴性结果的原因。假阴性结果可能基于以下原因出现:
(1)被引入到酵母细胞的诱饵必须固定到细胞核上。如果诱饵以其原生位置为目标,这可以解释为什么某些先前已知的相互作用没有观察到。
(2)融合蛋白的结构不能干扰诱饵蛋白的功能。
(3)短暂的蛋白质相互作用可能被忽略。
(4)某些蛋白质复合物需要高度特殊的生理条件才能形成,因此可能会被忽略。某些相互作用可能在具有特定环境的酵母核中失去效果。
(5)对疏水蛋白和低分子量蛋白可能存在偏见。
假阳性结果也可能因种种原因而出现,某些蛋白质可能天生就对非特异性结合相互作用敏感。变性的蛋白质可以非特异性结合。一个诱饵蛋白可以自动激活一个 报告基因。仔细分析两个杂交结果能够减少假阳性和假阴性结果的来源,例如通过鉴定混杂的结合蛋白质。
有关酵母双杂交数据的信息可以通过数个数据库获取:酵母基因组数据库包含了与物理相互作用数据的链接,包含了来自双杂交筛选的相互作用。对Sec1p的搜索揭露了数个相互作用的伙伴,如Sso2p和Mso1p(当Mso1p作为一种互惠的诱饵使用时,它再次被发现与Sec1p结合);另外一个数据库是MPact数据集,一个来自MIPS的蛋白质相互作用和复合物数据库。这一数据库包括了手动收集的数据,这些数据整合了高通量结果的不同来源。它还包括了从文献中获取的蛋白质相互作用的数据。MPact允许HUPO PSI标准报告蛋白质间相互作用数据,对sec1的搜索表示了不同的遗传和物理相互作用。
蛋白质复合物:亲和色谱和质谱分析
亲和色谱法是一种技术,在这种技术中,配粒体(如蛋白质)以化学方法被固定在柱形物的矩阵上。酵母双杂交策略和亲和色谱法最主要的区别在于酵母双杂交系统仅仅用于检测蛋白质间的成对相互作用,而亲和色谱法能够分离和识别由许多蛋白质组成的亚基。
多个研究团队使用了一种在酿酒酵母中识别数千个多蛋白质复合物的策略,每个团队选择了大量包含标签的诱饵蛋白,这些标签允许诱饵引入到酵母中,在那里它们可以形成天然的复合物。在生理学相关条件下复合物形成后,诱饵被提取出来,复制相关的蛋白质。这些蛋白质复合物被一维的SDS-PAGE所分解。用剃刀从凝胶上切下成千上万个单个的蛋白质凝胶带,用胰蛋白酶进行消化并形成相对较小的蛋白质片段,并用MALDI-TOF质谱分析法进行识别。
采用这种策略,Gavin和同事获得了1167个酵母菌株表达蛋白,在这些蛋白质中,他们纯化了589个标签蛋白并识别了232个蛋白质复合体。其他的学者筛选了725个诱饵蛋白并且检测了成千上万个蛋白质的相互作用。在每个案例中,大量的蛋白质复合物被识别,其中包含了以前未知功能的蛋白质,突出了大规模方法的优势。Gavin等人还使用串联亲和纯化和质谱分析法创造了2000多个TAP融合蛋白质来执行更加综合化的筛选。在这些蛋白质中,88%与至少一个伙伴相互作用,并且每个细胞中所识别的结合伙伴的丰富度在32到50000个拷贝之间。Gavin等人发展了一种“社会亲和法”,用于测度观察到的两个蛋白质的时间数量的对数除以基于数据发生频率的预期期望次数。Krogan等人也TAP-MS并报告了涉及2700多个蛋白质的7000多种蛋白质间相互作用。采用聚类算法,他们定义了550多个蛋白质复合体中每个复合物平均4.9个子单元。有大量的复合物仅仅有几个成员,同时又有少数复合体有许多的成员。这些研究报告了许多的复合体,这些复合体都是在MIPS数据库中所缺乏的,并且他们还发现了之前鉴定的复合物的新成员。