作者:Chris Tachibana / 文 高大海 姜天海 / 译 来源: 发布时间:2015-11-30 14:15:26
转录组今日:微阵列、RNA测序的技术革命

 
当Paul McGettigan需要分析一批母牛子宫样品的特性时,他从转录组学(一种RNA水平的样品分析)开始入手。McGettigan是爱尔兰都柏林大学农业和食品科学院的研究员,从事牛类的生殖生物学研究,他的项目以对表达基因的概述为起点,用来指导蛋白质组、代谢组和其他方法的后续分析。“转录组学是开始着手时信息量最大的试验方式。”他说。
 
转录组方法如今非常简单,价格低廉,速度快,足以成为一个项目的起点,而非最终目标。RNA分析早先曾被限制,用于通过Northern杂交和定量PCR的方法来检测单个转录本。随着微阵列技术的发展,高通量转录组学成为现实,它可以通过在微芯片上进行探针杂交的方法检测样品中的核苷酸。微阵列尤其适用于分析大量的哺乳动物转录组,例如,在药物研发和临床研究中就需要快速评估成千上万份样本中的特定基因。然而,微阵列只能检测已知序列,因此它们无法用于探索发现。背景杂交和探针饱和性会干扰低水平和高水平检测。尽管微阵列技术也在继续发展,但RNA测序技术的进步使得转录组学在过去几年中得到了迅猛的发展。
 
“对我们而言,RNA测序几乎完全取代了微阵列。”宾夕法尼亚州立大学基因组学平台表达分析部负责人Craig Praul说。“在我们最高峰的10~15年前,我们每年要做500例以上的阵列分析。而去年我们仅做了30例。”由于微阵列的使用降低,让基金评审人认为RNA测序技术更加前沿,Praul说。
 
驱动RNA测序:下一代测序技术
 
下一代测序技术(NGS)使得RNA测序的使用得到了爆发性增长,NGS在一台仪器上一天内可以读取数以十亿计的碱基。大多数NGS测序仪都采用一种经典方法,那就是通过检测在复制过程中由DNA聚合酶所加入的碱基来读取DNA。对于RNA测序而言,典型的流程第一步是从样品中提取总RNA,然后去除大量的核糖体RNA。接下来的步骤确定用于分析的RNA类型。
 
RNA测序可以定量和定性研究包括信使RNA(mRNA)、微小RNA、小干扰RNA和长非编码RNA在内的任意RNA类型。RNA测序能够分析不同的RNA亚型,也就是转录自同一基因但具有不同结构的转录本(例如由于可变剪接),这种方法可以解释有限的基因组如何产生复杂的表型。RNA测序让科学家能够研究特殊模式的有机体,利用该方法可以对有机体进行无参考基因组的从头转录组拼接。然而,大多数研究者还是比较关注在实验样品与对照组的蛋白编码mRNA水平上的差异基因表达(DGE)变化。
 
最常用的DGE方法采用了Illumina公司的NGS系统。在RNA样品中,mRNA由它所具有的多聚腺苷酸尾筛选出来,随后进行片段化以适合可以产生成百上千的碱基“短序列读取”的Illumina测序。mRNA随后被反转录成用于测序的互补DNA(cDNA)文库。序列读取随后将被计数并映射到参考转录组上。
 
RNA-seq的测序部分简单明了,全球NGS市场占有量超过70%的Illumina公司杰出科学家Gary Schroth说。如今对于研究者而言,他说,主要的“痛点”在于上游的样品制备和下游的数据分析。为了优化测序前的步骤,Illumina提供一种自动化的NeoPrep系统。“用户将纯化好的总RNA放入一个模块中。”Schroth解释道,“就能得到具有一致浓度的量化和标准化文库,已经准备好可以用在测序仪上。” Schroth说,当前已有的NeoPrep模块能够为DGE制备mRNA,是目前最流行的工作流程。他接着说,NeoPrep降低了用户间的可变性,而且将手动文库制备时间由数小时缩短到约30分钟。对于下游分析,Illumina提供基于云计算的BaseSpace计算平台。BaseSpace汇集了由公司和用户生成分享的众多应用,用于阅读序列注释或从头转录组拼接等任务。
 
Illumina用于DGE的RNA测序如此普遍,以至于Schroth认为DGE和转录组是不同的领域。Schroth说,大多数RNA测序研究要找mRNA的差异表达,这是DGE。那么,研究RNA中99%的不编码蛋白的部分呢?Schroth说,“我认为这属于转录组”。
 
RNA测序的挑战与解决方案
 
随着RNA测序数据的不断积累和研究人员间对比结果,标准化开始成为一大问题。为了评估不同实验室的RNA测序性能,美国食品药品监督管理局(FDA)组织了一项国际测序质量控制(SEQC)计划。该研究结果证实了RNA测序在DGE和亚型发现中的多功能性。同时,调查结果也为数据解释提供了指导标准,例如在将RNA测序用于绝对定量时要保持慎重(http://bit.ly/1HtRo9U)。
 
RNA测序数据的下游计算分析仍旧很复杂,这是由于这种方法会产生惊人的数据量。然而,McGettigan表示,近几年来计算机的发展已经将数据处理过程从数小时减少到几分钟。除了商业化程序之外,研究人员也可以在数据密集型生物医学分析工具的网络平台——galaxyproject.org上,找到社群开发的免费软件。McGettigan同时推荐了一个讨论论坛SEQanswers(http://seqanswers.com)。
 
短序列RNA测序的测序后分析也由于一个测序前步骤而变得复杂:RNA片段化。“这些序列读取未必能够告诉你全长的RNA是什么样子。”Praul说,“不是每一次都能把摔得粉碎的蛋先生(Humpty Dumpty)拼回原形。”他说,大多数科学家并不担心这一点。“他们只是想在使用其他生化或分子技术进行深入研究前有一个全面的概念,可以是在他们的样品中激活的通路或者是特定基因的转录本数量。”
 
但是使用这一方法的科学家也失去了关键的数据,太平洋生物科学公司首席科学家Jonas Korlach说。“只看到短序列却丢掉了整体。”他说,“这就像只见树木不见森林。” 太平洋生物的NGS测序仪能从头到尾读取未片段化的cDNA,产生超过20kb的长读取序列。太平洋生物的RNA测序流程并不包括片段化过程,也就无需将短序列重新拼接成完整RNA的繁琐步骤。因此,太平洋生物的仪器成为了进行从头转录组拼接和研究RNA亚型的一大选择。
 
太平洋生物的测序仪在DGE方面的使用率比不上Illumina或是赛默飞世尔科技的Ion Torrent系统,部分原因在于它们的序列读取数量过少。但是Korlach指出,太平洋生物的SMRT Cell系统能够为基因或基因家族的靶向研究提供足够的序列读取。Korlach说,区别在于,长的序列读取能够揭示转录本的结构。
 
作为亚型的一个能力,Korlach介绍了加州大学戴维斯分校的一项研究案例,关于与脆性X染色体综合征相关的FMR1基因。通过使用太平洋生物的RNA测序,发现了16个不同的FMR1 RNA亚型,并且显示出某些亚型与具有脆性X疾病风险的“前突变携带者”相关联。Korlach表示,太平洋生物的转录组测序也具有其他的临床应用。由于cDNA的读取比较完整,该系统能够区分基因中表现单个突变或多个突变的RNA。这对于监测癌症患者对于靶向治疗的耐受性来说十分关键。
 
临床应用推动发展
 
RNA作为疾病和治疗标记的临床潜力,激起了RNA分析方法研究的热潮。Cofactor基因组公司是RNA测序的合作研究机构和服务提供商,该公司首席执行官Jarrett Glasscock证实了产业界对RNA的强烈兴趣。尽管Cofactor有很多政府和学术界的客户,Glasscock说,“我们的工作约80%都是在与大型制药企业打交道。”这些工作聚焦在RNA测序的临床应用上。首席科学家Armstrong说,“我们的企业合作伙伴,他们的主要兴趣在于使用编码RNA的表达去鉴定药物靶标、疾病的生物标记物,以及最近兴起的对于药物的良性或不良反应。”
 
但RNA测序的用处如此之多,因此也被用于探索和开发性工作。例如,Cofactor正在开发一种用于分析环状RNA(可能发挥微小RNA的调控子功能)的试剂盒。Armstrong说,“由于微小RNA调控基因表达,环状RNA似乎成为调控子的调控子进行额外的控制。”
 
转录组对基础和应用研究的另一个潜在的贡献是“整合组学”——结合了基因组、表观基因组、转录组、蛋白组和代谢组的数据。转录组科学家研究的是DNA和蛋白质间的中心法则的步骤,将其置于承上启下的绝佳位置。Cofactor公司的工作包括整合转录组和基因组。Glasscock表示:“RNA表达位于DNA变化的下游,我们正在利用这一事实。将RNA数据整合进一项研究,可以强有力地将所关注的DNA的变化缩小到很少一部分的候选者中。”
 
超越RNA测序
 
转录组系统一直在不断地升级,这也是为何大多数实验室不会自己花钱购买仪器,而是使用研究所的共享服务或大型服务提供商(例如布罗德研究所)。此外,数十种新的方法也逐渐涌现出来,对微阵列和RNA测序进行互补、完善甚至替代。
 
例如,牛津纳米孔技术公司刚刚发布了一款便携式的MinION USB纳米孔测序仪,目前仅对MinION获取项目开放。纳米孔测序技术并不依赖于DNA复制。反而,随着核酸链线性穿过蛋白或合成微孔,穿过微孔的离子电流中基于碱基的变化就会对序列进行检测。“纳米孔测序的优势在于可以实时读取全长分子。”牛津纳米孔技术公司首席技术官Clive Brown说,“我相信这是唯一能够直接测量分子的技术。”这也意味着该方法可以直接测序RNA,无须转换为cDNA。Brown说,目前科学家正试着用MinION分析cDNA,并在向直接对RNA进行测序的方向努力。
 
正如Brown所说,直接的RNA测序十分复杂,因为“RNA中包含大量异常碱基”。RNA被甲基化和很多其他表观遗传标签大幅修饰,因此目前牛津纳米孔的RNA测序流程是读取具有配对cDNA的mRNA。cDNA能够给出正确的序列,而mRNA则能够显示出潜在被修饰的碱基。由于RNA修饰的类型和功能大都不为人所知,因此纳米孔测序能够激发出这一未知领域的研究火花。Brown表示,牛津纳米孔正在努力构建一个新系统,能够提供RNA数目、序列和转录后修饰。“我们仍然不清楚什么信号能够指明何种修饰。”他说,“但是一旦我们建立了信号意义的模型,就将能直接读取RNA序列和修饰。”
 
其他非RNA测序的方法则回归到微阵列的原则:杂交。基于微球的试验(例如Luminex公司的系统)将微球粒子标记上荧光条形码和可以捕获特定转录本的探针。随后将微球与样品一起孵育(可以像细胞裂解一样容易),抓取RNA用于鉴定,并使用流式细胞仪计数。
 
NanoString系统在每个靶标转录本上杂交两个探针:一个生物素标记的捕获探针和一个荧光条形码标记的报告探针。报告探针与样品中的特定RNA杂交,而捕获探针通过抗生物素蛋白将它们锁定到静态表面。NanoString的nCounter分析系统使用条形码对固定的RNA进行计数。正如其他基于杂交的系统一样,NanoString也不适合于探索性工作。“NanoString是为靶向转录组学设计的。”该公司研发部高级副总裁Joe Beechem表示,“与NGS相比的优势在于不需要构建文库、不需要使用酶、不需要数据处理。你所做的任何一次数据处理都会带有你的偏好。”
 
Beechem说,由于NanoString方法并不要求聚合酶活性,因此可用于不太理想的条件,例如粗裂解液、等离子体或福尔马林固定—石蜡包埋(FFPE)的样品,这也是临床组织样品通常的贮存模式。“只要能够提取出100个核苷酸左右的RNA,我们就能处理损坏或者年代久远的样品。”Beechem说,“我们曾经对保存50年之久的石蜡样品进行转录组分析。”尽管NanoString主要聚焦于研发临床试验方法,Beechem说这一技术也可为研究独特生物的学者提供服务:“就像是胡萝卜、牡蛎等等。”如果你知道转录的序列,他说,该公司可以研发出测定的试验方法。
 
NanoString系统一个有趣的特性是它能够从杂合的样品中鉴定出RNA,甚至是包含来自不同物种的细胞的样品。Beechem说,只要设计出合适的探针,在一个样品上就可以研究转录水平的相互作用,如宿主与病原、宿主与微生物,或者是肿瘤细胞和反应的免疫细胞。Beechem说,NanoString也可以用于整合组学。通过与马萨诸塞州总医院的合作,NanoString在它们的RNA计数试验中加入了蛋白质计数的能力,用于一个样品的定量转录组和蛋白质组学研究。
 
其他RNA分析的进展还包括微流控方法的研发,为单细胞转录组分离细胞。空间分辨转录组学方法,能够确定组织样品或细胞中RNA的序列和位置。定位转录本可以通过标记探针的原位杂交,也可以通过对提取自一系列组织切片中的RNA进行RNA测序,甚至可以在固定细胞的样品中进行原位RNA测序。
 
RNA测序领域正在不断地创新发展。新的流程已经能够富集出低丰度mRNA,指向特定基因,或者选择核糖体来确保仅分析已经过翻译的RNA。使用RNA测序技术的探索正在结合用于全基因组水平表达谱分析的高分辨率微阵列定量技术。然而,目前最常用的RNA实验仍然是使用RNA测序技术进行靶向基因的DGE分析。Gary Schroth说,“它是如此简洁明了,如今,RNA测序与微阵列一样容易,但却能够产出更富含信息的数据。”■
 
(译者之一高大海系中国科学院海洋研究所助理研究员)
Chris Tachibana 是美国西雅图和丹麦哥本哈根的科学作家。
    DOI: 10.1126/science.opms.p1500095
    鸣谢:“原文由美国科学促进会(www.aaas.org)发布在2015 年7 月31 日《科学》杂志”。官方英文版请见 http://www.sciencemag.org/site/products/lst_20150731.xhtml。
 
《科学新闻》 (科学新闻2015年11月刊 科学·生命)
发E-mail给:      
| 打印 | 评论 |