2010,高通量测序技术日渐成熟
- 1 - 2010,高通量测序技术日渐成熟 测序在生命科学研究中一直发挥着重要作用。以Sanger 法(双脱氧核苷酸末端终止法)为代表的第一代测序技术帮助 人们完成了从噬菌体基因组到人类基因组图谱等大量测序工作,但由于其存在成本高、速度慢、通量低等不足,并不是后基 因组时代最理想的测序方法。 进入 21 世纪后,以 Roche 454、Illumina Solexa 和 ABI SOLiD 为代表的第二代测序技术诞生了,并迅速掀起了你追我赶 的技术比拼高潮。2010 年,Illunima 和 ABI 先后发布新款测序仪,改进了原有机型,测序通量不断提升,测序成本不断降 低,现在已经进入了数千美元测一个人全基因组的时代。 第二代测序技术进展 1. Roche 454 测序技术 454 公司可谓第二代测序技术的奠基者。2005 年底,454 公司推出了革命性的基于焦磷酸测序法的高通量基因组测序系 统--Genome Sequencer 20 System。这一技术的建立开创了边合成边测序(sequencing by synthesis)的先河,被 nature 杂志以 里程碑事件报道。之后,454 公司被罗氏诊断公司以 1.55 亿美元收购。一年后,他们又推出了性能更优的第二代基因组测序 系统--Genome Sequencer FLX System (GS FLX) 。2008 年 10 月,Roche 454 在不改变机器的情况下,推出了全新的测序试剂 --GS FLX Titanium,全面提升了测序的准确性、读长和测序通量。 目前,Roche 454 GS FLX Titanium 每次运行能产生 100 万条序列,平均读长能达到 400nt,且第 400 个碱基的准确率能 达到 99%。一次运行所需时间为 10 小时,能获得 4-6 亿个碱基的序列信息。 2. Illumina Solexa 测序技术 Illumina 公司的第二代测序仪最早由 Solexa 公司研发,利用其专利核心技术“DNA 簇“和“可逆性末端终结(reversible terminator)“,实现自动化样本制备和大规模并行测序。Illumina 公司于 2007 年初花费 6 亿美金巨资收购了 Solexa。2010 年初,Illumina 将其第二代测序仪 Genome Analyzer IIx 升级到 HiSeq 2000。 HiSeq 2000 含有两张 Flow cell,可同时运行或者只运行其中一张。读长为 100nt,同时支持 Fragment、Pair-end 和 Mate-Paired 文库。每次运行最多可产生 200 GB 的数据量(读长为 2x100nt) 。 Solexa 测序技术路线: 3. ABI SOLiD 测序技术 过去 20 年,美国应用生物系统公司(ABI)在一代测序方面一直占据着垄断地位。第二代测序技术出现以来, ABI 公 司不甘落后,迅速赶上,于 2007 年底推出了 SOLiD 第二代测序平台。2010 年末又发布了最新产品--SOLiD 5500 xl 测序平 台。从 SOLiD 到如今的 SOLiD 5500 xl,短短三年时间,连升五级,发展速度惊人。 SOLiD 全称为 Supported Oligo Ligation Detetion, 它的独特之处在于它以四色荧光标记寡核苷酸的连续连接反应为基础, 而没有采用传统的边合成边测序技术。连接反应没有 DNA 聚合酶合成过程中常有的错配问题,而 SOLiD 特有的“双色球编 码技术“又提供了一个纠错机制,这样设计上的优势使得SOLiD 在系统准确性上大大领先于其它平台。 目前最新款 SOLiD 5500 xl 含有两张微流体芯片(microfluidic FlowChip) ,每张芯片含有 6 条相互独立的运行通道(run lane) 。 每条 lane 都能运行相对独立的测序反应, 这样的设计使得 SOLiD 5500 xl 测序平台极具灵活性。 最大测序读长为 75nt, 同样支持 Fragment、Pair-end 和 Mate-Paired 文库。单次运行能得到的最大数据量为 300Gb(使用最新设计的 nanobeads) 。 测序的系统准确性能达到 99.99%。 SOLiD 测序技术路线: - 2 - 第二代测序技术的应用 技术推进科学研究的发展。 随着第二代测序技术的迅猛发展, 科学界也开始越来越多地应用第二代测序技术来解决生物 学问题。比如在基因组水平上对还没有参考序列的物种进行重头测序(de novo sequencing) ,获得该物种的参考序列,为后 续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing) ,在全基因组水平上扫描并检测突 变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序(whole transcriptome resequencing) ,从而开展可变 剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子 RNA 测序(small RNA sequencing) ,通过分离特定大小 的 RNA 分子进行测序,从而发现新的 microRNA 分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化 DNA 免 疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的 DNA 区域和基因组上的甲基化位点。 这边需要特别指出的是第二代测序结合微阵列技术而衍生出来的应用--目标序列捕获测序技术 (Targeted Resequencing) 。 这项技术首先利用微阵列技术合成大量寡核苷酸探针,这些寡核苷酸探针能够与基因组上的特定区域互补结合,从而富集到 特定区段,然后用第二代测序技术对这些区段进行测序。目前提供序列捕获的厂家有 Agilent 和 Nimblegen ,应用最多的是 人全外显子组捕获测序。科学家们目前认为外显子组测序比全基因组重测序更有优势,不仅仅是费用较低,更是因为外显子 组测序的数据分析计算量较小,与生物学表型结合更为直接。 目前,外显子组测序开始广泛应用于寻找疾病的候选基因上。内梅亨大学的研究人员使用这种方法鉴定出 Schinzel-Giedion 综合征中的致病突变,Schinzel-Giedion 综合征是一种导致严重的智力缺陷、肿瘤高发以及多种先天性畸形 的罕见病。他们使用 Agilent SureSelect 序列捕获和 SOLiD 对四位患者的外显子组进行测序,平均覆盖度为 43 倍,读长为 50 nt,每个个体产生了 2.7-3 GB 可作图的序列数据。他们聚焦于全部四位患者都携带变异体的 12 个基因,最终将候选基因 缩小至 1 个。而贝勒医学院基因组测序中心也计划对 15 种以上疾病进行研究,包括脑癌、肝癌、胰腺癌、结肠癌、卵巢癌、 膀胱癌、心脏病、糖尿病、自闭症以及其他遗传疾病,以更好地理解致病突变以及突变对疾病的影响。前不久刚刚结束的 Science杂志年度十大科学突破评选中,外显子组测序名列其中。 以上我们盘点了 2010 年第二代测序技术的最新进展和相关应用。但是