纳米孔直接RNA技术测序人类poly(A)转录组
以下内容转载自Nanopore官方公众号
由美国圣克鲁兹大学的Mark Akeson博士和约翰霍普金斯大学的Winston Timp博士领导的团队,使用Oxford Nanopore的直接RNA测序技术,在人类B淋巴细胞系GM12878上测序并分析了人poly(A)转录组,证明长读长天然RNA序列能够挖掘和鉴定那些使用短cDNA序列方法无法观察到的poly(A) RNA分子。该研究发表在了今年11月8日的Nature Methods杂志。
作者首先从人类B淋巴细胞系GM12878分离并测序了原始poly(A) RNA,同时使用相同的GM12878 RNA样本进行纳米孔cDNA测序,获得的结果用于下游分析(图1)。来自两大洲6所不同的研究机构进行了共30次纳米孔测序运行(每家5次),生成通过质控的总poly(A) RNA序列约1千万条,读长N50长度约1334bp。

图1. Nanopore 天然 poly(A) RNA测序流程(图片来自于原文doi: 10.1038/s41592-019-0617-2)
检测和分析异构体
长纳米孔读长能够提高外显子-外显子衔接区域的分辨率,从而挖掘未注释的RNA异构体。使用长读长天然RNA测序,结合FLAIR 工具,在代表10,793个基因的33,984个异构体中,发现52.6%未经注释的剪接连接点,识别出了上千个目前在GENCODE v27中未经注释的基因(已经包含在v32版中)。
长读长可展示转录本的全貌,甚至包括等位基因特异性异构体。例如,在基因IFIH1中,父本的异构体保留了8号外显子,而该外显子在母本的异构体并未保留。在该转录本中,用于等位基因分配的最近的SNV距离选择性剪接事件886nt (图2)。作者表示,使用短读长测序则无法检测到。
尽管已经有多种技术被用来检测等位基因特异性表达(ASE),但是,利用短读长平台进行的ASE识别有限,这是因为杂合变体在任何给定的几百个核苷酸的窗口内很少见。纳米孔测序具有长读长的优势,作者证明了纳米孔测序可以用于研究等位基因特异性异构体,尤其是当剪接变体在常规短读长测序范围内没有杂合变体的情况下。

图2. IFIH1等位基因特异性异构体(图片来源于原文)
3‘ poly(A) 分析
poly(A)尾转录本被认为在转录后调控中起到重要作用,包括mRNA稳定性和翻译效率。这些均聚物可以长达数百个核苷酸,单独使用短读长合成测序法的数据很难进行测量。在直接RNA测序的实验方案,使用与每个poly(A)链的3'端相关联的低方差(Low Variance)离子电流信号,结合短读长数据,研究团队直接测量了poly(A)尾,并开发了一种名为nanopolish-polya的计算方法来估量poly(A)尾长。
这种新的方法能够估算每个读长序列的poly(A)尾长,甚至能够发现异构体间poly(A)尾的区别。例如,研究人员留意到在一些内含子保留的异构体中,其poly(A)尾长度有所增加。在DDX5的两个GENCODE异构体中,作者注意到了一个内含子保留异构体poly(A)尾长中位数为327nt,而一个蛋白质编码异构体poly(A)尾长中位数为125 nt (图3)。
作者表示,使用nanopolish-polya估算纳米孔测序poly(A)尾长的方法,同时兼有直接测量长度以及保留每个转录本中异构体和修饰状态信息的优势。

图3. DDX5基因两个异构体的poly(A)尾长分布(图片取自于原文)
检测修饰碱基
纳米孔测序已经被用于鉴定DNA和RNA中的碱基修饰。N6-甲基腺嘌呤(m6A)是mRNA最常见的内部修饰,并与RNA代谢的许多方面有关。m6A失调还被发现与肥胖和癌症等人类疾病有关。
由于纳米孔测序可以直接对RNA分子进行观察,作者得以探索RNA修饰对电流信号的影响,以确定相同基因的异构体之间的m6A修饰是否有所不同。研究人员筛选了GENCODE敏感亚型的离子电流在GGACU模体(motif)上的改变,发现了86个基因(198个异构体) 的电流变化可以归因于异构体特异性m6A修饰 (以SNHG8为例,如图4所示)。

图4. SNHG8基因异构体内GGACU motif的离子电流分布(图片取自于原文)
作者表示,其他可用于分析RNA修饰的高通量方法通常需要进行富集,从而限制了量化分析;并且这些方法通常是基于短读长分析,去除了修饰之间、以及修饰与其他RNA之间特征,如剪接和poly(A)尾长。鉴于最近关于RNA修饰、剪接调控和转录之间联系的研究,能够具备检测这些远程相互作用的能力十分重要。