當前位置:股票大全官網 - 基金投資 - 易基因|全基因組DNA甲基化測序分析全流程

易基因|全基因組DNA甲基化測序分析全流程

全基因組DNA甲基化實驗怎麽做?從技術原理、建庫測序流程、信息分析流程和研究套路等四方面詳細介紹。

表觀修飾不需要改變 DNA 序列便能實現對性狀的改變,表觀修飾的改變與基因功能乃至細胞狀態、發育、衰老、疾病等存在重要的關聯。在眾多的表觀遺傳修飾中,最為重要且研究最為廣泛的修飾之壹是 DNA 甲基化,而全基因組甲基化測序(WGBS-seq)無疑是最有效的研究手段。

全基因組甲基化測序利用重亞硫酸鹽能夠將未甲基化的胞嘧啶(C)轉化為胸腺嘧啶 (T)的特性,將基因組用重亞硫酸鹽處理後測序,即可根據單個 C 位點上未轉化為 C 未轉化為 T 的 reads 數目與所有覆蓋的 reads 數目的比例,計算得到甲基化率。該技術對於全面研究胚胎發育、衰老機制、疾病發生發展的表觀遺傳機制,以及篩選疾病相關的表觀遺傳學標記位點具有重要的應用價值。

全基因組甲基化測序原理示意圖入下:

樣品檢測——樣品打斷 ——文庫構建——BS處理——文庫質檢

(壹)樣品檢測

對DNA樣品的檢測主要包括2種方法:

(1)瓊脂糖凝膠電泳分析DNA降解程度以及是否有汙染,檢測具有明顯的主帶,且條帶清晰;

Qubit 2.0對DNA濃度進行精確定量,DNA檢測總量不低於1ug。

(二)文庫構建

樣本檢測合格後,使用Bioruptor系統將1?g樣品基因組DNA與未甲基化的lambda DNA混合,然後將其片段化,平均大小約為250bp。片段化後,純化的隨機片段化DNA隨後用T4 DNA聚合酶,Klenow片段和T4多核苷酸激酶的混合物進行修復,鈍化和磷酸化末端。隨後使用Klenow片段(3'-5'exo-)對鈍的DNA片段進行3'腺苷酸化,然後與連接5'-甲基胞嘧啶而不是使用T4 DNA連接酶的胞嘧啶連接的銜接子進行連接。完成每個步驟後,使用磁珠純化DNA。之後,根據說明使用ZYMO EZ DNA甲基化金試劑盒將未甲基化的胞嘧啶轉化為尿嘧啶。最後,用JumpStart Taq DNA聚合酶進行PCR擴增,再使用磁珠對PCR產物進行純化獲得最終文庫。

(三)文庫質檢

文庫構建完成後,先使用Qubit2.0進行初步定量,稀釋文庫至1ng/ul,隨後使用Agilent 2100對文庫的insert size進行檢測,insert size符合預期後,使用qPCR方法對文庫的有效濃度進行準確定量(文庫有效濃度> 2nM),以保證文庫質量。

(四)上機測序

文庫檢測合格後,把不同文庫按照有效濃度及目標下機數據量的需求pooling後在illumina Nova平臺測序,測序策略為PE150。

(壹)原始下機數據質控

原始下機數據為FASTQ格式,是高通量測序的標準格式。FASTQ文件每四行為壹個單位,包含壹條測序序列(read)的信息。該單位第壹行為read的ID,壹般以@符號開頭;第二行為測序的序列,也就是reads的序列;第三行壹般是壹個+號,或者與第壹行的信息相同;第四行是堿基質量值,是對第二行序列的堿基的準確性的描述,壹個堿基會對應壹個堿基質量值,所以這壹行和第二行的長度相同。以下為壹條read信息的示例:

原始下機數據包含建庫時引進的接頭序列以及質量過低的堿基,這些因素會導致後續比對到基因組的reads較少,從而導致得到的信息較少,因此需要進行過濾。利用trim_galore軟件對原始數據進行去除接頭序列及低質量堿基等質控步驟。

(二)序列比對

經過質控的reads需要根據與參考基因組的序列相似度比對到參考基因組上。相比於常規基因組及轉錄組測序,WGBS測序方法產生的數據的特點決定其在比對時存在三大困難:

(1)DNA片段正鏈和負鏈經過重亞硫酸鹽轉化後將不再反向互補,再經過PCR,便會產生四條不同的序列,這將大大增加比對時的計算量。

(2)經過重亞硫酸鹽轉化後,DNA序列大部分C堿基被轉化成T堿基,因此序列含大量T而缺乏C;經過PCR後,產生的互補鏈則含有大量A而缺乏G。這樣便導致序列的復雜度降低(即序列的組成特征更單壹),從而增加比對的難度。

(3)C和T的比對是不對稱的。經過重亞硫酸鹽轉化後,序列中非甲基化的C堿基(占大部分)被轉化為T,這將導致測序序列與參考基因組不匹配,T既可能應該比對到T上,有可能應該比對到C上;而C則只能比對到C上。這也增加了比對的難度。

利用BSMAP軟件進行比對。BSMAP進行比對時,先以參考基因組上C堿基的位置作為指導,將reads中對應參考基因組C堿基位置的T標記為C,其他T保持不變,從而使reads可以直接比對到參考基因組。

(三)甲基化水平計算

甲基化水平可根據未轉化為 T 的 C 與轉化為 T 的 C 的 reads 的比例計算得到,即:

Beta-value = C-reads / (C-reads + T-reads) * 100%

其中,Beta-value 即為該胞嘧啶的甲基化水平,C-reads 為覆蓋該位點的支持甲基化的reads 數目(測得該位點為 C 的 reads),T-reads 為覆蓋該位點的不支持甲基化的 reads 數目(測得該位點為 T 的 reads)。 計算原理示意圖如下:

利用BSMAP統計甲基化水平。

(四)差異甲基化區域(DMR)鑒定及統計

DMR檢測使用權威期刊發表的metilene軟件。該軟件先將基因組進行預分段,以排除較長序列中不包含CG位點的片段。隨後,利用二元分隔算法,遞歸縮小檢測範圍,以搜索得到組間累積平均甲基化差異最大的區域,作為可能的DMR;最後,結合雙重統計學檢驗(MWU-test和2D KS-test),得到準確的DMR。檢測原理如下圖所示:

本分析檢測DMR的標準如下:

(1)區域平均甲基化差異不小於0.1;

(2)CpG位點數不少於5個;

(3)區域長度不小於50 bp;

(4)甲基化水平差異統計檢驗的校正P值小於0.05;

(5)2D KS-test檢驗P值小於0.05。

(五)信息分析流程示意圖

DNA甲基化組學研究的核心內容在於對DNA甲基化數據的挖掘。DNA甲基化壹般遵循三個步驟進行數據挖掘。

首先,進行整體全基因組甲基化變化的分析,包括平均甲基化水平變化、甲基化水平分布變化、降維分析、聚類分析、相關性分析等。

其次,進行甲基化差異水平分析,篩選具體差異基因,包括DMC/DMR/DMG鑒定、DMC/DMR在基因組元件上的分布、DMC/DMR的TF結合分析、時序甲基化數據的分析策略、DMG的功能分析等。

最後,將甲基化組學&轉錄組學關聯分析,包括Meta genes整體關聯、DMG-DEG對應關聯、網絡關聯等。

Whole-Genome Bisulfite Sequencing of Two Distinct Interconvertible DNA Methylomes of Mouse Embryonic Stem Cells. 兩種狀態的小鼠胚胎幹細胞的甲基化組學研究

1、背景

小鼠胚胎幹細胞壹般生長在含有血清的基質中,被稱作血清幹細胞(serum ESCs);加兩種激酶抑制因子使胚胎幹細胞在無血清的情況下更能保持多能性的基態,這種幹細胞稱為2i幹細胞(2i ESCs);這兩種狀態的胚胎幹細胞可以互相轉化。以前這方面的甲基化研究大多基於質譜,覆蓋度和研究結果有限,尚缺乏2i胚胎幹細胞的甲基化組學研究。

2、方法

利用全基因組重亞硫酸鹽甲基化測序(WGBS),對這兩種可互相轉換的小鼠胚胎幹細胞進行甲基化組學研究

3、結論

全面準確的檢測了兩種小鼠胚胎幹細胞的DNA甲基化修飾並進行了系統的比較;同serum ESCs相比,雄性2iESCs全局低甲基化;在血清中,雌性ESCs跟雄性2i ESCs類似呈現全局低甲基化,而在2i ESCs狀態下,甲基化水平會進壹步降低。

以上就是關於全基因組甲基化測序實驗流程和分析思路的介紹。

參考文獻:

[1] Ashburner, M. and C. A. Ball, et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet, 2000, 25 (1): 25-9.

[2] Dirk Schübeler. Function and information content of DNA methylation. Nature, 2015, 517: 321–326.

[3] Frank Jühling et al. metilene: Fast and sensitive calling of differentially methylated regions from bisulfite sequencing data. Genome Research, 2016, 26: 256-262.

[4] Kanehisa M, Goto S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic acids research, 2000,28(1): 27-30.

[5] Tadafumi Kato Kazuya Iwamoto. Comprehensive DNA methylation and hydroxymethylation analysis in the human brain and its implication in mental disorders. Neuropharmacology, 2014, 80: 133-139.

[6] Xiaojing Yang et al. Gene Body Methylation Can Alter Gene Expression and Is a Therapeutic Target in Cancer. Cancer Cell 26, 577–590.

[7] Yuanxin Xi et al. BSMAP: whole genome bisulfite sequence MAPping program. BMC Bioinformatics, 2009, 10:232.

[8] Gao F, et al. De novo DNA methylation during monkey pre-implantation embryogenesis. Cell Res. 2017 Apr;27(4):526-539. pii: cr201725.