當前位置:股票大全官網 - 財經新聞 - 如何繪制環境微生物群落熱圖

如何繪制環境微生物群落熱圖

稀釋曲線采用隨機采樣測序序列的方法,根據提取的序列數和它們所能代表的OTU數構建壹條曲線,即稀釋曲線。當曲線趨於平緩時,表明測序數據的數量是合理的,更多的數據對發現新OTU的邊際貢獻很小。相反,它表明繼續測序可能會產生更多的新OTU。橫軸:從樣本中隨機選擇的測序條帶的數量;“標簽0.03”表示分析基於0.03的OTU序列差異水平,即相似性水平為97%,客戶可以選擇其他不同的相似性水平。縱軸:根據測序文章的數量可以構建的otu的數量。曲線解讀:?圖1中的每條曲線代表壹個樣本,並用不同的顏色標記。?隨著測序深度的增加,OTU的數量增加。當曲線趨於平緩時,意味著此時的測序數據量是合理的。2.Shannon-Wiener曲線反映了樣品中微生物多樣性的指數,該曲線是利用每個樣品在不同測序深度下的微生物多樣性指數構建的,以反映每個樣品在不同測序量下的微生物多樣性。當曲線趨於平坦時,表明測序數據量足夠大,可以反映樣品中絕大多數微生物種類的信息。橫軸:從樣本中隨機選擇的測序條帶的數量。縱軸:香農-維納指數,用於估計群落多樣性水平。香農指數計算公式:其中Sobs=實際測量的OTUs數量;Ni=包含I序列的otu的數量;N =所有序列的數量。曲線解讀:?圖2每條曲線代表壹個樣品,用不同的顏色標記,末端數字是測序條帶的實際數量;?起初,曲線呈線性上升,這是由於測序文章的數量遠遠不足以覆蓋樣本。?數值增加至平滑表明測序條的數量足以覆蓋樣品中的大多數微生物。3.秩-多度曲線用於同時解釋樣本多樣性的兩個方面,即樣本中所含物種的豐富性和均勻性。橫軸上曲線的長度反映了物種的豐富程度。曲線越寬,物種組成越豐富。物種組成的均勻性由曲線的形狀反映出來。曲線越平坦,物種組成的均勻度越高。橫軸:OTU相對豐度從高到低排列。縱軸:相對豐度比。曲線解讀:?圖3對應於圖4中每條曲線的壹個樣本(參考右上角的圖標);?圖3和圖4中的橫坐標顯示了OTU(物種)的豐度順序,縱坐標對應於OTU的相對豐度比(圖3中的相對百分比示例和圖4中轉換後的對數值)。當曲線趨於水平時,意味著樣本中每個物種的比例相似。曲線的整體斜率越大,樣品中物種比例的差異就越大。4.樣品群落組成分析:多樣品直方圖/單樣品餅圖根據分類學分析結果,可以知道壹個或多個樣品在各個分類水平上的物種組成比例,反映不同分類水平樣品的群落結構。直方圖(圖5)橫軸:每個樣本的數量。縱軸:相對豐度比。圖標解讀:?顏色對應這壹分類層次的物種名稱,不同色塊的寬度表示不同物種的相對豐度比;?它可以在不同的分類水平上進行映射和分析。餅圖(圖6)不同植物群在某壹分類水平上的相對豐度比。不同的顏色代表不同的物種。5.樣本OTU分布的文氏圖用於計算多個樣本共有或獨有的OTUs數量,可以直觀地顯示環境樣本之間OTU成分的相似性。不同的樣品用不同的顏色標記,每個數字代表壹個樣品獨有的或幾個樣品共有的OTU數,相應的OTU數將以EXCEL表格的形式呈現在結案報告中。分析需要壹張分析圖表,並且樣本被分組為至少兩個最多五個。?默認設置為97%的相似性級別,分析和繪制基於OTU。6.熱圖以顏色變化反映二維矩陣或表格中的數據信息,可以用定義的顏色深度直觀地表示數據值的大小。高多度和低多度物種分塊聚集,通過顏色梯度和相似度反映多個樣本在各分類水平上群落組成的相似性和差異性。相對豐度比:熱圖(圖8)中的每個單元代表樣品中OTU的相對豐度。以圖8為例,紅框中高亮顯示的單元格對應的信息是樣品中OTU(otu 11Z)的相對豐度比約為0.2%。計算豐度比的公式(Bray Curtis算法):其中SA,i =表示樣本A中第I個OTU包含的序列號Sb,i =表示樣本b中第I個OTU包含的序列號。樣本之間的聚類關系樹:進化樹表示樣本之間在選擇作圖數據時的進化關系(差異關系)。同壹分支中樣本序列的進化關系相似。物種/OTU豐度相似性樹:豐度相似性樹表示樣品和樣品中的OTU或序列之間的豐度相似性。豐度最接近的那些將被分配到同壹分支。客戶自定義分組:根據研究需要對植物物種/OTU研究樣本進行二級分組?二級物種/OTU分組:將較低分類層級的物種或OTU歸入相應的較高分類層級,並用不同顏色加以區分;?二次樣本分組:根據研究需要,對樣本進行人工分組,用不同顏色區分。7.主成分分析(PCA)在多元統計分析中,主成分分析是壹種簡化數據集的技術。主成分分析(PCA)常用於降低數據集的維度,同時保留數據集中對方差貢獻最大的特征,從而有效地找出數據中最“主要”的元素和結構,去除噪聲和冗余,降低原始復雜數據的維度,揭示隱藏在復雜數據背後的簡單結構。通過分析不同樣品的OTU成分,可以反映樣品之間的差異和距離。PCA利用方差分解將多組數據的差異反映在二維坐標圖上,坐標軸是最大程度反映方差的兩個特征值。如果樣本成分更相似,則PCA圖中反映的距離更近。橫軸、縱軸:以百分比形式反映主成分的主要影響程度。以圖9為例,主成分1(PC1)和主成分2(PC2)是造成四組樣本(紅色、藍色、黃色和綠色)的兩個最大差異特征,它們的貢獻率分別為41.1%和27.1%。十字準線:在圖9中作為零點基線存在,在分析中起輔助作用,本身沒有任何意義。傳奇解讀:?基於每個樣品中包含的所有OTU完成PCA分析圖;?圖9中的每個點代表壹個樣本;顏色代表不同的樣本組;?水平和垂直方向上兩點之間的距離表示樣本在主成分(PC1或PC2)影響下的相似性距離。?樣本越多,分析的意義越大;另壹方面,如果樣本數量太少,則會出現個體差異,這將導致PCA分析和映射後的距離分離較大。建議有多組樣本時每組樣本不少於5個,無組時每組樣本不少於10個。?圖10中的圓圈是聚類分析的結果,圓圈中的樣本具有相似的距離。8.RDA/ CCA分析圖是壹種基於對應分析的排名方法,將對應分析與多元回歸分析相結合,計算的每壹步都用環境因素進行回歸,也稱為多元直接梯度分析。主要用於反映菌群與環境因子的關系。RDA基於線性模型,CCA基於單峰模型。分析可以檢測環境因素、樣品和菌群之間的關系或它們之間的關系。橫軸和縱軸:RDA和CCA分析,模型不同,橫軸和縱軸上的刻度是每個樣本或物種隨環境因素回歸分析計算後產生的值,可以繪制成二維圖。傳奇解讀:?冗余分析可以基於所有樣品或樣品中優勢物種的OTU圖譜。?箭頭射線:圖11中的箭頭代表不同的環境因子(即圖中的碳酸氫根離子HCO3-和乙酸根離子AC-,圖中其他環境因子因研究代表不同而含義不同,此處不再贅述);?角度:環境因素之間的銳角表示兩個環境因素之間的正相關,鈍角表示負相關。環境因素的射線越長,影響因素的影響越大;?在圖11中,不同顏色的圓點代表不同類群的樣品或同壹類群不同時期的樣品,圖中的拉丁字母代表物種名稱,因此有關的優勢種也可以包括在圖中;?環境因素的數量少於樣品的數量,同時需要提供環境因素的數據,如pH值和測量的溫度值。9.單樣品/多樣品分類系統組成樹根據NCBI提供的現有微生物物種的分類信息數據庫,將測序獲得的物種豐度信息返回到數據庫的分類系統關系樹中,從整個分類系統中全面了解樣品中所有微生物的進化關系和豐度差異。單樣本圖(圖12):您可以了解單個樣本中序列在不同分類級別上的分布。傳奇解讀:?圖12中的不同級別反映了不同的分類級別;?分支的圓形區域表示分布在該分類級別的序列數量,不能與更低的級別進行進壹步比較。面積越大,這樣的序列就越多。?每個分支上名詞後的兩組數字分別表示與該分支相比的序列數和駐留在該節點上的序列數;?圖13顯示了單個水平物種的分布,而不是序列分布。多樣本圖(圖14):比較不同分類分支中多個樣本的序列編號差異。傳奇解讀:?比較壹個分支上不同樣本序號的差異,並通過彩色餅圖呈現出來。餅圖的面積越大,分支處的序列越多,不同的顏色代表不同的樣本。?某種顏色的扇形面積越大,意味著該分支中相應樣本的序列數多於其他樣本。?分析多個樣本時,建議將樣本數控制在10以內,或將重復樣本數據合並為壹個樣本後,樣本總數控制在10以內。10.系統發育樹在分子進化研究中,基於系統發育的推斷,揭示某壹分類水平上序列之間的堿基差異,進而構建系統發育樹。