當前位置:股票大全官網 - 股票投資 - 數據分析與圖形化-seaborn作圖總結

數據分析與圖形化-seaborn作圖總結

python中常用的數據圖形化庫有matplotlib,seaborn,plotnine以及pandas自帶的圖形化功能等(目前我接觸的)。在這幾種圖形化中,pandas自帶的庫圖形簡單,matplotlib需要調試的參數過多,seaborn基於matplotlib,但是學習難度遠小於matplotlib,可以作為學習的首選圖形化庫。

以下為我個人常用的幾種圖形

seaborn輸入參數基本所有的圖形輸入類型是壹致的,設置輸入的橫坐標的數據即 x =“列名”, y =列名,用於分類的數據 hue =列名,輸入的數據集,及壹些其他的參數。

palette為seaborn可以選擇的調色板。有多種配色選擇可以用來選擇。

箱線圖與小提琴圖壹樣,適合展示數據的整體分布,與數據的集中程度,箱線圖還包括數據的上線四分位線,異常值等等,也可以用來比較兩組數據整體的高低等。

在數據集中數據較多的情況下,還可以選擇sns.boxenplot用來展示數據分布,可以較為直觀的整體數據分布。

日常使用boxplot比較多,對於boxplot,有以下幾點小小的總結:

最後得到圖形如下所示,顯得比較簡單直接。

seaborn中只有5個風格可供選擇,而在matplotlib中則有更多的作圖風格可以供我們選擇,我們可以使用以上語句選擇需要使用的風格(26種)具體可以參考.

matplotlib style

小提琴圖是核密度圖與數據分布圖的結合的圖形,表達圖形含義與箱線圖類似,可以較為直觀的展示數據的分布。

此外還有壹些其他的圖形較為常用,swarmplot(簇狀散點圖),stripplot(分類散點圖),scatterplot(散點圖),lineplot(連線圖),lmplot(擬合回歸線圖,可以選擇回歸線的冪次,如二次回歸或者三次回歸等)。catplot(以某壹列為分類信息,分成多個圖展示數據,可以選擇的又boxplot等)。

seaborn style

matplotlib style