在讀技術(shù)博客的過程中,我們會(huì)發(fā)現(xiàn)那些能夠把知識(shí)、成果講透的博主很多都會(huì)做動(dòng)態(tài)圖表。他們的圖是怎么做的?難度大嗎?這篇文章就介紹了 Python 中一種簡(jiǎn)單的動(dòng)態(tài)圖表制作方法。
數(shù)據(jù)暴增的年代,數(shù)據(jù)科學(xué)家、分析師在被要求對(duì)數(shù)據(jù)有更深的理解與分析的同時(shí),還需要將結(jié)果有效地傳遞給他人。如何讓目標(biāo)聽眾更直觀地理解?當(dāng)然是將數(shù)據(jù)可視化啊,而且最好是動(dòng)態(tài)可視化。 本文將以線型圖、條形圖和餅圖為例,系統(tǒng)地講解如何讓你的數(shù)據(jù)圖表動(dòng)起來。
這些動(dòng)態(tài)圖表是用什么做的? 接觸過數(shù)據(jù)可視化的同學(xué)應(yīng)該對(duì) Python 里的 Matplotlib 庫(kù)并不陌生。它是一個(gè)基于 Python 的開源數(shù)據(jù)繪圖包,僅需幾行代碼就可以幫助開發(fā)者生成直方圖、功率譜、條形圖、散點(diǎn)圖等。這個(gè)庫(kù)里有個(gè)非常實(shí)用的擴(kuò)展包——FuncAnimation,可以讓我們的靜態(tài)圖表動(dòng)起來。 FuncAnimation 是 Matplotlib 庫(kù)中 Animation 類的一部分,后續(xù)會(huì)展示多個(gè)示例。如果是首次接觸,你可以將這個(gè)函數(shù)簡(jiǎn)單地理解為一個(gè) While 循環(huán),不停地在 “畫布” 上重新繪制目標(biāo)數(shù)據(jù)圖。 如何使用 FuncAnimation? 這個(gè)過程始于以下兩行代碼:
importmatplotlib.animationasani animator=ani.FuncAnimation(fig,chartfunc,interval=100) 從中我們可以看到 FuncAnimation 的幾個(gè)輸入:
fig 是用來 「繪制圖表」的 figure 對(duì)象;
chartfunc 是一個(gè)以數(shù)字為輸入的函數(shù),其含義為時(shí)間序列上的時(shí)間;
interval 這個(gè)更好理解,是幀之間的間隔延遲,以毫秒為單位,默認(rèn)值為 200。
這是三個(gè)關(guān)鍵輸入,當(dāng)然還有更多可選輸入,感興趣的讀者可查看原文檔,這里不再贅述。 下一步要做的就是將數(shù)據(jù)圖表參數(shù)化,從而轉(zhuǎn)換為一個(gè)函數(shù),然后將該函數(shù)時(shí)間序列中的點(diǎn)作為輸入,設(shè)置完成后就可以正式開始了。 在開始之前依舊需要確認(rèn)你是否對(duì)基本的數(shù)據(jù)可視化有所了解。也就是說,我們先要將數(shù)據(jù)進(jìn)行可視化處理,再進(jìn)行動(dòng)態(tài)處理。 按照以下代碼進(jìn)行基本調(diào)用。另外,這里將采用大型流行病的傳播數(shù)據(jù)作為案例數(shù)據(jù)(包括每天的死亡人數(shù))。
importmatplotlib.animationasani importmatplotlib.pyplotasplt importnumpyasnp importpandasaspdurl='https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv' df=pd.read_csv(url,delimiter=',',header='infer')df_interest=df.loc[ df['Country/Region'].isin(['UnitedKingdom','US','Italy','Germany']) &df['Province/State'].isna()]df_interest.rename( index=lambdax:df_interest.at[x,'Country/Region'],inplace=True) df1=df_interest.transpose()df1=df1.drop(['Province/State','Country/Region','Lat','Long']) df1=df1.loc[(df1!=0).any(1)] df1.index=pd.to_datetime(df1.index)繪制三種常見動(dòng)態(tài)圖表動(dòng)態(tài)曲線圖
如下所示,首先需要做的第一件事是定義圖的各項(xiàng),這些基礎(chǔ)項(xiàng)設(shè)定之后就會(huì)保持不變。它們包括:創(chuàng)建 figure 對(duì)象,x 標(biāo)和 y 標(biāo),設(shè)置線條顏色和 figure 邊距等:
importnumpyasnp importmatplotlib.pyplotaspltcolor=['red','green','blue','orange'] fig=plt.figure() plt.xticks(rotation=45,ha="right",rotation_mode="anchor")#rotatethex-axisvalues plt.subplots_adjust(bottom=0.2,top=0.9)#ensuringthedates(onthex-axis)fitinthescreen plt.ylabel('NoofDeaths') plt.xlabel('Dates') 接下來設(shè)置 curve 函數(shù),進(jìn)而使用 .FuncAnimation 讓它動(dòng)起來: defbuildmebarchart(i=int): plt.legend(df1.columns) p=plt.plot(df1[:i].index,df1[:i].values)#noteitonlyreturnsthedataset,uptothepointi foriinrange(0,4): p[i].set_color(color[i])#setthecolourofeachcurveimportmatplotlib.animationasani animator=ani.FuncAnimation(fig,buildmebarchart,interval=100) plt.show()動(dòng)態(tài)餅狀圖
可以觀察到,其代碼結(jié)構(gòu)看起來與線型圖并無太大差異,但依舊有細(xì)小的差別。
importnumpyasnp importmatplotlib.pyplotaspltfig,ax=plt.subplots() explode=[0.01,0.01,0.01,0.01]#popouteachslicefromthepiedefgetmepie(i): defabsolute_value(val):#turn%backtoanumber a=np.round(val/100.*df1.head(i).max().sum(),0) returnint(a) ax.clear() plot=df1.head(i).max().plot.pie(y=df1.columns,autopct=absolute_value,label='',explode=explode,shadow=True) plot.set_title('TotalNumberofDeaths '+str(df1.index[min(i,len(df1.index)-1)].strftime('%y-%m-%d')),fontsize=12)importmatplotlib.animationasani animator=ani.FuncAnimation(fig,getmepie,interval=200) plt.show() 主要區(qū)別在于,動(dòng)態(tài)餅狀圖的代碼每次循環(huán)都會(huì)返回一組數(shù)值,但在線型圖中返回的是我們所在點(diǎn)之前的整個(gè)時(shí)間序列。返回時(shí)間序列通過 df1.head(i) 來實(shí)現(xiàn),而. max()則保證了我們僅獲得最新的數(shù)據(jù),因?yàn)榱餍胁?dǎo)致死亡的總數(shù)只有兩種變化:維持現(xiàn)有數(shù)量或持續(xù)上升。 df1.head(i).max()動(dòng)態(tài)條形圖
創(chuàng)建動(dòng)態(tài)條形圖的難度與上述兩個(gè)案例并無太大差別。在這個(gè)案例中,作者定義了水平和垂直兩種條形圖,讀者可以根據(jù)自己的實(shí)際需求來選擇圖表類型并定義變量欄。 fig=plt.figure() bar=''defbuildmebarchart(i=int): iv=min(i,len(df1.index)-1)#theloopiteratesanextraonetime,whichcausesthedataframestogooutofbounds.Thiswastheeasiest(mostlazy)waytosolvethis:) objects=df1.max().index y_pos=np.arange(len(objects)) performance=df1.iloc[[iv]].values.tolist()[0] ifbar=='vertical': plt.bar(y_pos,performance,align='center',color=['red','green','blue','orange']) plt.xticks(y_pos,objects) plt.ylabel('Deaths') plt.xlabel('Countries') plt.title('DeathsperCountry '+str(df1.index[iv].strftime('%y-%m-%d'))) else: plt.barh(y_pos,performance,align='center',color=['red','green','blue','orange']) plt.yticks(y_pos,objects) plt.xlabel('Deaths') plt.ylabel('Countries')animator=ani.FuncAnimation(fig,buildmebarchart,interval=100)plt.show()保存動(dòng)畫圖 在制作完成后,存儲(chǔ)這些動(dòng)態(tài)圖就非常簡(jiǎn)單了,可直接使用以下代碼: animator.save(r'C: empmyfirstAnimation.gif')責(zé)任編輯:lq
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7256瀏覽量
91853 -
可視化
+關(guān)注
關(guān)注
1文章
1262瀏覽量
21857 -
python
+關(guān)注
關(guān)注
56文章
4827瀏覽量
86726
原文標(biāo)題:讓數(shù)據(jù)動(dòng)起來:Python動(dòng)態(tài)圖表制作!
文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
DTMB天線制作的幾種簡(jiǎn)易圖紙和方法 5分鐘就做出來了
一種高精度動(dòng)態(tài)壓電陶瓷驅(qū)動(dòng)電源
一種分段氣隙的CLLC變換器平面變壓器設(shè)計(jì)
一種永磁電機(jī)用轉(zhuǎn)子組件制作方法
為什么DLP2021LEQ1EVM按照使用手冊(cè)在主機(jī)靜音工作下啟動(dòng)還是跟本地主機(jī)控制模式一樣的人動(dòng)態(tài)圖案?
Chart FX——打印圖表

Chart FX-選擇圖表輸出

一種使用LDO簡(jiǎn)單電源電路解決方案

Python中dict支持多個(gè)key的方法
一種創(chuàng)新的動(dòng)態(tài)軌跡預(yù)測(cè)方法

一種簡(jiǎn)單高效配置FPGA的方法

一種半動(dòng)態(tài)環(huán)境中的定位方法

評(píng)論