經(jīng)濟(jì)學(xué)人雜志除了色彩鮮明的文章之外,其在數(shù)據(jù)可視化方面也自成一派。絕妙的顏色搭配,風(fēng)格鮮明的圖表總能讓讀者過目不忘。
據(jù)圖表編輯編輯Sarah Leo在一篇博客中介紹到:雖然對于每一張圖表,他們都盡量準(zhǔn)確地以最能支持故事表達(dá)的方式來可視化數(shù)字,但有時候也會犯錯。
為了能夠做的更好,他們在從錯誤中不斷總結(jié)教訓(xùn),不斷的自我改進(jìn)。為此Sarah Leo還把經(jīng)濟(jì)學(xué)人的錯誤總結(jié)為3點,并寫成一篇博客,供大家參考,大數(shù)據(jù)文摘對文章編譯如下?
深入了解我們的記錄后,我找到了幾個有用的例子。我將針對數(shù)據(jù)可視化的問題分為三類:
誤導(dǎo)性圖表
模糊的圖表
未能說明問題的圖表
免責(zé)聲明:大多數(shù)“原始”圖表是在我們的圖表重新設(shè)計之前發(fā)布的。改進(jìn)的圖表是為了符合我們的新規(guī)格而繪制的。它們的數(shù)據(jù)完全一致。
誤導(dǎo)性的圖表
以誤導(dǎo)的方式呈現(xiàn)數(shù)據(jù)是數(shù)據(jù)可視化中最嚴(yán)重的問題,雖然我們從不故意這樣做,但它確實時不時發(fā)生。我們來看看三個例子。
錯誤:截斷標(biāo)尺
這圖就很左翼分子對不對
此圖表顯示了政治左翼Facebook頁面上帖子的點贊平均數(shù)量。這張圖表的重點是顯示Corbyn先生與其他帖子之間的差異。
原始圖表不僅低估了Corbyn先生的數(shù)量,還夸大了其他帖子的數(shù)量。在重新設(shè)計的版本中,我們完整地展示了Corbyn先生的數(shù)據(jù)并保證所有其他數(shù)據(jù)長條仍然可見。
另一個奇怪的是顏色的選擇。為了模仿工黨的配色方案,原圖使用了三種橙色/紅色色調(diào)來區(qū)分Jeremy Corbyn與其他國會議員和政黨。雖然顏色背后的邏輯對許多讀者來說可能是顯而易見的,但對于那些不太熟悉英國政治的人來說,這可能沒什么意義。
錯誤:通過故意操縱坐標(biāo)軸來假裝存在相關(guān)關(guān)系
難得的完美關(guān)聯(lián)?并不是的。
上面的圖表附有一個關(guān)于狗重量下降的故事。乍一看,似乎狗的體重和頸部大小完全相關(guān)。但這是真的嗎?其實并不是很相關(guān)哦。
在原始圖表中,兩個坐標(biāo)軸的跨度均為三個單位(左邊是21到18;右邊是45到42)。按百分比計算,左邊的比例下降了14%而右邊則下降了7%。在重新設(shè)計的圖表中,我保留了雙坐標(biāo)軸的設(shè)計,但調(diào)整了它們的范圍以反映可比較的比例變化。
考慮到這個圖表的休閑主題,這個錯誤可能看起來并沒有那么重要。畢竟,圖表的信息在兩個版本中都是相同的。但我們從中學(xué)到的事情很重要:如果兩個變量過于緊密相關(guān),那么再仔細(xì)觀察一下坐標(biāo)軸尺度可能是一個好主意。
錯誤:選擇錯誤的可視化方法
對脫歐的看法幾乎和談判結(jié)果一樣不穩(wěn)定
我們在每日新聞應(yīng)用Espresso中發(fā)布了此投票圖表。它顯示了民眾對歐盟公投結(jié)果的態(tài)度,并以折線圖繪制。從數(shù)據(jù)來看,似乎受訪者對公投結(jié)果的看法相當(dāng)不穩(wěn)定——每周都會增加或減少幾個百分點。
我們并未使用平滑曲線繪制單個民意調(diào)查來顯示趨勢,而是連接每個民意調(diào)查的實際值。這主要是因為我們的內(nèi)部圖表工具沒有繪制平滑線條的功能。我們直到最近才逐漸開始熟悉更復(fù)雜的可視化統(tǒng)計軟件(如R)。今天,我們團(tuán)隊所有人都能夠繪制一個類似上面重新設(shè)計的投票圖表了。
此圖表中需要注意的另一件事是坐標(biāo)軸如何起點的方式。原始圖表將數(shù)據(jù)擴(kuò)展到全部空間。而在重新設(shè)計的版本中,我在坐標(biāo)軸開始的部位和最小數(shù)據(jù)點之間留下了更多空間。弗朗西斯·加農(nóng)(Francis Gagnon)為此制定了一個很好的規(guī)則:我們應(yīng)當(dāng)試著在一個不從零開始的折線圖下留出至少33%的空白區(qū)域。
模糊的圖表
這沒有誤導(dǎo)性圖表那么過分,但是一份難以閱讀的圖表還是表明可視化工作做得很糟糕。
錯誤:“發(fā)散性思維”過于發(fā)散了
…這啥玩意?
在“經(jīng)濟(jì)學(xué)人”雜志上,我們被鼓勵創(chuàng)造“發(fā)散性思維”的新聞報道。但是有時候,我們會認(rèn)為這有點太過分了。上圖顯示了美國的商品貿(mào)易逆差和制造業(yè)就業(yè)人數(shù)。
該圖表非常難以閱讀。它有兩個主要問題。首先,一個變量(貿(mào)易逆差)的值完全是負(fù)數(shù),而另一變量(制造業(yè)就業(yè))都是正數(shù)。將這些差異結(jié)合在一個圖表中而不平坦化任一變量非常不合理。有一個顯而易見的解決方案,但這卻會導(dǎo)致第二個問題:兩個變量不共享共同基線。貿(mào)易赤字的基線位于圖表的頂部(通過圖表左半邊那截紅線突出顯示),而右半部分的基線則位于底部。
重新設(shè)計的圖表顯示其實并沒有必要組合這兩個數(shù)據(jù)系列。貿(mào)易逆差與制造業(yè)就業(yè)之間的關(guān)系仍然很明顯,而這一圖表并沒有額外占據(jù)多少空間。
錯誤:莫名其妙的顏色使用
該圖表將政府在養(yǎng)老金福利方面的支出與國家65歲以上人口比例進(jìn)行了比較,并特別關(guān)注了巴西的情況。為了使圖表占據(jù)較小版面,可視化工具僅標(biāo)記了部分國家/地區(qū),并以電藍(lán)色突出顯示。經(jīng)合組織的平均值則以淡藍(lán)色突出顯示。
可視化者忽略了這樣一個事實,即不同顏色通常意味著不同分類。乍一看,這個圖表似乎也是如此——所有電藍(lán)色似乎屬于與深藍(lán)色不同的組合。但其實壓根不是這樣的,區(qū)別只是一個有打上國家標(biāo)簽,一個沒有而已。
在重新設(shè)計的版本中,所有國家/地區(qū)的圓圈顏色保持不變。我將沒有標(biāo)簽的數(shù)據(jù)點的透明度調(diào)高了。剩下的就靠排版了:巴西是重點國家所以用字體加粗;而經(jīng)合組織則用斜體字表示。
未能說明問題的圖表
最后一類的錯誤不太明顯。像這樣的圖表不會誤導(dǎo)讀者,也不會讓人感到困惑。他們只是沒有證明他們存在的合理性 - 通常是因為可視化不合理,或者因為我們非要在小版面內(nèi)塞進(jìn)過多信息。
錯誤:包含太多細(xì)節(jié)
“顏色越多越好!”——好的可視化才不會這樣
這彩虹真好看!我們在德國預(yù)算盈余的專欄中公布了這張圖表。它顯示了10個歐元區(qū)國家的預(yù)算余額和活期賬戶余額。
有這么多顏色,而且其中一些很難被區(qū)分。另外,因為對應(yīng)的值太小了,壓根沒有辦法得到任何圖表信息。它只會讓你眼前一愣然后趕緊轉(zhuǎn)移視線。而且更重要的是,由于我們沒有繪制所有歐元區(qū)國家,因此堆疊數(shù)據(jù)沒有任何意義。
我回過頭看看有沒有辦法簡化這個圖表。該專欄提到德國、希臘、荷蘭、西班牙以及歐元區(qū)總數(shù)。在重新設(shè)計的圖表版本中,我決定只強調(diào)這些。為了解決僅堆疊部分國家的問題,我添加了另一個類別(“其他”),其中包括所有其他歐元區(qū)國家。(由于歐盟統(tǒng)計局進(jìn)行了數(shù)據(jù)修訂,重新設(shè)計的圖表中的流動賬戶余額總額低于原始圖表。)
錯誤:大量數(shù)據(jù),空間不足
我放棄。
受到有限版面空間的限制,我們經(jīng)常試圖將所有數(shù)據(jù)一股腦兒塞進(jìn)圖表中。雖然這可以節(jié)省頁面上的寶貴空間,但它還是會有負(fù)面影響。比如這張2017年三月的圖表,它是關(guān)于科學(xué)界的論文發(fā)表是如何由男性主導(dǎo)的。所有數(shù)據(jù)點都同樣有趣且與主旨緊密相關(guān)。但是,一下子提供如此多的數(shù)據(jù)(四個研究領(lǐng)域類別以及發(fā)表人的比例)這些信息很難一起被接受。
經(jīng)過深思熟慮之后,我決定不重新設(shè)計這個圖表。如果我要保留所有數(shù)據(jù),那么圖表就會變得過于復(fù)雜而不簡潔。在這種情況下,削減一些內(nèi)容會更好?;蛘?,我們可以展示某種平均化的衡量標(biāo)準(zhǔn),例如所有領(lǐng)域的女性發(fā)表作品的平均比例。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7250瀏覽量
91506 -
可視化
+關(guān)注
關(guān)注
1文章
1256瀏覽量
21729 -
圖表
+關(guān)注
關(guān)注
0文章
33瀏覽量
8996
原文標(biāo)題:《經(jīng)濟(jì)學(xué)人》數(shù)據(jù)可視化編輯:錯誤的圖表,我們也畫了很多
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
可視化MES系統(tǒng)軟件
請問怎么把BI數(shù)據(jù)可視化報表發(fā)給領(lǐng)導(dǎo)看?
三維可視化的應(yīng)用和優(yōu)勢
大屏可視化報表也能自助分析了
數(shù)據(jù)可視化在電力行業(yè)的應(yīng)用前景如何?
常見的幾種可視化介紹
經(jīng)驗分享|BI數(shù)據(jù)可視化報表布局——容器
柔性動態(tài)可視化在醫(yī)學(xué)圖像可視化中應(yīng)用
數(shù)據(jù)可視化到底有什么用?
大數(shù)據(jù)可視化技術(shù)還將面臨哪些新的挑戰(zhàn),如何應(yīng)對
數(shù)據(jù)可視化的常用技術(shù)和并行與原位可視化方法分析
數(shù)據(jù)資源可視化是什么?有什么好處?
智慧能源可視化監(jiān)管平臺——助力可視化能源數(shù)據(jù)管理

評論