5 可視化的目錄 · 數據可視化的基礎知識

# 5 可視化的目錄 > 原文： [5 Directory of visualizations](https://serialmentor.com/dataviz/directory-of-visualizations.html) > 校驗：[飛龍](https://github.com/wizardforcel) > 自豪地采用[谷歌翻譯](https://translate.google.cn/) 本章提供了通常用于可視化數據的各種圖形的簡單可視化概述。它既可以作為目錄，也可以用來查找您可能不知道的特定名稱的可視化，如果您需要找到您經常制作的圖形的替代方案，則可以作為靈感來源。 ## 5.1 數量 ![](https://img.kancloud.cn/be/f0/bef00323aa3e2ad52c70225afa4bf542_1371x342.jpg) 可視化數量的最常見方法（即，針對某些類別顯示的數值）是使用垂直或水平排列的條形（第六章）。但是，我們也可以將點放在相應條形的結束位置（第六章），而不是使用條形圖。 ![](https://img.kancloud.cn/99/89/99890dbe837cb60fa8dcc8e5eb042eb0_1371x685.jpg) 如果有兩組或多組我們想要顯示數量的類別，我們可以對條形圖進行分組或堆疊（第六章）。我們還可以將類別映射到 *x* 和 *y* 軸上，并通過熱圖（第六章）按顏色顯示數量。 ## 5.2 分布 ![](https://img.kancloud.cn/f5/a5/f5a5ba6e397cb3c5ffa4fa6d9e28c0f2_1371x342.jpg) 直方圖和密度圖（第七章）提供了最直觀的分布可視化，但兩者都需要任意參數的選擇，并且可能會產生誤導。累積密度和分位數-分位數（q-q）圖（第八章）總是忠實地表示數據，但可能更難以解釋。 ![](https://img.kancloud.cn/11/ab/11ab9b6989bd6d12d8a8e2cc2280b7e4_1371x685.jpg) 當我們想要一次可視化許多分布，和/或我們主要感興趣的是分布之間的整體變化時，箱形圖，提琴圖，帶狀圖和 Sina 圖是很有用的（9.1 節）。堆疊的直方圖和密度圖允許更深入地比較較少數量的分布，盡管堆疊的直方圖可能難以解釋并且最好避免（7.2 節）。Ridgeline 圖可以作為提琴圖的有用替代品，并且在可視化非常大量的分布或隨時間的分布變化時通常是有用的（9.2 節）。 ## 5.3 比例 ![](https://img.kancloud.cn/0a/b7/0ab7fe1b610d96c22d3f229fcb86e09c_1371x342.jpg) 比例可以顯示為餅圖，并排條形或堆疊條形圖（第 10 章），并且就數量而言，條形可以垂直或水平排列。餅圖強調單個部分加起來是整體并突出顯示簡單的部分。然而，在并排的條形中更容易比較各個部分。對于一組比例，堆疊條形看起來很尷尬，但在比較多組比例時可能很有用（見下文）。 ![](https://img.kancloud.cn/cd/20/cd208977587b24f60b0099c83342adf4_1371x342.jpg) 當在多個條件下可視化多組比例或比例變化時，餅圖往往是空間效率低下且關系模糊的。只要比較的條件數量適中，分組條形就可以工作得很好，并且堆疊條形可以適用于大量條件。當比例沿連續變量變化時，堆疊密度圖（第 10 章）是合適的。 ![](https://img.kancloud.cn/db/46/db46067b7c01384f6802f01bd35e026d_1371x342.jpg) 當根據多個分組變量指定比例時，馬賽克圖，樹形圖或平行集圖是有用的可視化方法（第 11 章）。馬賽克圖假設一個分組變量的每個水平都可以與另一個分組變量的每個水平組合，而樹形圖不會做出這樣的假設。即使一個組的細分完全不同于另一個細分，樹形圖也能工作得很好。當有兩個以上的分組變量時，平行集圖比馬賽克圖或樹形圖更好。 ## 5.4 *x* - *y* 的關系 ![](https://img.kancloud.cn/28/cd/28cd8a53fb230c7bfcb3f8ff10a80a0d_1371x342.jpg) 當我們想要相對于另一個定量變量顯示一個定量變量時，散點圖代表了原型可視化（12.1 節）。如果我們有三個定量變量，我們可以將一個定位到點大小，創建一個稱為氣泡圖的散點圖變體。對于配對數據，沿 *x* 和 *y* 軸的變量以相同單位測量，添加一條表示 *x = y* 的直線通常很有幫助（12.4 節）。配對數據也可以顯示為由直線連接的成對點的斜率圖（12.4 節）。 ![](https://img.kancloud.cn/e0/04/e004d25bd83e704c40d4830749826a77_1371x342.jpg) 對于大量的點，由于過度繪圖，常規散點圖可能變得無法提供信息。在這種情況下，等值線圖，2D 箱形圖或六角箱形圖可以提供替代方案（第 18 章）。另一方面，當我們想要可視化兩個以上的數量時，我們可以選擇以相關圖的形式而不是基礎原始數據來繪制相關系數（章節 12.2 ）。 ![](https://img.kancloud.cn/a4/32/a432baebf41ecc75499aeb2f6bd452ca_1371x342.jpg) 當 *x* 軸表示時間或嚴格增加的量（例如治療劑量）時，我們通常繪制線形圖（第 13 章）。如果我們有兩個響應變量的時間序列，我們可以繪制一個連通的散點圖，我們首先在散點圖中繪制兩個響應變量，然后連接對應于相鄰時間點的點（13.3 節）。我們可以使用平滑線圖來表示更大數據集中的趨勢（第 14 章）。 ## 5.5 地理空間數據 ![](https://img.kancloud.cn/2c/00/2c00eec063cd022dc402f0901a7f1143_1371x342.jpg) 顯示地理空間數據的主要模式是地圖形式（第 15 章）。地圖采用地球上的坐標并將它們投影到平面上，使得地球上的形狀和距離大致由 2D 表示中的形狀和距離表示。此外，通過根據數據對地圖中的這些區域著色，我們可以顯示不同區域的數據值。這樣的地圖稱為等值區圖（15.3 節）。在某些情況下，根據一些其他數量（例如，人口數量）扭曲不同區域或將每個區域簡化為正方形可能是有幫助的。這種可視化稱為統計地圖。 ## 5.6 不確定性 ![](https://img.kancloud.cn/b5/f4/b5f44ee04344f758f1536fb01bf760c8_1371x342.jpg) 誤差條表示某些估計值或測量值的可能值的范圍。它們從表示估計值或測量值的某個參考點水平和/或垂直延伸（第 16 章）。參考點可以以各種方式顯示，例如通過點或條形。漸變誤差條同時顯示多個范圍，其中每個范圍對應于不同的置信度。它們實際上是多個誤差條，其中不同的線厚度彼此疊加。 ![](https://img.kancloud.cn/82/b7/82b7b32fb9b62dea0643bd2762a55f74_1371x342.jpg) 為了實現比誤差條或分級誤差條更詳細的可視化，我們可以看到實際的置信度或后驗分布（第 16 章）。置信區域提供清晰的視覺不確定感，但難以準確讀取。眼睛圖和半眼圖將誤差條與可視化分布（分別為提琴和脊線）的方法相結合，因此顯示了一些置信水平和整體不確定性分布的精確范圍。分位點圖可以作為不確定性分布的替代可視化（16.1 節）。通過以離散單位顯示分布，分位點點圖不是那么精確，但比提琴或脊線圖所示的連續分布更容易閱讀。 ![](https://img.kancloud.cn/af/ea/afeaca527819300f6857c8676f9260d4_1371x342.jpg) 對于平滑線圖，誤差條的等效值是置信帶（16.3 節）。它顯示了線條在給定置信水平下可能通過的一系列值。與誤差條的情況一樣，我們可以繪制分級置信帶，一次顯示多個置信水平。我們還可以顯示單獨的擬合繪圖來代替置信帶或放在一起。