作者: 大数据文摘来源: afenxi时间:2017-06-27 14:32:100
图表是一种美观而强大的工具,可以帮助我们探索和诠释这个世界。数百年来,人们一直在使用图表来解释跟数据相关的种种。为了向数据可视化的历史和图表的力量致敬,我们重新制作了史上最具代表性的7张图表。 这其中一部分是用现代的方法呈现出原稿,而另一些则致力于对原图的重新制作。这项工程由Edward Tufte发起。他是一位数据可视化的专家,已经对这些以及更多的图表写过相关文章。
1. 俄法战争
1969年,Charles Minard做了一张图表,是1812年拿破仑率军攻占莫斯科的行军图,显示了军队规模的缩减。在顶端较粗的线代表了从波兰到莫斯科的行军规模变化。下方的细深色线则代表了撤退时的军队规模。线条的宽度代表了军队的规模,从400000大军缩减到了10000。底部线条是温度和时间刻度,而整个图形分布展示了行军距离。
下方是我们的现代视图。我们也可以做一个更为准确的复刻。中间的分界线代表莫斯科。蓝色的线表示温度随右侧Y轴的变化。底部的X轴则表示日期和距离。我们也可以使用一个自定义的日期格式。拖动鼠标会看到数据。D3.js带来这种交互性。也可单击并拖动缩放。
2. 约翰·雪诺(John Snow)和霍乱案例
下方是约翰·雪诺的地图,展示了1854年伦敦霍乱爆发时的发病源头。线条代表街道。黑色的长条代表了所在街区死亡的人数。圆点代表抽水泵。特别注意在宽街 (Broad Street)上的抽水泵周围的死亡人数相对集中。雪诺用他的这幅地图佐证了他极富争议的理论:霍乱是由被污染的引用水传播开来的。当政府关闭了宽街上的水泵,霍乱的蔓延也平息了。引发霍乱的病菌最终由德国物理学家罗伯特·科赫(Robert Koch)在1883年分离出来。
我们重制了这张图表,用蓝色半透明方块来表示死亡人数。 沿着灰色街道的深色块表示多人死亡。星形表示抽水泵。图中的多边形展现了基于抽水泵区域而分布的死亡人群分布:即最近的打水区域。最右侧的区域超出了地图绘制的范围。如果你将鼠标放在某个抽水泵图标上,你就可以看到这个区域内的死亡人数。放大图像则可以展开某一个群组看到详细数据。
3. 死亡原因极坐标图
弗洛伦斯·南丁格尔(Florence Nightingale)是一位著名的英国社会改革者和统计学家。她是皇家统计学会的第一位女性成员,是使用极坐标图的先驱。当向国会展示她的研究成果时,南丁格尔使用区块来解释克里米亚战争。她的区块显示了在1854到1856年间克里米亚战争中人们死亡的原因。
史蒂芬(Stephen Few)在《把饼状图留给甜点》一文中提到,由于饼状图不是并排展示,会使得比较规模和数值变得困难。这样的问题在极坐标图中同样存在。为了大家更好的理解,我们在Plotly中用python将她的图表录入,然后使用堆积柱状图来解决比较问题。
4. 地球
地图应该是最早形式的图表。下面的地图分别由马丁·瓦尔德泽米勒(Martin Waldseemüller)在1507年,亚伯拉罕·奥特柳斯(Abraham Ortelius)在1570年和伊曼纽尔-鲍文(EmanuelBowen)在1744年制作完成的。
Plotly的创建人切尔西(Chelsea Lyn)用MATLAB的3Dglobe绘制地图,展示了国家、水域、经纬度和飞行轨迹。如果你点击、长按或拖动图像,图像可被翻动和旋转。切换图像的缩放比例可以看到详细数据。
5. 汉斯·罗斯林(HansRosling)
汉斯•罗斯林是Gapminder(注:一个在线互动图表数据平台)的创办人之一,他制作了气泡图来展示每个国家四个维度的变量指标:平均寿命(y轴),GDP(x轴),七大洲(颜色)和人口数量(气泡大小)。
以下是利用Plotly绘制的。你可以通过悬停鼠标来查看数据,切换图例的轨迹,或通过点击和拖拽来缩放展示比例。获取更多信息,可查看我们基于python创建图表的教程或者网页版教程,Plotly也能进行流式数据处理。
6. Anscombe四图:为什么要制作图表
Anscombe四图展示了弗朗西斯·安斯库姆(Francis Anscombe)在1973年构造的四组数据集。数据集具有相同的线性回归参数,x、y均值,x、y方差和Pearson相关系数(精确到两位小数)。《Nature》中的一篇文章重新发布了该数据集并绘制成如下图表。
关键点是:仅仅只有统计数据会变得混淆杂乱和不完整。图表能让我们更好的理解数据。可通过阅读ggplot2和matplotlib文档去了解和制作subplots,同时可通过以往关于Anscombe主题的文章进行学习。
7. 进口量&出口量折线图
威廉·普莱费尔(WilliamPlayfair,1759-1823)是一位苏格兰的工程师和政治经济学家。他发明了折线图,条形图,饼图和扇形图。他通过绘制以下轨迹图展示英国从进口量大于出口量到出口量大于进口量的时间点。
永洪BI
更敏捷、更快速、更强大