可视化分析与SAS实现.html
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2023-11-19 22:35:56
微信
赏
支付宝
文档简介:
前言
比利时的佛兰芒族地理学家和地图学家亚伯拉罕·奥特柳斯,在研究了一个世纪以来环球旅行探险家们撰写的资料后,于1570年在比利时的安特卫普绘制了世界上第一张现代地图
集《世界概貌》,即把各种地理上的复杂数据通过图示的方法展示给人们。26年后,奥特柳斯提出了“大陆漂移学说”的设想。后来,我们还可以在地图上显示人口分布数据,世界
宗教分布,世界人民喜欢什么运动的分布,到今天的网民的分布,各国人民喜爱的网站分布,各种调研统计的数据分布,等等。
1812年夏,俄法战争爆发,拿破仑开始进攻俄国,在战争中遭受了灾难性损失,1813年以失败告终。法国工程师Charles Joseph Minard于1869年11月20日,在巴黎创作完成了
一张在信息图界有里程碑地位的“拿破仑1812—1813年俄国大进军的人员损失图”。信息图以真实地图为背景,起于波兰–俄国边境,止于莫斯科。他在图中使用了6个变量的数据:
拿破仑军队的数量、行军路线、气温、地理位置、行军到特定地点的时间和距离。线条宽度代表拿破仑的军队人数,黄色表示进攻路线,黑色表示撤退的路线。开始东征时有约42万
大军,到达莫斯科时剩余约10万人,最终返回约1万多人。图中下面部分的温度折线图描绘了撤退途中的温度变化,最低温度达到-37.5摄氏度。对比军队规模在撤退途中的阶梯状锐减
的转折点与对应的温度变化,排除了当地发生过战役事件后,我们可以直观地推断出撤退时导致士兵死亡的最大原因是气温。
这两张图是数据可视化的经典案例。通过一张图,就把无数的数据汇集在一起,将数据之间的各种联系直观地展示出来,从而揭示出了很多内在的含义。想象一下在当时的环境
下,完全用手工的方式把如此多的代表不同维度的数据按照一定的构思汇集在一起,是何等烦琐、艰难、耗时。
20世纪60年代人类就实现了用计算机来做统计分析运算,但是到了80年代才实现了计算机的图形化显示、可视化的数据展示。这也仅仅是在数字列表的基础上增加了显示简单图
形的功能。到了21世纪,计算机技术和互联网技术获得了长足的发展,各种应用也越趋广泛,特别是电子商务、社交媒体、移动应用和ERP的广泛应用,极大地促进了数据的增长,而
且数据的种类繁多,非结构化的数据占主要分量,由此对数据分析的能力提出了前所未有的挑战。为了应对这些挑战,人们发明了存储这些数据的平台Hadoop,处理大量数据的高性
能分析技术,开发了新的模型和算法处理非结构化数据,用新的计算机图形学技术与模型来展示它们各种内在的关系。我们可以看到,今天我们对统计分析软件的要求与过去已经有了
很大的区别。那么这些区别包括哪些内容呢?
传统的统计分析软件主要是分析结构化的数据,这些数据都是存储在关系数据库、纯文本、Ex......
评论
发表评论