在当今的大数据时代,以大数据分析为基础的人工智能时代已经到来,各行各业都基于大数据开启了新时代,不仅IT行业需要了解大数据知识,而且传统行业的从业者和普通大学生也应了解一些大数据知识。新的基础架构定义未来,大数据分析系统技术将开始得到全面应用,大数据分析还将重塑整个产业结构。想了解大数据分析,需要了解它的以下几个特点:
一、海量的数据量
大数据分析必然由海量的数据量支撑,对于大数据分析而言,有三个方面的因素定义:容量服务器数据恢复、许多不同的数据和文件类型、对于管理和更深入的分析数据。数据量本身就是聚合的概念。不是数据量大的数据被称为大数据,传统信息系统生成的“小数据”也是大数据分析的重要组成部分,这点必须清楚。当前,从大数据的数据源的角度来看,它主要集中在互联网,物联网和传统信息系统三个渠道。当前物联网数据的比例相对较大。
二、数据分析类型繁多
类型的多样性也让大数据分析被分为结构化数据分析和非结构化数据分析,相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频还有地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。
三、数据价值密度
大数据分析大时代,越来越多数据都是半结构化和非结构化数据,比如网站访问日志,里面大量内容都是没价值的,真正有价值的比较少,虽然数据量比以前大了N倍,但价值密度确实低了很多。如果有海量的结构化数据,则需要靠大数据分析才能处理,价值却能体现更大化,例如银联的交易数据,不仅数据密度大,价值也大。
大数据分析已经成为过去几年中大部分行业的游戏规则,学者和其他知名的利益相关者都同意这一点,随着大数据分析的服务商继续渗透到我们的日常生活中,围绕大数据的炒作正在转向实际使用中的真正价值。当然大数据的出现,也让商业智能BI逐渐火了起来。