大数据产业技术创新力比较分析
2016.11.25 / View:导读:大数据实际上是把人脑和万世万物进行连通,通过数据,通过我们的分析,通过电子数据化来感知世界。有专家指出,大数据及其分析,将会在未来10年改变几乎每一个行业的业务功能。
非常感谢永洪给这么一个机会给大家交流。我今天一直在听各行各业的,无论是在做BI的还是用BI甚至是开发BI技术的,我们听了各种行业,包括能源的,金融的,做制造的。那么大家在大数据特别是做BI,大家是不是有一个同样的想法。从政策角度来看,我们一直在想怎么去理解这个概念,这个概念是什么?就是大数据产业。
到底什么是大数据产业?
我们可以看到,我们现在所能感受到的包括今天所能听到的无非是几方面,我们现在处在的网络时代,我们用的wifi、网络、无线终端、互动互联互通导致了我们处于信息丰富和繁荣中。
我们拿信息做什么?我们可以看到下面这两个图,一个是做商业的,比如说阿里研究院的交往数据形成的云图。还有一个是大家随时随地用的,就是交流、交通。我们随时随地都在跟我们的家人、朋友在了解我们公司的动态,在接受上司领导的命令。为什么?现在随便一件事都拉上一个群出来,任何一件事,任何一个命令和任务直接就布置出去了。
那么这些东西是不是构成了大数据产业呢?我们仍然不清楚到底什么是大数据产业。我们可以看到无论是发邮件还是我们的交流,或者是我们的医疗或者是我们的通话,还是我们的网络交易,可以看到每天都会产生大量的数据。这些数据可以产生什么,数据可以影响什么,数据的边界在哪里?我们可以感觉到处处都在数据之中,但是不知道大数据产业跟其他的产业怎么可以分割开来。所以可以看到我们现在所深处的环境中,我们的网民数量、医院医疗、生活方式等各行各业都进来了,那么现在大数据产业怎么分析和研究,我们把它作为一个独立的产业看待的时候,到底什么是大数据产业?
只要数量达到一定的基点,比如说我们从以前的一个GB到后来4GB,而现在的3D电影可能是几十G,这对大数据来讲是很小的数据。那么到了PB、TB、EB都很大了,现在到了ZB我们可以想象到吗?我们现在感觉到的只不过是一种现象,从我们的感受上来讲,人所能接受的事物甚至是眼睛所能看到的事物就是ZB级的。但是现在我们所能获得到的数据也就是PB级的。所以在很多技术上,科学上发现大数据的首要问题是怎么去表示它。这也是我们下面很多课题中研究到的怎么去描述它。
在计算模式上,我们可以看到从原来的电脑单机到多机协作。我们从原来围绕的数据开发到数据决策和数据支撑,在计算模式上有了大量的数据,然后产生了数据分析,那么数据分析随着时间的积累,包括今天上午很多人说,特别是何总也提到的一个问题,现在很多的事情,我们在做的一件事是存储数据,所以我们现在是数据大,不是大数据。最后我们可以看到大数据分析是什么,大数据分析是基于一种理念、思维,是一种分析模式,甚至说什么叫大数据,谁能说清楚。无论是做学术研究的还是做产业分析的,或者是做商业智能的或者是给企业做管理咨询的,谁可以说的清什么是大数据。
大数据的特征
大数据是怎样一个东西,大家提出了大数据的4V特征:大量化、多样化、快速化、密度低,数据是很有价值的,但是数据量很大,你怎么可以从大数据量中抓出有价值的数据。我们发现在上午包括何总提到的四个困惑,我们感觉和我们很多的研究特别是在这个课题研究中的很多感触以及总结的特征是非常接近的。
实际上我们现在遇到一个问题,发展到了现在的信息时代,我们现在深处信息时代的重要特征就是数据,所以这里面有一个学术问题,就是信息等于数据吗?或者说数据等于信息吗?大家的看法都不一样,现在我们不断的产生数据一直到现在的数据很大,然后怎么能够发展成大数据,很重要的一个问题是怎么能够由数据大变成大数据。虽然现在我们很多是对数据大的问题进行分析,还没有真正进入大数据分析。我今天作为一个业外人士对大家进行大数据的产业开发不是泼冷水,我主要是从分析研究的角度来看,我们现在所做的大数据和数据大的分析,看不出来本质区别。
我们可以看到,如果我们跟传统的数据库进行比较的话,我们应该知道如果从概念上来讲,我们的大数据应该首先是有几个特征的,这几个特征不是简单的思维特征:1.从模式上的大数据和数据是什么关系。2.处理工具上,我们数据的处理方式上,数据分析和大数据分析一样不一样,肯定是不一样的。
在大数据的科学上,我这里做一个简单的解剖,当我们做课题分析的时候,我们把大数据分成了三个概念,第一个是大数据自身是一个数据。在数据之上怎么构成大数据产业。从数据到数据科学,从数据科学到数据技术,从技术产生到应用到产业。
从这里可以看到进入大数据时代,我们有一个人是必须要提到的,就是victor,他提出了大数据的三个基本特征,第一,大数据是一个基本思维。这要分析数据事物相关的所有数据,而不是依靠分析少量数据样本,要总体,不要样本。第二,要乐于接受数据的纷繁复杂,而不再追求精确性。第三,不再探求难以琢磨的因果个关系,应该更加注重相关关系。这就是大数据能够在科学上带来的方式,所以我们很多人甚至现在很多国内院士在大数据评价中,一直把它呼吁叫“第四种科学思维”。我们可以看到大数据科学实际上是一种思维的变革。
大数据技术是怎样的呢?
这里有一个图,大数据实际上是把人脑和万世万物进行连通,通过数据,通过我们的分析,通过电子数据化来感知世界。那么在典型企业,就是谷歌的技术演化,实际上我们无论怎样演化可以看到大数据技术无非就是这四大模块:1.数据的采集与存在。2.数据分析和传递。这涉及到很艰巨的任务,在这方面,我们做后端分析的时候会再讲到。3.数据的分析个建模。4.数据应用于生成,就是你怎么实现你的价值和决策,怎么能够为用户带来有用的消费,这就是我们大数据的产生。
在这四种技术上,我们看到很多具体的应用,其中一块就是商业智能。我们也可以看到这么多的技术应用到哪里?它的边界在哪里?我们可以看到现在其中可以感受到的一个,就是网络消费,网络生活以及互联互通,包括我们现在的手机、电视、互联网服务。是不是所有大数据能够镶嵌进去的都在我们的范围内,还是说我们要把这些产业之中大数据所创造的增值部分提炼出来,才是大数据的边界?这就值得大家思考。
再一个可以看到跟大数据很相关的,就是国家现在的政策,我不多说了。第二个跟大数据密切相关的就是云计算,那么我们做大数据分析的时候,包括不包括云计算的环节。第三个是互联网,数据的来源在哪里?真正来源在于互联网,所有的分析如果没有数据源不行,那么我们未来的数据源是哪里?是物联网。第四是移动互联网。
大数据在各行各业的应用
我们把它综合起来可以做这么一个判断:大数据真正进入各行各业,能够让行业创新,进入3.0时代。所以我们真正的大数据时代应该是非常先进的社会生产体系,还有人非常自由自在,轻松低成本的生活模式。所以大数据在各行各业中,方方面面都会有很多的影响。
有专家指出,大数据及其分析,将会在未来10年改变几乎每一个行业的业务功能。到底什么是大数据产业,如果大数据产业把每一个行业都改变了,那么是不是每一个行业都是大数据产业?所以我们在研究课题的时候,包括中国科协跟我们探讨的问题是大数据的边在哪里?比如说我们银行用了大数据的产业系统,最后再搞一个大数据的精准广告,那么我们银行的业务都算大数据业务吗?
那么是不是所有的行业都拿我们的大数据,所以我们怎么把大数据理清楚。我们把它分析成四个特点:1.统计没有边界。2.统计没有数目。3.发展迅速。4.各界非常关注。
这样我们在评价的时候会遇到一个问题,对于这么一个边界不清晰,没有统计数据怎么来分析?我们看到以往的产业分析方法,我们这些分析最终的问题是怎么样为企业做来决策,那么你要提供资料才可以进行决策,这其中潜在的逻辑是老板不能判断复杂的数据,只能看简单的图形。
那么你给老板提一堆复杂的数据,老板是晕的,大老板只能管两三个人,因为他要集中方向。所以说你要跟这些投资人,你跟他讲复杂的东西是不行的,你一定要跟他讲最简单的,我们行业几百亿,我们团队几十个人,我们专利多少个,投资人一听可以,给你们了。你要跟它讲具体的,你说每一个行业这个流怎么来,那个流怎么来,他绝对不会投你。所以遇到了问题,用什么样的评价方法可以把大数据产业评价出来?
所以,以往的评价方法都是不合适的,这里给我们形成了一个新的机会,有困难的地方就有机会。什么样的机会呢?我们提一个自己的方法,这个个方法叫做产业技术创新力评价。这个评价怎么创造它?
有三个方式,第一个是产业的结构是不是完整,只要有块就行,看它每一个块的功能评价。那么看看它的企业有没有领军的,例如中国的百度行不行,怎么评?看一看谷歌就可以了,所以这么一评价,我们就有了三个纬度。第一个纬度是产业链的完整性。第二个是产业的成熟度。第三个是产业行业。在产业的成熟度和完整性里面看到了一个闭环——产业链分析,从数据的采集、处理、存储、运输、应用,然后产生新的数据。
中国的大数据产业在全球的比较
可以看到在全世界来讲,就我们无论中国也好、美国也好,可以看到全世界的模式或者大数据产业的动态是什么?大数据产业的产业链结构是迅速变化的,这种迅速变化意味着什么?就是我们所有成熟的产业的产业链是不轻易变化的,它能够变化的是企业之间的位置。
所以产业链要迅速变化的时候有一个特征,产业处于发展初期。这跟我们很多的业人士的判断是一样的,之所以不成熟还有一个表现,就是所有大数据产业范围内无论是BI还是数据采集、数据分析建模都没有一个统一标准的主导创新模式。它不像说汽车,假如说汽车行业要么就是后驱要么是前驱,你不可能提出第三套框架把整个颠覆。那么大数据有没有主导设计?今天永洪做的BI,明天可能就被别人颠覆了,所以每一个企业都有危机性。
第二,产业的开放性。因为大数据跟IT,跟信息技术,跟网络技术是密切融合的,那么它融合的特征就是,我们可以不断的向任何一个产业,只要是有信息、网络的地方都可以去渗入,这就是它的第二个特征。
第三个特征,我们现在可以看到真正影响大数据产业发展的是谁?是中小企业还是龙头企业?我们在国内应该感受很明显,BAT在国内的发展非常厉害,所以可以看到在国内BAT的影响力是非常大的,所以我们在中国的市场中可以看到中国市场第三个特征,或者我们这里比较显著的特征是BAT的谱系企业已经形成了三个网,这三个网之外没有其他什么的企业,甚至说有,要么被它并购,要么被它打跨,基本上没有第四个。
另外可以看到国内的大数据产业,其实有很多的创新的技术员还是在外面的。另外,我们现在的发展模式,实际上我们是一种“快”模式,任何一个事提出一个想法,然后几个亿砸进去,迅速的铺开,然后ABC融资,然后上市。现在这种企业到处都是,在2014年最火的时候,只需要10分钟就谈走了十几亿的投资,这就是我们在中国的大数据产业的快模式。
再者,我们可以看到如果我们把中国的跟全球的企业进行比较,特别是跟美国的大数据产业进行比较的话,我们可以发现以下问题。
第一,我们中国的企业很多时候是很短势的。我们的企业更在乎的是我们的资金回报率,在乎的是我们怎么尽快的赚钱,更加在乎的是什么时候能够把我的本捞回来。你看国外的企业,它所选择的对象和目标,例如特斯拉的,他要造一个光速的高铁,在中国来看就是高铁,这种光速是什么效果?可能你在这头是一个人,到那头什么都没有,这种想法中国人有吗?你会拿几亿美金研究这个吗?肯定没有。还有谷歌做公司的时候会怎么做,它选择的是购买一个团队,购买一个技术,购买一个方向,所以我们可以看到大家在比较的时候,特别是进行企业比较的时候会发现这种落差是非常巨大的。
第二,在我们中国的市场跟美国和全球,特别是美国市场正好是颠倒的。在中国卖得都是软件,在美国卖得都是服务,它的软件只是服务之中的一个环节,所以为什么两个大市场能够产生这么大的差异,这跟我们市场的发育程度,跟市场,跟消费者的接受程度都是密切相关的。
中国应该怎样应对大数据
在全球比较中,我们真正能够影响或者下一步发展过程中怎么去做,怎么去思考,怎么去应对大数据,我们在这里想提三方面:1.政府。这个图是最近比较火的,如果说大数据产业真的发展起来,这真的能够同时达到国富和民强的产业,这个产业如果说老百姓不受益,国家肯定发展不起来,国家发展起来,肯定是依靠老百姓,这个产业是具有这个特征的。
2.智能社会。今天很多人都会做这各环节,我们BI就是做智能社会最典型的一个环节,我感觉做BI的时候很重要的一个问题就是两端,一端是怎么采集数据,一端是数据怎么支撑决策。而我们现在做的BI恰恰是在做中间,如果数据不准,你后面分析用什么用,如果你的分析出来不能提供决策方向,那你分析有什么用,所以我们现在做BI有很大的发展空间。
3.投资。现在我们的投资太多了,是一件好事,也是一件坏事,好事就是你有想法就可以去做。坏事是投资人给你带来很多点子,作为职业导师去引导你赚钱。实际上三言两语把你最初的技术梦想变成了一个生意梦想。
所以我们真正在中国,或者是我们比较中国和美国的时候,包括比较中国各个区域的时候可以发现实际上真正的大数据企业有两类,一类是做生意的,一类是做事业的。所以在大数据的趋势上,真正的第一个蓝海市场是数据源,谁把握的数据,谁就把握了蓝海优势,现在我们列出了所有的几个核心东西没有一个是中国的,所以我们的本土企业这在块是非常急待发展的。第二,模型。中国在模型上基本上是延续数据源的发展规则,我们仍然没有什么自己的东西。美国的思维、美国的方式到中国有一些水土不服,中国的独特的市场环境需要一种新的分析模型。第三个是决策。决策是一个完全的红海地区,在这方面大家竞争非常方面。第四,增值服务。增值服务是我们未来更是比红海还要竞争激烈的地方,因为这个地方直接决定着你未来是否拿到融资,还是你能够真正的获得用户。所以我们可以看到,你到底能够给客户,给你的用户创造多大的价值,这是真正决定未来企业发展的决定性要素。
最后做一个总结,我们回过头来看什么是大数据产业,从学科到技术到市场,基本上可以用3点说完。1.从市场上来看,我们有大量的资源,中国13亿人,每人每天发一条短信就是13亿条,我们的数据资源极其庞大。庞大的数据资源需要有庞大的数据库,数据库需要存储,我们的存储技术、读取技术、计算技术不行,比如说现在读取100G的数据需要多久,如果你读取一个PB,读取一个ZB的时候大概要多久,我们无法想象。我们用中国的银河号来算的话,你读一个ZB,也是按小时来计的。
2.分析的作用很显著的商业作用就是预测,无论你是做企业经营还是做政府决策,或者是做任何东西,大数据最重要的问题是通过关联分析做出决策,做出决策意味着因果的第二种表示,我们强调有什么因有关什么果,大数据通过相关性和趋势判断未来可能有这种果,你不需要问有什么因,这就是预测的价值。
3.预测需要的一个基础就是我们能够享受云计算,云的计算的基础就是我们的软件,软件的目的是为了服务,服务就在于在互联网之中实现一种互动,最后形成一个解决方案。从这里可以看到,我们现在最强的就在两端。第一,资源非常丰富。第二,决策能力发达,中间环节很弱。换句话说,假如说中国没有大数据,我们仍然可以发展,这就是我们的现状。
最后,我们清醒一下,大家都感觉大数据非常好,实际有没有进入大数据时代,有不同的声音。换句话说我们可以炒概念,可以获得资本,但是不是你说大数据就是大数据,希望大家有一个清醒的认识。最后感谢永洪的邀请给我这么一个机会。非常感谢大家,谢谢。
永洪BI
更敏捷、更快速、更强大