《Yonghong AI与Yonghong Reporting产品正式发布》——永洪科技高级副总裁王桐
2017.11.23 / View:今天会发布两个新的产品,可能还有AI产品。今天有很多来自全国各地的好朋友,感谢大家抽出时间参加我们的大会,所以我们今天是想尽量多的准备干货内容。随着刚才讲到我们核心的产品,随着7.5的发布,我们在AI方面也比以前得到了比较大的增强。以前AI的部分可能在我们整个核心产品套件里还只能是一个模块,但是随着7.5的发布,包括未来我们对它一系列进一步增强的规划,它已经可以独立成为一个产品了,而不简单只是一个模块。所以今天我们把它单独剥离出来,准备打造一款新的重磅级产品,在今天我们会单独的拿出来做一个发布,还有Reporting的发布。
客户要想真正让数据创造价值,取得业务上的增长和管理上的提升,其实好的平台,切合业务实际的场景,还有好的服务支撑和数据化运营的最佳实践,四个要素缺一不可,AI深度分析就像下面的文字一样,是处在平台中的其中一个很重要的组成部分。
说到AI,对于当今的行业,目前AI无论是资本圈还是企业服务圈是最火的概念,可以这样的总结AI行业的现状,资本疯狂、百花齐放,所谓的资本疯狂就是今年投融资的数据角度,我们可以看到有非常多的资本商流入,都是流入到了AI方向的创业团队中,我们也可以看到,无论是做算法的还是平台或者芯片的,还是做某一个垂直领域的具体应用的,AI的公司实际上也是百花齐放,越来越多,所以整个行业是非常火热的,这是今天AI行业的现状。
但是,有的公司无论是自身的业务发展,还是它整个提供的解决方案落地程度,做得还是相当不错的,可以看到同样更多的公司或者是相关的产品,实际上它对于落地的场景结合做的不是那么优秀,所以在这个领域还存在巨大的改进空间。我记得甲子光年提到了甲方的客户也在抱怨,当AI公司跟他说我可以让你的电梯通过AI的算法预测什么时候故障,但实际上并没有见过所谓的机床和电梯设备,并没有亲自做过操作和研究,他根本不知道传感器装在什么地方,这个时候落地场景是无从谈起的,所以说AI行业的现状是现在非常的火热,但是真正说到落地,还没有那么多落地的场景和案例可以供我们参考和探寻,这个就是AI行业的现状。
我们永洪科技肯定希望作出新的产品或者新的解决方案和能力不光是追一个所谓热点,而是真正把前沿的理论和技术结合业务和场景真正能把落地这个事情做好,我们就做了一个分析,要想让AI能够落地,里面的关键要素是什么,我们总结三个关键词,易用、场景、效率。
易用,无论我的算法有多复杂,我训练模型的过程有多专业,但是最终它要想跟业务管理相结合,让终端客户使用起来的时候,这个时候体验必须是非常易用的。不需要我的终端客户也对AI的相关技术和知识有足够的了解才能使用,因为如果是那样,其实它是非常难落地的,学习和上手的门槛本身就会成为我落地的阻碍,所以易用是第一个非常重要的关键要素。
场景,如果友好的技术和算法,但是没有足够好的场景去很好的嵌入到企业的业务里,AI的算法其实还是实验室的数学层面的理论,并没有跟企业的生产业务绩效经营结合起来,没有为企业创造价值,这个道理跟BI和其他的技术道理都是一样的,所以必须有同样能够驱动企业业务增长好的场景去深度的结合嵌入起来,才能让AI得到比较好的落地效果实现。
效率,效率可以有几个不同理解的方面,我记得安防领域人脸识别非常火,咱们国家在安防领域投入的预算是非常巨大的,安防领域里人脸识别很火,对抓捕嫌疑人,对过去用人工的方式监控画面来讲,会有几十倍的效率提升,这个是非常重要的。但是,在这个过程中,其实因为人脸识别的算法准确度也有一定的差异,有的客户会说有的算法嫌疑人识别率在非比赛的环境,因为比赛的环境都是比较简单,真实街道有的算法识别率只能到10%,意味着我出14警只有一次可以抓对人,市民满意度肯定不好,跟市政府的宗旨是违背的。出一次警花的人力和时间也都是非常巨大的,这种情况效率是不能令人满意的,所以算法的效率是不合格的,他们就不会去使用这样的产品。但是有的算法可以达到40%的准确率,也就是说出两次警就可以抓对一次人,效率是AI的落地,客户也非常看重。
另一个方面,如果做AI的落地,中间需要等待的时间或者花费的计算能力等等,如果花费的非常巨大,导致效率比较低下,让结果的生成比较滞后,客户也不会用这样的产品和服务,因为它和业务的结合没有起到很好的效果。
所以易用、场景和效率是我们经过大量研究和分析总结AI落地的关键要素。
关键点来了,既然我们知道了一个可落地好的AI产品需要遵循这三个关键要素,从永洪科技的角度来讲,我们应该怎么去做属于我们的AI产品方案和服务?所以在这方面我们花了很多心思充分考虑一切围绕落地为原则怎么样展开我们的AI产品设计。
首先,要把主流的常用的机器学习算法内嵌进来,在效率易用上让数据科学家或者分析师通过刚才威廉展示的界面,通过可视化配置工作流方式非常容易的构建、训练以及评价他做好的数据模型,当他从理论达到工程化的方式就可以真正投入生产,做实际运算分析。
第二点,刚才的短片里,我们可以看到一方面最终的业务用户其实可以完全不懂什么是BI和AI,他只要把他看得懂得几个关键词,我们专业知道是字段术语,只要把数据象拖拽,BI的结果就出来了,分析的结果也出来了,对于AI也是一样,对于业务用户来讲,第一步模型已经训练完毕,可以去真正使用的时候,业务用户可以直接把模型拖拽到页面上,把自己要预测的指标放上去,它需要的结果就出来了,大家可以通过场景很好的使用算法和模型,他根本不需要懂算法和模型背后的原理是什么,无论他是做预测和决策或者聚类分类都可以用,这同样是易用角度让我们在这方面进行发力。
刚才提到了基于分布式的AI计算引擎,这是我们的老本行也是强项,基于海量的数据,可以快速的完成模型的学习和真正投入到业务场景中模型计算的过程,也就是训练模型的速度比较快,当我真正使用起来,它跟我们的BI一样可以做到非常快速的响应。我们就是通过这样的一些方式和功能,让我们可以把易用场景效率真正的做好,把AI做成真正的落地产品。
业务用户把做好的算法拖拽到图表上,把相关的字段放进去,全部是可视化的配置方式,就可以做用户的聚类,比如用户分为高中低不同价值的,还有对他一些关键指标做预测,如果他是销售可以对销量做预测,如果是供应链可以对库存做预测,我们可以看到最右面不同颜色的值。
我们的思考是,为什么要把这个事情多做一步,让业务用户也可以轻松上手,为什么让他轻松上手是如此重要?我们是这样考虑的,一定要让业务用户能够对AI这个事情像BI一样轻松上手,因为落地的场景是诞生于业务和能力两者的结合的,既要有很深刻的行业的理解,又要有很好的知道怎么解决这些业务问题的能力,也就是所谓的专业和技术上的理解,也就是对AI的理解,这两者是缺一不可的,如果缺了业务,光有技术和能力,其实是没有好的落地场景的,但是很懂业务不知道用什么算法模型解决,这个场景还是诞生不了,业务和能力是缺一不可的。
谁是最懂业务的人?虽然在我们永洪,包括业界很多的客户和合作伙伴大家都有很多的专家,很懂我们客户的业务,不管他是什么行业和领域,但是我们这批人人数合起来,一定是九牛一毛的,在整个商业社会里,海量的非常深度的理解各个行业的业务,一定是客户自己的业务员,从数量上他们是占绝对优势,并且深度上不一定比所有的乙方专家差,甲方的客户业务人员是最懂业务的,所以我们要做的以及我们做的就是降低门槛,让懂业务的客户业务用户们可以去轻松的驾驭AI的能力,就像我们过去让他轻松的驾驭了BI的能力一样。以前他就懂业务,现在他也不懂太懂AI的算法背后的知识,只要能轻松的驾驭,业务和能力就结合起来,落地场景就诞生了。
今天下午在分会场二,我们就会做一些AI的落地场景的展示。
刚才我们也提到了,我们把AI的性能做了很大的提升,做的很多的工作,其实无论是我们在去年还是前年,包括在今年,我们始终都在提性能,这个词可能离我们的业务用户有点远,但是为什么我们还是不厌其烦的老提?为什么看不见的性能永远都这么重要?因为只要我的性能足够强大,意味着我可以极大的提升平台的运算速度,可以在单位时间之内让我的模型多迭代N次,一个模型要不断的做参数尝试调优,观察结果再调整稳定的模型,这是很多实验迭代的过程,一个模型可能要经过几十次甚至几百次的迭代才能投入使用,但是在今天各个行业都竞争如此激烈的社会里,我们对时间的等待耐心是非常薄弱的,如果在单位时间之内,原来我迭代一次的模型现在我能够迭代五次,因为我的计算性能提升了五倍,也就是说,原来三个月训练的模型现在我只要短短的几个星期就可能实现了,是只用原来五分之一的时间,所以可以让我们在今天的商业社会借助AI的能力更快的往前前进。
我们也知道因为受限于以前计算引擎的瓶颈,我们做数据挖掘的探索之前,先要做采样,先要做抽样,为什么要做抽样?就是因为我没有办法拿全量的数据来去做我的实验的对象,我需要抽取10%或者是不大的比例来把它作为样本训练我的模型,等训练好了以后应用到实际全部数据中,但是很多的数据科学家也谈到,这个时候对于算法一定还是有一定的影响的。如果我们的平台性能足够好,我们就可以尽可能的去用全量数据作为样本进行训练和实验,这样得到的结果一定是会提高你原来模型的精度,会让你的预测更加准确,分类更加的合理。
总结我们AI的产品核心优势,就可以提到一站式分析数据,让业务用户和数据分析师都能简单的上手。有分布式的AI计算,去极大的提升模型的训练和应用的效率和效果,还有算法的全面升级,我们把更多常用的,尤其是比较新潮的算法加入到了我们的平台中,这样也方便了数据分析师们的工作应用性。
从简单易用的角度来讲,我们做到了业务用户轻松上手,我们自身就已经在这个事情上取得了很多受益,因为除了我们自己的专家,很多的用户也在源源不断的给我们贡献更多更好的想法,更多更好的AI落地场景的构想,比如说我之前跟一个制造业做生产部门的用户聊天,我们跟他提到现在我们除了BI和BIG DATA,AI我们都有了,可以有机的整合起来,现在也有AI的技术可以给您使用,这个用户就问了我几个问题,第一个问题,你说的东西是不是意味着如果通过BI的决策分析,如果有我哪些良品率低于正常值,除了在BI里可以溯源到他是哪个批次生产的,还可以通过AI把数据采集下来,可以知道这批货哪天生产的,哪个设备生产的,能知道生产当天设备的参数,这个参数集合和平时有什么不同,慢慢就可以帮我训练模型,可以知道参数的最佳模型。又问了另一个问题,如果他安摄象头做人脸识别工作,我们知道AI也在链条里占的位置不一样,比如人脸识别一方面自己既是大脑,又是一个数据源的获取,因为他最终识别出来的结果可以把视频分析数据转换成结构化用户的ID,包括他的使用标签,比如他是不是戴帽子和眼镜,这些都可以变成结构化的数据作为标签存在库里。用户问我,如果我上了一个人脸识别监控我的厂房,监控我的生产过程,然后我发现有人去做了一些违规的动作,发现有人进了他不该进入的区域,我就可以识别出来报警,但是光有AI我只能知道谁什么时间进入了禁止进入的区域,但是我除了去对他做惩罚,我还没有其他的延续性的动作可以做,并不能让企业的管理得到提升。现在是不是我识别出来他是谁以后,我到BI里可以找到这个用户在HR系统里的员工数据,看看他入职时长,给他做入职培训HR是谁,还有新员工入职培训的过程是不是有漏洞和缺失,导致这个事情的发生,我说可以这样,如果这样做,一次的事件就可以变成企业管理的一套制度,结合起来,让你以后不发生类似的事情。这些都是我们用户很懂业务。我们有一批专家懂业务,但是我们更多的专家还是懂我们的专业,这两者很好的结合起来,会诞生海量的AI落地场景,这是为什么再次强调让业务用户可以轻松上手,这个是永洪设计产品非常深层次的考虑。
另外一块是Reporting部分,在Reporting部分我们可以看到,其实它也是在整个平台的架构图里,也是在平台里面,是我们一站式数据应用平台的另一个组成部分,我们知道其实很多用户都觉得报表肯定就是一些中小企业的需求,但实际上这个说法是没有错的,但同时我们也看到非常多的一些大型的客户,无论他是监管的需求还是使用习惯的要求,还需要中国复杂式报表的需求,这个需求不光是中小企业有,大型企业也有,为了更好的支持中国式复杂报表,一些固定样式的报表和相关的填报,我们就发布了Reporting子产品,一方面跟我们的BI一样,界面很简洁,功能很全面,很容易跟OA或者门户第三方软件进行相应的集成,底层可以基于原先的MPP的数据集式做分布式的计算,可以提高海量计算的能,也有很好的扩展,报表跟BI和AI都可以进行联动,双击报表上的数据我BI的图表跟AI的图表会一起随时联动。
首先这是报表的设计界面,对制表人的上手不会有额外的学习门槛,所以在这里我们同样考虑轻松易用非常重要的这个事情,保证它的落地。除了在我们自己的界面里,用类Excel表格方式编辑报表,我们业务用户最传统用的是excel表格,我们可以无失真导入excel表格,完全保留所有公式,报表制作工作更加方便。
我可以跟门户和OA还有其他的办公系统做很好的集成,当然,它跟我们的BI、MPP和AI天生就是集成在一起的。
性能,因为它的底层同样是用我们的MPP数据集市,我们的内存储、分布式计算、分布式通讯、库内计算,过去的强项同样可以应用在Reporting里面,随着7.5的发布,MPP性能也就进一步的增强。
因为报表里都是一个单元格的拆开的,中国式复杂报表,最头疼的问题就是每一个格子的计算公式和逻辑都不一样,要不然不会称之为中国式复杂报表,可能并不是简单地用行和列表头就可以组织起来,并不是一个交叉表,所以在这里面需要有很多的预解析工作,来去把优先计算的事情做好,这样就可以把重复的运算规避掉,重复的影射规避掉,取得更好的性能。
对于报表来讲,很多时候我们做上报或者汇报,除了把电子版的报送,我们还要打印出来,去作为一些备案归档,或者开会进行使用,所以我们在打印方面也是做了精准打印的增强,在不同分栏的要求和打印格式要求我们都做了很好的实现。
报表和数据源都是系统里缺失的数据,需要业务人员手工填报,所以我们可以让业务人员自定义填报报表的样式,把数据直接录入数据库,可以通过在线页面做填报工作,也可以用excel做离线填报工作。
在咱们中国式的填报里,很重要的就是流程,很多的用户也说我填的数据不准或者我要对它进行审核才能真正的入库,这个时候就需要一些审批的过程,我们填报可以用流程化的方式做填报数据的审批,审批完成以后才能真正的进行入库。
功能上就讲这么多,因为这毕竟是一个大家比较熟悉的领域和需求,但是这里面其实还是想提一个我们需要更深层次思考的问题,报表真的这么简单吗?为什么问这个问题?因为我跟很多的客户和合作伙伴交流的时候,我发现大家一旦听到我们要做一个报表的功能,大家都是觉得很不屑,或者大家觉得很不能理解,觉得为什么还要花时间做一个相对比较低端的功能?报表不是多少年前有非常常见了吗?为什么不继续的做更前沿花哨的功能?我们会发现,报表并不只是把样式和报送做好了就可以,报表也不是很简单的,我们发现很多的企业里已经做了几百张报表了,但是数据依然没有驱动业务增长,这个道理是一样的,可能他做几百张报表或者做了几百张探索式分析的页面,或者做了很好的数据治理和数仓,但就是没有实现数据的价值变现,没有看到数据对业务增长带来的实际促进作用,这个是为什么?很多的人也在问为什么。后来我们也问客户一个问题,就是你有几百张报表,他们之间的逻辑关系清晰吗?你会每天真的把几百张都看?两个答案都是NO,那数据做出来和你的业务也没有实际的关系。在今天下午的分会场1,我们会把如何构建成体系的数据应用,让数据驱动业务增长真正得到落地,我们会把它实现方法给大家完整剖析。
我这部分内容基本结束,最后总结,我们一开始发布了AI的产品,后来发布了Reporting产品,AI是这个行业最前沿的东西,而Reporting报表其实是行业比较原始的东西,好象是两个极端,在今天的场合我发布两个极端的产品,意味着什么?我们总结,这两个产品的发布,意味着永洪已经可以变成真正的全企业一站式数据智能解决方案提供商,所谓全企业,无论是大型企业或者中型企业BI和AI需求我们可以满足以外,中小企业简单的填报报表需求我们也可以满足,我们可以大中小企业全部覆盖。一站式的数据智能,简称AI+BI+BIG DATA,他们天生就是很好的结合,单纯的AI要去找一些落地的场景相对比较局限,但是跟BI,跟企业原来数据分析的体系结合起来以后,能做的事情就非常多了。在今天我们就可以说,我们其实做到了全企业的一站式数据智能的解决方案提供商,这是我们接下来想为客户和合作伙伴提供的能力的输出,去帮到大家,让数据的价值真正的发挥出来。
永洪BI
更敏捷、更快速、更强大