我们知道不论何时在选择供应商时,都应对相应的产品和服务的基础知识和行业情况有所了解,才能在选择供应商时不踩坑或者较低踩坑概率,今天给大家分享一些关于
bi大数据分析平台选型时需要了解到的一些知识,主要从大数据分析平台架构以及大数据分析底层技术来讲解。
bi大数据分析平台架构
市场上常见的bi大数据分析平台主流的系统架构有B/S、C/S架构,实际上两种架构都能实现同样的业务处理,相信很多人在做bi选型时都会遇到系统架构如何选择这个问题,实际上两种架构都各有优缺点,下面我们做简单阐述以供参考:
B/S优缺点:客户端零维护、扩展简单方便、开发简单、共享性强;但个性化定制差、后台数据压力大、安全性和速度上要进行特定优化
C/S优缺点:响应快、能满足客户的个性化需求、能实现复杂的业务流程、对数据安全掌控能力强;但兼容性差、需要专门的客户端安装程序、开发维护成本高。
B/S和C/S现状与趋势
1、用来编制CS管理软件的编程语言,早已江河日下
2、市面上CS的管理软件正越来越少
3、CS管理软件应用不如BS方便
4、CS管理软件不如BS更能应对未来挑战
大数据架构底层技术
数据收集模块:主要负责收集各种数据源的数据,包括日志文件、网络请求、数据库、消息队列等,并将这些数据转换为文件或者消息向后传递。
数据转存模块:主要负责将数据定时传递到分布式存储或者实时传递给下游的数据处理程序。
ETL模块:主要负责数据的清洗、格式和内容的处理和转换、数据分级分拣、加载至数据仓库等。
数据仓库模块:这是整个架构的核心,数据仓库是数据有组织的集中存储的地方,负责数据的存取和管理。
元数据管理模块:主要负责记录和约束数据仓库中数据的含义和格式,控制着数据的生命周期和数据质量。
分析引擎模块:数据分析师交互最多的模块,主要负责执行各种分析语句或代码,完成各种分析任务。
作业管理与调度模块:负责分析作业的管理和定时调度,包括作业的增删改查、查看修改历史、设置调度定时和执行引擎等。
资源分配与调度模块:主要负责在多作业同时运行的场景下,有效协调和分配集群的资源,使资源利用率最大化。
以上我们从bi大数据分析平台架构及平台技术做了整体的了解,相信对企业后续的bi选型也会有一定帮助。