作者: 大数据观察来源: 大数据观察时间:2017-05-01 18:40:580
数据挖掘作为深层次的数据信息分析方法,具有传统评价方法无法具备的对于各种因素之间隐 藏的内在联系的全面分析。此技术应用于金融风险管理无疑非常有益,可提供风险预警,让管理者提前做好准备,为决策提供参考信息,因而使企业极大地降低风险 和提高竞争力,为企业的长足发展作出贡献。
金融风险预警是金融数据挖掘中的一个重要研究方向,由于金融数据具有类型多样、关系复 杂、数据动态性、数据量大等一般特征,此外还有高噪音、非 正态等特征。因此,金融风险预警更有挑战性。运用数据挖掘技术能够从海量的金融数据中发现隐藏在其背后的规律,有效地降低金融机构的运营风险。因此数据挖 掘在金融风险预警有着广阔的应用价值和市场前景。
一、金融风险管理
金融风险指任何可能导致企业或机构财物损失的风险,是企业未来收益的不确定性与波动性。 按照金融风险产生根源可将金融风险分为静态与动态两类;按风险涉及 范围可分为微观金融风险与宏观金融风险;按照金融机构类别可分为银行风险、证券风险、保险风险与信托风险等。通过对风险的衡量与认识,采取相应措施与处置 方案使得风险最低和利润最大化。可见,金融风险管理是调节金融投资安全性与收益性均衡的一种金融管理方法。
二、认识数据挖掘
1. 数据挖掘概念
数据挖掘是从大量数据中提取或“挖掘”知识。在大量的数据中发现有趣的模式,其中数据是 可以存放在数据库、数据仓库或其他信息库中。数据挖掘是一个年轻的 跨学科领域,源于诸如数据库系统、数据仓库、统计学、机器学习、数据可视化、信息检索和高性能计算。其他的贡献领域包括神经网络、模式识别、空间数据分 析、图像数据库、信号处理和许多应用领域,如商务、经济学和生物信息学。
2.数据挖掘流程
(1)信息收集:根据确定的数据分析对象,抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库。对于海量数据,选择一个合适的数据存储和管理的数据仓库是至关重要的。
(2)数据集成:把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。
(3)数据规约:如果执行多数的数据挖掘算法,即使是在少量数据上也需要很长的时间,而 做商业运营数据挖掘时数据量往往非常大。数据规约技术可 以用来得到数据集的规约表示,它小得多,但仍然接近于保持原数据的完整性,并且规约后执行数据挖掘结果与规约前执行结果相同或几乎相同。
(4)数据清理:在数据库中的数据有一些是不完整的(有些感兴趣的属性缺少属性值)、含噪声的(包含错误的属性值),并且是不一致的(同样的信息不同的表示方式),因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中。不然,挖掘的结果会差强人意。
(5)数据变换:通过平滑聚集、数据概化、规范化等方式将数据转换成适用于数据挖掘的形式。对于有些实数型数据,通过概念分层和数据的离散化来转换数据也是重要的一步。
(6)数据挖掘过程:根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集,甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。
(7)模式评估:从商业角度,由行业专家来验证数据挖掘结果的正确性。
(8)知识表示:将数据挖掘所得到的分析信息以可视化的方式呈现给用户,或作为新的知识存放在知识库中,供其他应用程序使用。
3. 数据挖掘分析方法。
表2.1 数据挖掘常用分析方法
分析方法 案例应用 基于历史的MBR分析 欺骗行为的侦测、客户反应预测、医学诊疗、反应的归类等方面。 购物篮分析 零售店分析改变置物架上的商品排列或是设计吸引客户的商业套餐等 决策树 利用决策树进行推荐引导等 遗传算法 利用遗传算法解决车间调度问题等 聚类分析 通过分组聚类出具有相似浏览行为的客户,分析客户的共同特征,实施精准营销等 连接分析 电信服务业用连结分析收集到顾客使用电话的时间与频率,进而推断顾客使用偏好为何,提出有利于公司的方案等 OLAP分析 提供对决策人员和高层管理人员的决策支持等 神经网络 机器自我学习、无人驾驶等 判别分析 在气候分类、土地类型划分中有着广泛的应用 罗吉斯回归分析 定量研究满意度与相关变量的关系等
三、数据挖掘在金融风险预警中的应用
1.金融数据挖掘流程
2. 数据挖掘在金融风险预警中典型应用
(1)信用风险评估
数据挖掘对信用风险的评估包括银行信用卡风险评估和贷款信用评估等。信用风险是由于不可 抗拒因素和恶性欺诈等使得债务人无法或不愿意履行已签的合约而给银 行造成的损失。银行对个人和企业的财务状况发生变化的过程往往不能及时了解或者说被循环信用掩盖。而通过数据挖掘技术对客户信用的影响因素进行挖掘,如地 区差异、个人知识层次、收入高低、经济环境状况、社会职务等,可以快速建立起用户信用等级,进而给予不同的信用额度;也可以透彻地揭示信用风险的蕴含关系 和特征,增强对信用违约预测的准确性。
(2)公司财务危机预警分析
财务危机的实质是财务风险规模化、高强度化的集中爆发,主要表现为财务状况极度恶化,发生支付危机甚至破产倒闭。这些公司都不同程度出现以下状况: 无力偿还到期债务、巨额投资无收益、现金流量入不敷出、产品销路不畅、存货大量积压,主营业务发生严重萎缩等。
财务危机预警模型的建立能够对企业经营失败和财务管理失误现象进行预警和早期控制,为决 策者、投资者和债权人提供重要信息。数据挖掘中的主成分分析、 Logistic 回归、线性回归和神经网络等方法被国内外学者用来建立财务危机预警模型。首先根据主成分分析的特征向量与主成分贡献率计算出对于财务状况影响最大的财务指 标,接着根据该分析的结果,把预测期公司的财务状况分为两类作为预测的目标变量,然后运用Logistic回归方法和决策树方法等进行公司财务状况进行预 测。最后把每家公司综合评分作为目标变量,运用线性回归方法和神经网络方法进行公司财务危机预警分析。
(3)供应链风险评估。
良好的供应链管理可通过资金流、物流和信息流的优化为企业带来巨大效益,可以使企业有效 节约运营成本和缩短反应时间,进而使其服务水平和竞争能力得到提 高。供应链中任何一个环节的“断裂”都可能引起链上企业的连锁反应,给企业带来巨大损失。根据行为主体的不同,供应链风险可划分为供应商风险、生产商风 险、物流服务商风险、批发商风险、零售商风险等。
供应商风险作为供应链风险的最大起因,常被选为供应链风险评估的切入点。通常做法有利用数据挖掘算法确定有效的指标评价体系,建立模糊矩阵,进行聚类分析或 BP 神经网络等方法建立供应链金融风险评估模型,为供应链合作伙伴的选择提供依据,降低供应链风险。
永洪BI
更敏捷、更快速、更强大