各省GDP预测

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 案例介绍 

各省GDP预测

复制链接

1.背景介绍

国内生产总值(Gross Domestic Product, GDP)是一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果。GDP是国民经济核算的核心指标,也是衡量一个国家或地区经济状况和发展水平的重要指标。政府在做规划时、必须要了解省市经济情况,根据GDP来判断。如果预先了解GDP的走势,有利于做出战略调整,降低重大风险,因此对GDP的预测十分重要。

2.数据说明

全国公开的各省GDP历年数据提供了全国各省(31个省市)历年的GDP数据,每条记录代表某年某省市的GDP情况,共计29条记录。数据字段描述如下表所示。

字段名称

中文名称(单位)

字段描述

数据类型

Time

时间

统计数据的日期

日期型

Beijing

北京

省市的名称

数值型

...

...

...

...

Yunnan

云南

省市的名称

数值型

3.方案介绍

首先,根据项目背景介绍,整个问题是一个预测各省GDP的问题,可以将其抽象为一个时间序列预测问题,数据集中的各省市名称字段,就是建模采用的目标值。

Holt-Winters 是一种常用的时间序列预测方法,该方法基于指数平滑法,特别适用于具有趋势和季节性的数据的预测。Holt-Winters方法的优点是可以很好地处理季节性变化的数据,并且具有相对简单的计算过程。

4.方案分析

Holt-Winters是一种时间序列预测模型,模型并行地用(时间跨度)和(销售额)两个属性,来计算(销售额)波动与时间的对应关系。

DepthAnalysis__model_workflow_construction3

数据预处理:类似缺失值填充、归一化、去重等对数据直接进行处理的操作被称为数据预处理。数据预处理拥有加速模型的训练速度、提高模型训练准确度、防止误差数据影响模型的训练效果、防止空数据影响模型正常训练等优点。

参数配置:按需求填写参数值。本案例移动平均阶数填写为5,跨度单位选择为Q(季度),其他超参数可进入案例查看。

字段选择:如前所述,时间序列预测算法需要指定时间字段和预测字段。点击时间列和数值列下方的选择数据按钮。再弹出的字段列表中选择相应的字段。

DepthAnalysis__parameter_configuration_and_field_selection_of_the_algorithm3

5.结果说明

当前项目的工作流,Holt-Winters算子将输出模型性能指标、时序分析预测结果图和数据集视图。

1.模型性能指标:训练集上的性能指标:MSE、RMSE、MAE、EVS、R2、Adjusted R2。其中MSE、RMSE、MAE是各种计算方式下的预测损失值,值越小越好;EVS是方差得分,值越接近1越好;R2和Adjusted R2都是评价不同量级下模型效果好坏的指标,值越接近1越好。

DepthAnalysis__training_set_performance_indicators

2.时序分析预测结果图:用于直观地观察当前数据、拟合数据和预测数据的波动情况。

DepthAnalysis__time_series_analysis_and_prediction_result_chart

3.数据集视图:用于直观地展示预测好的数据信息。

DepthAnalysis__dataset_view