<< Click to Display Table of Contents >> 风力发电机功率检测复制链接 |
1.背景介绍
随着科学的发展,电能越来越成为人们重要的能源之一。风力发电机是将风能转换为机械功,机械功带动风力发电机内的转子旋转,最终输出交流电的电力设备。预测风力发电机的发电量可以预先规划用电任务,有效提升工程效率。
2.数据说明
某厂提供了风力发电机工作信息表,每条记录代表发电机的工作情况,共计37803条记录。数据字段描述如下表所示。
字段名称 |
中文名称(单位) |
字段描述 |
数据类型 |
---|---|---|---|
Time |
时间 |
统计发电机工作情况的时间 |
日期型 |
Actual_power |
输出功率(kW) |
统计时的发电功率 |
数值型 |
Windspeed |
风速(m/s) |
统计时的风速 |
|
Theo_power |
理论功率(KWh) |
统计时发电机的理论功率 |
|
Wind_direction |
风向(°) |
统计时的风向(360°制) |
3.方案介绍
首先,根据项目背景介绍,整个问题是一个预测风力发电机发电功率的问题,可以将其抽象为一个回归问题,数据集中的输出功率字段,就是建模采用的目标值。
决策树回归是一种常用的机器学习算法,它可以用于解决回归问题。决策树回归算法构建一棵决策树,将特征空间划分为一系列的矩形区域,并对每个矩形区域内的样本进行回归预测。
4.方案分析
数据预处理:类似缺失值填充、归一化、去重等对数据直接进行处理的操作被称为数据预处理。数据预处理拥有加速模型的训练速度、提高模型训练准确度、防止误差数据影响模型的训练效果、防止空数据影响模型正常训练等优点。
参数配置:按需求填写参数值。
字段选择:如前所述,有监督算法需要指定自变量字段和因变量字段。点击特征列和目标列下方的选择数据按钮。再弹出的字段列表中选择相应的字段。
5.结果说明
当前项目的工作流,决策树回归算子将输出模型性能指标、真实值与预测值对比图。
1.模型性能指标:训练集和验证集上的性能指标:MSE、RMSE、MAE、EVS、R2、Adjusted R2。其中MSE、RMSE、MAE是不同计算方式下的误差指标,越接近0越好;EVS、R2和Adjusted R2取值都属于[0,1]中,且数值越大越好。
2.真实值与预测值对比图:用于直观地观察真实值与预测值的分布情况。
3.特征重要性直方图:特征重要性展现了每个自变量(特征)对于模型的影响大小,并对它们进行降序排列,使得研究者能够直观便捷的了解每个特征在模型中发挥作用的大小。
4.平行坐标图:平行坐标图是一种通用的可视化方法,能够用于探索高维或多元数据的分布情况。颜色的深浅代表了数据分布情况,颜色越深代表该区间上的数据分布越多。
5.决策树可视化:决策树可视化可用于观察不同层结点优先级别、损失、分类样本数以及分类打分等,是直观表现模型分类过程及其性能好坏的可视化工具。