<< Click to Display Table of Contents >> 线性回归复制链接 |
1.概述
线性回归属于监督学习,主要解决回归预测问题。
➢例如:线性回归可以用于预测客流量。
输入:1个数据集。
输出:模型、真实值与预测值对比图(训练集)、真实值与预测值对比图(验证集)、模型系数(Regression coefficient、Standard error、P-value、T-value、置信区间)、训练集性能指标(MSE、RMSE、MAE、EVS、R2、Adjusted R2)、验证集性能指标(MSE、RMSE、MAE、EVS、R2、Adjusted R2)。
2.配置方法
将线性回归节点添加到实验后,可通过右侧的“配置项目”页面,对线性回归节点进行设置。
2.1参数列表
【使用集群】选择true时,算子使用分布式集群运行,选择false时单机运行,默认为false。集群运行需要在集群环境下才能生效。
【自动调参】自动调参取值为true时,模型自动进行超参数优化,取值为false时,需要手动调参。
【训练集占比】通常训练集在整个数据集的占比为0.8,剩下的作为验证集,参数取值必须在0-1之间的小数。
2.2选择变量
特征列:选择模型训练的特征字段,至少选择一个字段。
目标列:选择模型预测的目标字段,只能选择一个字段。
选择数据页面操作见插件节点>选择数据。
3.查看结果
可通过连接多视图节点查看结果或连接表格视图来查看模型系数和性能指标。连接图片视图来查看真实值与预测值对比。也可连接保存为训练模型节点,将模型保存为操作节点后再次使用。
评估指标可以通过说明进行了解。