<< Click to Display Table of Contents >> 逻辑回归复制链接 |
1.概述
逻辑回归属于监督学习,主要解决二分类问题。
➢例如:逻辑回归可以用于客户流失预测。
输入:1个数据集。
输出:逻辑回归模型,ROC曲线,训练集性能指标(类别、准确率、召回率、F1-score、支持样本量)、验证集性能指标(类别、准确率、召回率、F1-score、支持样本量)等。
➢注意:
逻辑回归对异常值比较敏感,对于非线性特征需要转换,连续值需要离散化处理(量纲不一致情况下)。
2.配置方法
将逻辑回归节点添加到实验后,可通过右侧的“配置项目”页面,对逻辑回归节点进行设置。
2.1参数列表
【使用集群】选择true时,算子使用分布式集群运行,选择false时单机运行,默认为false。集群运行需要在集群环境下才能生效。
【自动调参】自动调参取值为true时,模型自动进行超参数优化,取值为false时,需要手动调参。
【正例标签】请填写1或者目标列中的正例标签(整数或者文本型),填写1时,默认1为正例,并且目标列中只有{0,1}或者{-1,1}。
【训练集占比】通常训练集在整个数据集的占比为0.8,剩下的作为验证集,参数取值必须在0-1之间的小数。
【优化器】用于优化系统参数,对应的优化算法有以下七种:
•newton指Newton-Raphson算法。
•bfgs指Broyden-Fletcher-Goldfarb-Shanno(BFGS)算法。
•lbfgs指limited-memoryBFGS算法。
•powell指改进版Powell算法。
•cg指 conjugate gradient算法。
•ncg指Newton-conjugate gradient算法。
•basinhopping指basin-hopping算法。
2.2选择变量
特征列:选择模型训练的特征字段,可以为多列,至少选择一个字段。
目标列:选择模型预测的目标字段,只能选择一个有分类属性的数据。
选择数据页面操作见插件节点>选择数据。
3.查看结果
可通过连接多视图节点查看结果或连接表格视图来查看模型系数、训练集性能指标(准确率、召回率、F1-score)、验证集性能指标(准确率、召回率、F1-score),连接图片视图来查看ROC曲线。
其中准确率、召回率、F1-score的取值范围为[0,1],当数值越接近1说明模型表现越好。
也可连接保存为训练模型节点,将模型保存为操作节点后再次使用。