逻辑回归

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 实验功能使用 > 节点 > 算法 > 分类 

逻辑回归

复制链接

1.概述

逻辑回归属于监督学习,主要解决二分类问题。

例如:逻辑回归可以用于客户流失预测。

输入:1个数据集。

输出:逻辑回归模型,ROC曲线,训练集性能指标(类别、准确率、召回率、F1-score、支持样本量)、验证集性能指标(类别、准确率、召回率、F1-score、支持样本量)等。

注意:

逻辑回归对异常值比较敏感,对于非线性特征需要转换,连续值需要离散化处理(量纲不一致情况下)。

2.配置方法

将逻辑回归节点添加到实验后,可通过右侧的“配置项目”页面,对逻辑回归节点进行设置。

Depthanalysis_LogisticRegression

2.1参数列表

【使用集群】选择true时,算子使用分布式集群运行,选择false时单机运行,默认为false。集群运行需要在集群环境下才能生效。

【自动调参】自动调参取值为true时,模型自动进行超参数优化,取值为false时,需要手动调参。

【正例标签】请填写1或者目标列中的正例标签(整数或者文本型),填写1时,默认1为正例,并且目标列中只有{0,1}或者{-1,1}。

【训练集占比】通常训练集在整个数据集的占比为0.8,剩下的作为验证集,参数取值必须在0-1之间的小数。

【优化器】用于优化系统参数,对应的优化算法有以下七种:

newton指Newton-Raphson算法。

bfgs指Broyden-Fletcher-Goldfarb-Shanno(BFGS)算法。

lbfgs指limited-memoryBFGS算法。

powell指改进版Powell算法。

cg指 conjugate gradient算法。

ncg指Newton-conjugate gradient算法。

basinhopping指basin-hopping算法。

2.2选择变量

特征列:选择模型训练的特征字段,可以为多列,至少选择一个字段。

目标列:选择模型预测的目标字段,只能选择一个有分类属性的数据。

选择数据页面操作见插件节点>选择数据

3.查看结果

可通过连接多视图节点查看结果或连接表格视图来查看模型系数、训练集性能指标(准确率、召回率、F1-score)、验证集性能指标(准确率、召回率、F1-score),连接图片视图来查看ROC曲线。

其中准确率、召回率、F1-score的取值范围为[0,1],当数值越接近1说明模型表现越好。

也可连接保存为训练模型节点,将模型保存为操作节点后再次使用。

Depthanalysis_LogisticRegression1Depthanalysis_LogisticRegression2