深度分析 > 实验功能使用 > 节点 > 算法 > 分类

1.概述

逻辑回归属于监督学习，主要解决二分类问题。

➢例如：逻辑回归可以用于客户流失预测。

输入：1个数据集。

输出：逻辑回归模型，ROC曲线，训练集性能指标（类别、准确率、召回率、F1-score、支持样本量）、验证集性能指标（类别、准确率、召回率、F1-score、支持样本量）等。

➢注意：

逻辑回归对异常值比较敏感，对于非线性特征需要转换，连续值需要离散化处理（量纲不一致情况下）。

2.配置方法

将逻辑回归节点添加到实验后，可通过右侧的“配置项目”页面，对逻辑回归节点进行设置。

Depthanalysis_LogisticRegression

2.1参数列表

【使用集群】选择true时，算子使用分布式集群运行，选择false时单机运行，默认为false。集群运行需要在集群环境下才能生效。

【自动调参】自动调参取值为true时，模型自动进行超参数优化，取值为false时，需要手动调参。

【正例标签】请填写1或者目标列中的正例标签（整数或者文本型），填写1时，默认1为正例，并且目标列中只有{0,1}或者{-1,1}。

【训练集占比】通常训练集在整个数据集的占比为0.8，剩下的作为验证集，参数取值必须在0-1之间的小数。

【优化器】用于优化系统参数，对应的优化算法有以下七种：

•newton指Newton-Raphson算法。

•bfgs指Broyden-Fletcher-Goldfarb-Shanno(BFGS)算法。

•lbfgs指limited-memoryBFGS算法。

•powell指改进版Powell算法。

•cg指 conjugate gradient算法。

•ncg指Newton-conjugate gradient算法。

•basinhopping指basin-hopping算法。

2.2选择变量

特征列：选择模型训练的特征字段，可以为多列，至少选择一个字段。

目标列：选择模型预测的目标字段，只能选择一个有分类属性的数据。

选择数据页面操作见插件节点>选择数据。

3.查看结果

可通过连接多视图节点查看结果或连接表格视图来查看模型系数、训练集性能指标（准确率、召回率、F1-score）、验证集性能指标（准确率、召回率、F1-score），连接图片视图来查看ROC曲线。

其中准确率、召回率、F1-score的取值范围为[0,1]，当数值越接近1说明模型表现越好。

也可连接保存为训练模型节点，将模型保存为操作节点后再次使用。

Depthanalysis_LogisticRegression1