分类的目的是为了寻找决策边界,会输出离散数据,评价方法是精准度(accuracy)和混淆矩阵。
分类是一个有监督的学习过程,目标数据库中有些类别是已知的,分类过程需要做的就是把每一条记录归到对应的类别之中。由于必须事先知道各个类别的信息,并且所有待分类的数据条目都默认有对应的类别,因此分类算法也有其局限性。
应用场景:
•判断邮件是否为垃圾邮件
•判断在线交易是否存在潜在风险
•判断肿瘤为良性还是恶性等等
产品支持的分类包含逻辑回归、决策树多分类、决策树二分类、XGBoost二分类、XGBoost多分类、LightGBM二分类、LightGBM多分类。
案例可以参考电信类客户流失和银行电话营销。