<< Click to Display Table of Contents >> 脚本 |
脚本包含Python脚本、R数据、R绘图、R模型。
❖Python脚本
Python脚本节点可以连接数据节点,输入脚本用于建模,也可以连接Python脚本,进行验证。
拖拽一个数据集连接一个Python脚本节点,选中Python脚本节点设置及展示区只有一个页面:配置项目。
配置Python脚本
•8.5-9.0的接口
Python脚本内置输入、输出变量和系统函数。
输入变量
_input_table_ :pandas.DataFrame类型,为前驱数据集节点的输出数据;
_input_model_ :前驱Python脚本节点向本节点输入的数据,可以使模型对象、list、dict等可序列化任意类型;
输出变量
_output_table_ :pandas.DataFrame类型或dict类型,用于输出数据到表格;
_output_model_ :本节点向所有直接后继Python脚本节点输出的数据,可以是模型对象、list、dict等可序列化任意类型;
_pmml_ :为训练模型的PMML文本内容,作为该模型节点的输出值,与函数to_pmml()配合使用;
_plot_ :matplotlib.pyplot类型,用于输出图片;
系统函数
to_pmml(model,features,target):用于导出训练模型的PMML文本文件,其中model为训练出的模型,features为含有训练集所有特征(自变量)的list,这些特征顺序必须与训练模型时的特征顺序保持一致,target为含有训练集标签字段(因变量)的字符串,该系统函数返回的PMML文本可以赋值给_pmml_,以便传递给后继节点;
•9.1新接口
Python脚本节点的变更:
(1)8.5-9.0的接口仍然兼容,仅能使老版本创建的实验导入到9.1时仍然可以正常运行,但由于不能支持多数据集输入,所以不要在9.1版本新创建的实验中使用9.0及以前的接口;
(2)新API从产品9.1搭配DM-Engine_v1.2使用,脚本可使用python SDK v0.2进行离线编写;
yonghong.script.port 编写自定义python脚本的子工具包,包含两个工具类: EntryPoint:当前脚本节点的输入输出端口 input:本节点的数据输入,访问某个前置节点的某种数据可以这样:entry.input['数据集节点1'][ResourceType.DATAFRAME] 表示 获取“数据集节点1”的输出数据集;
output:本节点的数据输出; dataset: 待输出的数据集 model: 待输出的模型 pmml: 待输出的pmml images: 待输出的png图片数据,使用方法 images.put_image_from_plot("图片名字1",plot)
ResourceType: 输入输出数据的枚举类型,DATAFRAME表示数据集,MODEL表示模型
|
❖R数据
R数据节点只能连接R模型节点,输入脚本把R模型的数据以表格的形式展示出来。
连接一个R模型节点,输入脚本后,选中R数据节点设置及展示区包含四个页面:配置项目、元数据、过滤数据、探索数据。
o配置项目
R数据可以直接引用MODEL变量。也可以通过col[[“xxx”]] 来传入数据集中对应列的值,xxx 为列的名称;也可以通过param[[“xxx”]]来传入参数值,xxx 为参数名称。对于定制脚本,R 将最后执行的代码行的结果作为返回值返回。产品中要求返回值必须是list 对象,包含若干返回值列,如list(out1=a, out2=b),其中out1,out2 为返回值列的名称,而a,b为相应返回值列的取值,可以是常数或向量。
o元数据
请参考数据节点里的介绍。
o过滤数据
请参考数据节点里的介绍。
o探索数据
请参考数据节点里的介绍。
❖R绘图
R绘图节点只能连接R模型节点,输入脚本把R模型的数据以图的形式展示出来。
连接一个R模型节点,输入脚本后,选中R绘图节点设置及展示区包含两个页面:配置项目、结果展示。
o配置项目
输入脚本引用R模型。R绘图可以直接引用MODEL变量。还可引用R脚本来画图。
o结果展示
以图的形式展示R模型的结果。
❖R模型
用户可以使用R模型节点引用任意R package来连接R数据或者R绘图进行分析。
拖拽一个数据集和一个R模型节点到编辑区,连接数据集和R模型节点。选中R模型节点设置及展示区包含一个页面:配置项目。
o配置项目
【脚本】引用R package的脚本,必须将最终结果存入MODEL变量中作为返回值。
点击右上按钮,可弹出脚本输入框更方便的输入。