脚本

<< Click to Display Table of Contents >>

当前位置:  附录 > 界面介绍 > 深度分析界面 > 深度分析编辑页面 > 编辑区 > 节点类型 

脚本

Previous pageReturn to chapter overviewNext page

脚本包含Python脚本、R数据、R绘图、R模型。

 

Python脚本

Python脚本节点可以连接数据节点,输入脚本用于建模,也可以连接Python脚本,进行验证。

拖拽一个数据集连接一个Python脚本节点,选中Python脚本节点设置及展示区只有一个页面:配置项目。

ML143

 

配置Python脚本

 

8.5-9.0的接口

Python脚本内置输入、输出变量和系统函数。

输入变量

_input_table_ :pandas.DataFrame类型,为前驱数据集节点的输出数据;

_input_model_ :前驱Python脚本节点向本节点输入的数据,可以使模型对象、list、dict等可序列化任意类型;

输出变量

_output_table_ :pandas.DataFrame类型或dict类型,用于输出数据到表格;

_output_model_ :本节点向所有直接后继Python脚本节点输出的数据,可以是模型对象、list、dict等可序列化任意类型;

_pmml_ :为训练模型的PMML文本内容,作为该模型节点的输出值,与函数to_pmml()配合使用;

_plot_ :matplotlib.pyplot类型,用于输出图片;

系统函数

to_pmml(model,features,target):用于导出训练模型的PMML文本文件,其中model为训练出的模型,features为含有训练集所有特征(自变量)的list,这些特征顺序必须与训练模型时的特征顺序保持一致,target为含有训练集标签字段(因变量)的字符串,该系统函数返回的PMML文本可以赋值给_pmml_,以便传递给后继节点;

 

9.1新接口

Python脚本节点的变更:

(1)8.5-9.0的接口仍然兼容,仅能使老版本创建的实验导入到9.1时仍然可以正常运行,但由于不能支持多数据集输入,所以不要在9.1版本新创建的实验中使用9.0及以前的接口;

(2)新API从产品9.1搭配DM-Engine_v1.2使用,脚本可使用python SDK v0.2进行离线编写;

 

yonghong.script.port  编写自定义python脚本的子工具包,包含两个工具类:

                   EntryPoint:当前脚本节点的输入输出端口

                             input:本节点的数据输入,访问某个前置节点的某种数据可以这样:entry.input['数据集节点1'][ResourceType.DATAFRAME] 表示

                                   获取“数据集节点1”的输出数据集;

                                                           

                             output:本节点的数据输出;

                                    dataset: 待输出的数据集

                                    model: 待输出的模型

                                    pmml: 待输出的pmml

                                    images: 待输出的png图片数据,使用方法 images.put_image_from_plot("图片名字1",plot)

                                   

                   ResourceType: 输入输出数据的枚举类型,DATAFRAME表示数据集,MODEL表示模型

 

 

R数据

R数据节点只能连接R模型节点,输入脚本把R模型的数据以表格的形式展示出来。

连接一个R模型节点,输入脚本后,选中R数据节点设置及展示区包含四个页面:配置项目、元数据、过滤数据、探索数据。

ML58

o配置项目

R数据可以直接引用MODEL变量。也可以通过col[[“xxx”]] 来传入数据集中对应列的值,xxx 为列的名称;也可以通过param[[“xxx”]]来传入参数值,xxx 为参数名称。对于定制脚本,R 将最后执行的代码行的结果作为返回值返回。产品中要求返回值必须是list 对象,包含若干返回值列,如list(out1=a, out2=b),其中out1,out2 为返回值列的名称,而a,b为相应返回值列的取值,可以是常数或向量。

o元数据

请参考数据节点里的介绍。

o过滤数据

请参考数据节点里的介绍。

o探索数据

请参考数据节点里的介绍。

 

R绘图

R绘图节点只能连接R模型节点,输入脚本把R模型的数据以图的形式展示出来。

连接一个R模型节点,输入脚本后,选中R绘图节点设置及展示区包含两个页面:配置项目、结果展示。

ML59

o配置项目

输入脚本引用R模型。R绘图可以直接引用MODEL变量。还可引用R脚本来画图。

o结果展示

以图的形式展示R模型的结果。

ML60

 

R模型

用户可以使用R模型节点引用任意R package来连接R数据或者R绘图进行分析。

拖拽一个数据集和一个R模型节点到编辑区,连接数据集和R模型节点。选中R模型节点设置及展示区包含一个页面:配置项目。

ML56

o配置项目

【脚本】引用R package的脚本,必须将最终结果存入MODEL变量中作为返回值。

点击右上按钮,可弹出脚本输入框更方便的输入。