连接到SQL数据源

<< Click to Display Table of Contents >>

当前位置:  数据准备 > 数据源 > SQL数据源 

连接到SQL数据源

复制链接

通用的连接到SQL数据源流程如下。

1.添加SQL数据源

在添加数据源首页选择某种SQL数据源点击进入新建页面:

dbshot7

2.SQL数据源配置信息介绍

2.1 基础属性

SQL数据源通常需要配置基础属性如图:

Data_SQL

基础属性详细解释如下:

基础属性

说明

选择数据源

默认是在首页选择的数据源类型。用户也可以在下拉列表里选择除文本数据源外其它的数据源类型。

驱动

默认驱动:默认驱动参考支持的数据源范围中的sql数据源部分,选择驱动然后进行对应的属性配置

自定义驱动:从下拉选框中选择用户定义的自定义驱动,自定义驱动的创建和管理参考驱动管理

URL

数据源的URL包含数据库名称、数据库服务器等信息,对应数据连接页面提供了URL示例,根据自身数据库的信息修改填入即可。

例如:MySQL的URL为jdbc:mysql://<Databaseserver>:3306/<DatabaseName>

若自身数据库 IP 为192.168.0.1,数据库名称为mysql ,则填入的URL为

jdbc:mysql://192.168.0.1:3306/mysql

用户名

连接数据库所需要的用户名,DATA MART数据源为登录系统的用户名。

密码

连接数据库所需要的密码,DATA MART数据源为登录系统的密码。

数据库

控制数据源下展示的数据库(Catalog)。输入要连接的数据库的名称,数据源下就只展示对应的数据库,如果此处不做指定,那将显示所有的数据库。

表结构模式

控制数据源下展示的表结构模式(Schema)。当选择一个表结构模式,数据源下就只展示指定的这一个,如果此处不做指定,那将显示所有的表结构模式。

有些额外的基础属性数据源在建立连接的时候可以在书写URL中添加,有的基础连接属性在建立连接时不能通过URL中添加,可以点击“添加基础属性”按钮,自定义名称和值,添加基础属性:

 

dbshot13

2.2 认证方式

dbshot9

连接数据源支持多种认证,在配置数据源时点击这个选项的下拉选框可以选择多种认证方式。

通常SQL数据源支持两种配置:用户名和密码认证,无身份验证;

对于FUSIONINSIGHT HD、HIVE、SPARK、IMPALA、HBASE、PRESTO、TRANSWARP、TBDS、TBDS OLAP数据源,在原有的两种基础上额外支持两种配置:用户名认证,Kerberos认证,详细的Kerbero认证配置信息请参考Kerbero认证说明

2.3 选择转换时区

对于ELASTIC SEARCH、CTSDBGREENPLUM数据源,支持配置转换时区。

dbshot11

输入数据存入数据库时的时区。如果数据存入数据库时,没有指定时区,可以不做选择。如果存入数据时,指定了时区,在这需要选择相应的时区对数据进行转换。

配置的时区会影响数据库生成的时间戳和一些函数返回的值。

2.4 高级属性

除了DATA MART以外的SQL数据源都支持高级属性的配置,高级属性通常是收起的,点击以展开。

db_ProfessionalProperties

展开的高级属性配置面板如下:

dbshot14

数据源开放提供配置数据库configuration properties的接口,点击添加高级属性图标会在高级属性内添加一行“名称”和“值”供用户进行自定义设置,可手工添加多个数据库属性。

SQL所有默认的高级属性详细含义如下:

高级属性

说明

开启连接池

GENERIC、DB2、MYSQL、ORACLE、POSTGRE、SQLSERVER默认开启,其他数据源默认关闭,配置开启数据源连接池的开关,点击勾选可以开启连接池的配置。

开启后才会出现属性【有效连接时间】、【最大连接数】和添加连接池属性。

有效连接时间

数据源的有效连接时间,默认为2小时,当配置为2小时后,超过2小时的连接占用不会放入连接池中。

最大连接数

该数据源最多的连接个数,默认为30。

添加连接池属性

点击添加符号为连接池添加属性,点击后出现【名称】和【值】的输入框,可以点击删除图标删除相应的属性。

Quote符号

定义数据库执行SQL需要转义的情况下,使用的是反引号还是双引号,默认为双引号。

*适用数据源:GENERIC

Fetchsize

控制了JDBC每次读取数据的行数,默认为100。

*JDBC 每次读取的数据是会缓存在内存中的,建议合理配置,保证内存的充足。

*不适用于CLICKHOUSE数据源

事务隔离级别

控制数据源连接的事务隔离级别,此属性包含六个选项值,可在bi.properties通过conn.transaction.level配置控制此属性的全局设置。

JDBC默认值(默认选中):使用JDBC的处理方式;

关闭事务:在不启用事务的情况下执行查询;

脏数据读:允许读取其它事务正在更新的数据(conn.transaction.level=1);

防止脏数据读:如果读取的数据被锁定时,会等待(conn.transaction.level=2);

可重复读:读取数据时会锁定数据避免其它事务更新(conn.transaction.level=4);

串行:事务逐一执行(conn.transaction.level=8)。

开启limit

默认不勾选,点击勾选开启limit,在预览数据的时候会将limit拼在SQL当中执行。

*适用数据源:GENERIC

AutoCommit

将数据源连接的自动提交模式设置为给定状态。如果连接处于勾选,则它的所有SQL语句将被执行并作为单个事务提交。反之它的SQL语句将聚集到事务中,直到调用commit方法或rollback方法为止。9.2及之后版本默认勾选上了,9.2之前版本默认情况下为不勾选。

显示别名

勾选后在数据集端会获取数据库中列的comment作为别名,默认在新建时是勾选状态。

*不适用于HBASE,ELASTIC SEARCH数据源

别名类型

Teradata数据库有COMMENT和TITLE,可以选择在数据集端获取数据库中列的COMMENT或者TITLE来作为别名。

*适用数据源:TERADATA

队列名

*适用数据源:HIVE,SPARK,IMPALA,TRANSWARP,FUSIONINSIGHT HD

数据库编码

转换编码

数据库编码是数据库的编码;转换编码是转换成的编码。当编码不一致时可以设置这两项来转换编码。

*不适用于ANALYTICDB,ELASTIC SEARCH数据源

数据库字符集

设置指定字符集后,在从数据库中取数据的时候,数据库将解码后的字节码重新按设置的字符集格式编码数据,最后再将数据返回给客户端。目前支持选择为GBK或LATIN1。

*适用数据源:MYSQL、ANALYTICDB、

数据库版本

数据源测试连接成功后,可以直接获取数据源的主版本号,并且有灰色文字说明返回的主版本号。

3.连接配置的数据源

3.1 测试连接

点击测试连接,提示测试成功,即该数据源成功连接到相应数据库。

dbshot17

3.2 保存连接

点击顶部工具栏的保存、另存为图标以保存当前配置的数据源。

创建数据集和制作报告模块都可以使用已保存的数据源。