<< Click to Display Table of Contents >> 提问技巧及建议复制链接 |
现在我们可通过自然语言的方式与Copilot进行交互来获取数据分析以及结果,在提问时可以参考下面的一些原则和技巧。
1.数据准备
1.1 处理字段名
•字段命名需要贴近实际使用名称。
•可通过字段别名增加问答使用名称。比如有列“员工数”,可设置别名“人数”,问答时便可使用“员工数”或“人数”进行提问。
•字段名中不要有特殊字符,比如“()”。
1.2 约束文件夹中的数据集数量
数据集过多会影响查询性能,使查询时间增加。同一个文件夹中,建议不超过20个数据集。
2. 问题描述要清晰简洁
2.1 问题内容尽量不要有歧义,否则可能返回不同可能性的答案
想了解某个度量值时,需要带上汇总类型。例如需要避免“咖啡销售额”、“产品种类的最大销售额”这种问法,改为“咖啡的总销售额”、“哪个产品种类的总销售额最高”。
2.2 相同的问题在不同的数据下表现可能不同
比如“什么产品种类卖的最好?”,如果数据中同时存在销量和销售额字段,那么Copilot可能会理解为销量,也可能理解为销售额。建议修改为“什么产品种类的总销售额最高?”。
2.3 避免无法达成的数据请求
比如“用地图展示2016年各月份的销售额情况”,在这个问题中,不存在地理信息,也就没法通过地图来展示,Copilot是无法回答的,最终可能返回其他的图形。
2.4 避免一些模糊的意图描述
比如“希望了解一下总成本的平均值在40到55之间的产品的数据情况”,建议修改为“哪些产品的平均总成本在40到55之间”。
3.Copilot限制
目前Copilot对话支持单维度单度量、多维度多度量、排序、过滤、同环比、简单动态计算、时间层级、时间嵌套、topN等,暂时不支持子查询、自动创建计算列、策略建议等场景。