Power BI dataflow 数据流(1)
关于数据流
- 是什么:类似在线版云端power query,数据存储在Azure Data Lake Gen2 (https://cloud.tencent.com/developer/news/341871佐罗的介绍)
2. 好处:
1) 可重用,在多个pbi报表中使用同一个pq表
2) 阻止使用者访问基础数据源,减少对底层系统的负载
3) 使用者通过统一的数据源创建报表,避免不同的数据源、不同的数据口径
4) 管理员更好的控制数据刷新时间。(比如一个report,有两张表,一张表一个月刷新1次、另一张一天刷新1次。之前需要以最大频率 每天刷一次;数据流的话可以分开频率刷新)
5) 可以存储在Azure Data Lake Gen2, 打通Azure
3. 坏处:
1) 压缩效果上,有一定压缩,但是不如pbi desktop压缩效果好
TBD
4. 创建方式:
1) Service点击新建
2)有4种模式,以define new entities为例
https://docs.microsoft.com/en-us/power-bi/transform-model/dataflows/dataflows-create(详细请见)
Select datasource
Connection settings config
Select table
Save
对数据集进行设置
点击刷新
5. 如何使用:
Desktop-get data-dataflows(注:一定要在service刷新过至少1次,否则数据传不进来,报错table is empty)
效果:和正常数据源一样,可以建模、pq继续清洗、制作可视化等。
6. 其他
数据流支持增量刷新、direct query
作者:Jessica二林
原文链接:https://www.jianshu.com/p/42e1a5018ee9