![Power BI电商数据分析与商业智能(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/86/43738086/b_43738086.jpg)
5.2 动态数据采集
动态数据指采集的目标数据在JS或XHR中,在网页中有特定操作才会向服务器请求加载。
例:批量采集马刺和火箭两支球队的球员在2017年和2018年的比赛数据,以便对比两支球队的球员表现。
根据球队名称、球队名称英文缩写和年份创建球队信息表,如表5-2所示。
表5-2
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_56_1.jpg?sign=1738836076-isF37L6OLOhnZf9xHYy4CRxlfMxuD6fM-0-e11623984e29ac581d342628f7125e74)
在浏览器的开发者模式下,进入NetWork(网络)界面,选择不同年份的赛季,此时NetWork窗口的左侧会新增文件链接,单击新增文件链接,在Preview窗口可查看文件内容,如图5-26所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_56_2.jpg?sign=1738836076-1AF2jUuTSnxWSNSpa8WsK3Rn8GyzdmKO-0-fb60ef4a4e53c0ccddb0a3857281d13f)
图5-26
数据加载好后,就可以将需要采集的球队数据和年份数据作为参数导入。将表5-2中的数据输入Excel工作表,在Power BI界面的“主页”选项卡中单击“获取数据”下拉按钮,在弹出的下拉列表中选择“Excel”选项,在打开的对话框中选择之前写入表5-2的Excel文件,如图5-27所示,将数据导入Power Query编辑器。
进入Power Query编辑器后,将年份的格式设置为文本,如图5-28所示,便于后续作为参数传入URL中。
创建目标URL,在“添加列”选项卡中单击“自定义列”按钮,弹出“自定义列”对话框,在“自定义列公式”文本框中输入“="http://www.stat-nba.com/team/stat_box_team.php?team="&[缩写]&"&season="&[年份]&"&col=pts&order=1&isseason=1"”,并将新列名设置为“URL”,如图5-29所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_57_1.jpg?sign=1738836076-H2eg2W7sgudj9bXKheGMn9siVk7nO4uH-0-c7d9766b63ec987b6dbd48195ac6ee5a)
图5-27
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_57_2.jpg?sign=1738836076-H6MxZ2ZIJNGQdmV1BeQ1LmXVd1weV1EO-0-0e33a070bf6f732bd69ee42d87c96945)
图5-28
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_58_1.jpg?sign=1738836076-eQdAbGbG4ITy5o3GussNIj3vSUJ6I35f-0-a0bd01e370d85cdfec26f886169310b6)
图5-29
创建好URL后,根据URL下载文件。在“添加列”选项卡中再次单击“自定义列”按钮,弹出“自定义列”对话框,在“自定义列公式”文本框中输入=“Web.Page(Text.FromBinary (Web.Contents([URL]),65001)){0}[Data]”,如图5-30所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_58_2.jpg?sign=1738836076-MPpA37Dxskqnql8YrDVzLKs1goyHAtqn-0-92580276e15d8658be285600d0b00afc)
图5-30
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_59_1.jpg?sign=1738836076-3ShaNuKo9Hi730hMKPKvXOR6FnP8uXtT-0-248d95ff9d817c7bae2ff85bffae86e0)
图5-31
Text.FromBinary:将二进制文件转换成文本,其语法结构为Text.FromBinary(binary as nullable binary,optional encoding as nullable number) as nullable text。本例使用该函数是为了解决乱码问题,第二个参数65001表示UTF8编码。
成功下载数据后,展开所有列,可以直接取消勾选空列,并且取消勾选“使用原始列名作为前缀”复选框,如图5-31所示。
展开数据后,取消勾选“总计”“全队数据”“对手数据”复选框,如图5-32所示。
在Power Query编辑器的“主页”选项卡中,单击“关闭并应用”按钮。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_60_1.jpg?sign=1738836076-mdT8F7PMuqvbKl6JYbo9RwHZODJ9e826-0-733e737dbf2b9381cdc47f84c6a966b1)
图5-32
加载好的球员数据如图5-33所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_60_2.jpg?sign=1738836076-zP1dZ3B78FLy3QYSWKboMhILh4nyRsZK-0-858b7a64a3b3eb9d2670d81f404d2f7f)
图5-33