电竞比分网-中国电竞赛事及体育赛事平台

分享

RPA練習(xí)題005:抓取統(tǒng)計(jì)用區(qū)劃代碼和城鄉(xiāng)劃分代碼

 偷懶的技術(shù) 2023-09-14 發(fā)布于重慶

函數(shù)公式、職場模板 財(cái)務(wù)應(yīng)用、分析圖表、練習(xí)題、財(cái)務(wù)機(jī)器人、快捷鍵、軟件工具、表格合并、圖表及可視化Office 365、Power Query、表格美化符號作用、生成序列、條件格式、學(xué)會騙、一本不正經(jīng)避坑指南、數(shù)據(jù)整理、篩選技巧日期時(shí)間、偷懶寶典漂亮3D、WPS技巧、PPT技巧、Word技巧

??點(diǎn)擊查看分類專題??

   ??點(diǎn)擊查看最新文章??

RPA練習(xí)題005:抓取統(tǒng)計(jì)用區(qū)劃代碼和城鄉(xiāng)劃分代碼

目標(biāo):

使用影刀RPA抓取國家統(tǒng)計(jì)局2023年統(tǒng)計(jì)用區(qū)劃代碼和城鄉(xiāng)劃分代碼。

從省、市級、縣級、一直到鄉(xiāng)鎮(zhèn)、居委會級

網(wǎng)址:

http://www.stats.gov.cn/sj/tjbz/tjyqhdmhcxhfdm/2023/index.html

最終效果:

思路:

1、使用影刀RPA的列表循環(huán),逐級嵌套,然后逐一點(diǎn)擊每一層級的各個(gè)元素。

2、在居委會所在網(wǎng)頁,使用影刀強(qiáng)大的批量數(shù)據(jù)抓取功能,獲取各居委會的統(tǒng)計(jì)用區(qū)劃代碼。

3、抓取后數(shù)據(jù)后,使用列表推導(dǎo)式,在居委會列表添加所屬的縣、市、省份。

4、然后將列表寫入到Excel表格中。

參考指令:

補(bǔ)充說明:

1、如果使用列表循環(huán),點(diǎn)擊各元素打開鏈接,然后回退網(wǎng)頁。將數(shù)據(jù)寫入到Excel表時(shí),有時(shí)會莫名出現(xiàn)錯列的情況。

為了避免這種情況,上面的指令,采用獲取各元素的鏈接,然后在新頁面打開

寫入到Excel中后,等本頁面都循環(huán)完了后,再關(guān)閉網(wǎng)頁。

2、每個(gè)居委會的數(shù)據(jù)只有三列: 

統(tǒng)計(jì)用區(qū)劃代碼、城鄉(xiāng)分類代碼、名稱 

寫入到Excel表格中,還需要添加所屬的鄉(xiāng)鎮(zhèn)、縣、市、省。

如果直接在Excel表格中去添加比較麻煩,可以使用列表推導(dǎo)式在獲取的居委會編碼列表中添加,然后再一次性寫到Excel表格中。

影刀既可以使用python模塊碼代碼,也可以在指令中開啟python表達(dá)式模式輸入python表達(dá)式,非常方便

4、獲取居委會的數(shù)據(jù)時(shí),會將標(biāo)題行一并獲取。

如下圖:

如果寫入Excel后再來篩選刪除,會增加操作步驟,可以使用列表切片,直接將第一行標(biāo)題去掉,再寫入到Excel表格中。

更多的RPA文章,請點(diǎn)擊下面的合集進(jìn)行閱讀:

財(cái)務(wù)RPA機(jī)器人及RPA練習(xí)題

如需加入RPA群,請備注RPA


    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多