|
函數(shù)公式、職場模板 、財(cái)務(wù)應(yīng)用、分析圖表、練習(xí)題、財(cái)務(wù)機(jī)器人、快捷鍵、軟件工具、表格合并、圖表及可視化、Office 365、Power Query、表格美化、符號作用、生成序列、條件格式、學(xué)會騙、一本不正經(jīng)、避坑指南、數(shù)據(jù)整理、篩選技巧、日期時(shí)間、偷懶寶典、漂亮3D、WPS技巧、PPT技巧、Word技巧 ??點(diǎn)擊查看分類專題?? ??點(diǎn)擊查看最新文章??
RPA練習(xí)題005:抓取統(tǒng)計(jì)用區(qū)劃代碼和城鄉(xiāng)劃分代碼 目標(biāo): 使用影刀RPA抓取國家統(tǒng)計(jì)局2023年統(tǒng)計(jì)用區(qū)劃代碼和城鄉(xiāng)劃分代碼。 從省、市級、縣級、一直到鄉(xiāng)鎮(zhèn)、居委會級
網(wǎng)址: http://www.stats.gov.cn/sj/tjbz/tjyqhdmhcxhfdm/2023/index.html 最終效果:
思路: 1、使用影刀RPA的列表循環(huán),逐級嵌套,然后逐一點(diǎn)擊每一層級的各個(gè)元素。 2、在居委會所在網(wǎng)頁,使用影刀強(qiáng)大的批量數(shù)據(jù)抓取功能,獲取各居委會的統(tǒng)計(jì)用區(qū)劃代碼。 3、抓取后數(shù)據(jù)后,使用列表推導(dǎo)式,在居委會列表添加所屬的縣、市、省份。 4、然后將列表寫入到Excel表格中。
參考指令:
補(bǔ)充說明: 1、如果使用列表循環(huán),點(diǎn)擊各元素打開鏈接,然后回退網(wǎng)頁。將數(shù)據(jù)寫入到Excel表時(shí),有時(shí)會莫名出現(xiàn)錯列的情況。 為了避免這種情況,上面的指令,采用獲取各元素的鏈接,然后在新頁面打開
寫入到Excel中后,等本頁面都循環(huán)完了后,再關(guān)閉網(wǎng)頁。
2、每個(gè)居委會的數(shù)據(jù)只有三列: 統(tǒng)計(jì)用區(qū)劃代碼、城鄉(xiāng)分類代碼、名稱 寫入到Excel表格中,還需要添加所屬的鄉(xiāng)鎮(zhèn)、縣、市、省。 如果直接在Excel表格中去添加比較麻煩,可以使用列表推導(dǎo)式在獲取的居委會編碼列表中添加,然后再一次性寫到Excel表格中。
影刀既可以使用python模塊碼代碼,也可以在指令中開啟python表達(dá)式模式輸入python表達(dá)式,非常方便。 4、獲取居委會的數(shù)據(jù)時(shí),會將標(biāo)題行一并獲取。 如下圖:
如果寫入Excel后再來篩選刪除,會增加操作步驟,可以使用列表切片,直接將第一行標(biāo)題去掉,再寫入到Excel表格中。
更多的RPA文章,請點(diǎn)擊下面的合集進(jìn)行閱讀: 如需加入RPA群,請備注RPA |
|
|