电竞比分网-中国电竞赛事及体育赛事平台

分享

如何使用Python Pandas模塊讀取各類型文件?

 星光閃亮圖書館 2019-08-30

這個(gè)非常簡單,pandas內(nèi)置了大量函數(shù)和類型,可以快速處理日常各種文件,下面我以txt,excel,csv,json和mysql這5種類型文件為例,簡單介紹一下pandas是如何快速讀取這些文件的:

txt文件

這是最常見的一種文本文件格式,讀取的話,直接使用read_table函數(shù)就行,測試代碼如下,這里必須保證txt文件是格式化的,不然讀取的結(jié)果會(huì)有誤,filename是文件名,header是否包含列標(biāo)題,sep是每行數(shù)據(jù)的分隔符,最終讀取的數(shù)據(jù)類型是DataFrame,方便后面程序進(jìn)行處理:

excel文件

這也是一種比較常見的文件格式,讀取的話,直接使用read_excel函數(shù)就行,測試代碼如下,非常簡單,直接傳入文件名就行,最終返回結(jié)果也是DataFrame類型:

csv文件

這也是一種比較常見的文件格式,讀取的話,直接使用read_csv函數(shù)就行,測試代碼如下,也非常簡單,filename為文件名,header為是否包含列標(biāo)題,最終返回結(jié)果也是DataFrame類型:

json文件

這也是一種比較常用的數(shù)據(jù)存儲(chǔ)格式,讀取的話,直接使用read_json函數(shù)就行,測試代碼如下,filename為文件名,如果出現(xiàn)中文亂碼的話,設(shè)置encoding編碼為uft-8就行,最終結(jié)果也是DataFrame類型:

mysql

這里首先需要安裝sqlalchemy框架,之后才能借助read_sql_query函數(shù)直接從mysql數(shù)據(jù)庫讀取數(shù)據(jù),安裝的話,直接輸入命令“pip install sqlalchemy”就行,測試代碼如下,也非常簡單,先創(chuàng)建一個(gè)connect連接,然后根據(jù)sql查詢語句,直接從數(shù)據(jù)庫中讀取數(shù)據(jù)就行:

至此,我們就完成了利用python的pandas模塊來讀取txt,excel,csv,json和mysql這5種類型文件的數(shù)據(jù)??偟膩碚f,pandas這個(gè)模塊功能非常強(qiáng)大,尤其對于數(shù)據(jù)處理來說,可以說是一個(gè)利器,在數(shù)據(jù)分析與處理中經(jīng)常會(huì)用到,只要你熟悉一下相關(guān)文檔和示例,很快就能掌握的,網(wǎng)上也有相關(guān)資料和教程,介紹的非常詳細(xì),感興趣的話,可以搜一下,希望以上分享的內(nèi)容能對你有所幫助吧,也歡迎大家評論、留言進(jìn)行補(bǔ)充。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多