电竞比分网-中国电竞赛事及体育赛事平台

分享

Python 數(shù)據(jù)分析基礎(chǔ)(順帶推薦一下飛書(shū))

 小溫愛(ài)怡寶 2024-09-11 發(fā)布于江西

學(xué)過(guò)C、C++,matlab, 現(xiàn)在開(kāi)始入門Python,目前主要學(xué)習(xí)如何實(shí)用python進(jìn)行數(shù)據(jù)分析,特制作此云文檔,供學(xué)習(xí)分享,可隨時(shí)在云文檔里評(píng)論,如有不足之處可以指出。簡(jiǎn)單推薦一下飛書(shū)文檔,飛書(shū)文檔是一款由字節(jié)跳動(dòng)推出的團(tuán)隊(duì)協(xié)作工具,提供文檔編輯、表格制作項(xiàng)目管理日程安排等功能,旨在幫助團(tuán)隊(duì)高效協(xié)作和溝通。用戶可以在其中創(chuàng)建文檔、表格、幻燈片等,實(shí)時(shí)協(xié)作編輯,并支持多種文件格式導(dǎo)入導(dǎo)出。飛書(shū)文檔也支持與其他飛書(shū)產(chǎn)品(如飛書(shū)、飛書(shū)表格)無(wú)縫集成,方便團(tuán)隊(duì)成員之間的信息共享和協(xié)作。用來(lái)記錄想法筆記等非常贊??!

          可在飛書(shū)云文檔閱讀

可以復(fù)制鏈接進(jìn)行閱讀,建議實(shí)用電腦網(wǎng)頁(yè)閱讀,一直更新

https://jvirndswckh.feishu.cn/docx/RKTqdez8No0817xhGUHczgYvnPb?from=from_copylink

《從Excel到Python 數(shù)據(jù)分析進(jìn)階指南王彥平 ( 藍(lán)鯨 ) / 著

說(shuō)明:鑒于 未經(jīng)授權(quán),不得以任何方式復(fù)制和傳播本書(shū)內(nèi)容,本文檔只是個(gè)人學(xué)習(xí)所做的記錄,部分例子參照此書(shū),細(xì)致地將相關(guān)語(yǔ)法內(nèi)容匯總在云文檔里并進(jìn)行了相關(guān)補(bǔ)充,歡迎閱讀原書(shū)。

生成數(shù)據(jù)表

pandas 庫(kù)

pandas 是一個(gè)強(qiáng)大的數(shù)據(jù)分析庫(kù),提供了數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具,使得在Python中進(jìn)行數(shù)據(jù)處理變得更加簡(jiǎn)單和高效。pandas 主要提供了兩種數(shù)據(jù)結(jié)構(gòu):Series 和 DataFrame。

·Series:類似于一維數(shù)組的對(duì)象,由一組數(shù)據(jù)和與之相關(guān)的索引組成。

·DataFrame:類似于二維表格的數(shù)據(jù)結(jié)構(gòu),由多個(gè) Series 組成,每個(gè) Series 表示一列數(shù)據(jù)。

pandas 提供了豐富的函數(shù)和方法,用于數(shù)據(jù)的導(dǎo)入、清洗、轉(zhuǎn)換、分析和可視化。通過(guò) pandas,用戶可以輕松地處理各種數(shù)據(jù)格式,如CSV、Excel、SQL數(shù)據(jù)庫(kù)等,進(jìn)行數(shù)據(jù)篩選、聚合、合并等。

NumPy 庫(kù)

NumPy(Numerical Python)是Python中用于科學(xué)計(jì)算的一個(gè)重要庫(kù),提供了多維數(shù)組對(duì)象(例如數(shù)組)和許多用于操作數(shù)組的函數(shù)。NumPy的核心是ndarray(N-dimensional array)對(duì)象,它是一個(gè)具有相同類型和大小的元素的多維數(shù)組。

NumPy庫(kù)提供了以下功能和特點(diǎn):    

·強(qiáng)大的N維數(shù)組對(duì)象

·其他派生對(duì)象(如掩碼數(shù)組、矩陣等)

·廣播功能函數(shù)

·整合C/C++/Fortran代碼的工具

·線性代數(shù)、傅立葉變換和隨機(jī)數(shù)生成等功能

NumPy是許多其他科學(xué)計(jì)算庫(kù)的基礎(chǔ),如pandas、SciPy等,因此在數(shù)據(jù)處理和科學(xué)計(jì)算領(lǐng)域中被廣泛應(yīng)用。通過(guò)NumPy,用戶可以高效地進(jìn)行數(shù)組操作、數(shù)學(xué)運(yùn)算和線性代數(shù)計(jì)算。

在Python中,要導(dǎo)入pandas庫(kù)和numpy庫(kù),可以使用以下代碼:

Python                  
import pandas as pd                  
import numpy as np

這樣就可以方便地使用pandas庫(kù)和numpy庫(kù)中的函數(shù)和工具來(lái)進(jìn)行數(shù)據(jù)導(dǎo)入和處理。導(dǎo)入這兩個(gè)庫(kù)后,可以使用它們提供的豐富功能來(lái)處理各種數(shù)據(jù)類型。

導(dǎo)入數(shù)據(jù)表

1.從CSV文件導(dǎo)入數(shù)據(jù)表:

Python                  
import pandas as pd                  
data = pd.read_csv('file.csv')

2.從Excel文件導(dǎo)入數(shù)據(jù)表:

Python                  
import pandas as pd                  
data = pd.read_excel('file.xlsx')

3.從SQL數(shù)據(jù)庫(kù)導(dǎo)入數(shù)據(jù)表:

Python                  
import pandas as pd                  
import sqlite3                  
conn = sqlite3.connect('database.db')                  
query = "SELECT * FROM table"                  
data = pd.read_sql(query, conn)

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多