|
機(jī)器學(xué)習(xí)是近年來(lái)漸趨熱門的一個(gè)領(lǐng)域,同時(shí)Python 語(yǔ)言經(jīng)過(guò)一段時(shí)間的發(fā)展也已逐漸成為主流的編程語(yǔ)言之一。Python機(jī)器學(xué)習(xí)實(shí)踐指南結(jié)合了機(jī)器學(xué)習(xí)和Python 語(yǔ)言兩個(gè)熱門的領(lǐng)域,通過(guò)利用兩種核心的機(jī)器學(xué)習(xí)算法來(lái)將Python 語(yǔ)言在數(shù)據(jù)分析方面的優(yōu)勢(shì)發(fā)揮到極致。 全書(shū)共有10 章。第1 章講解了Python 機(jī)器學(xué)習(xí)的生態(tài)系統(tǒng),剩余9 章介紹了眾多與機(jī)器學(xué)習(xí)相關(guān)的算法,包括各類分類算法、數(shù)據(jù)可視化技術(shù)、推薦引擎等,主要包括機(jī)器學(xué)習(xí)在公寓、機(jī)票、IPO 市場(chǎng)、新聞源、內(nèi)容推廣、股票市場(chǎng)、圖像、聊天機(jī)器人和推薦引擎等方面的應(yīng)用。 本書(shū)適合Python 程序員、數(shù)據(jù)分析人員、對(duì)算法感興趣的讀者、機(jī)器學(xué)習(xí)領(lǐng)域的從業(yè)人員及科研人員閱讀。 目錄 第1 章Python 機(jī)器學(xué)習(xí)的生態(tài)系統(tǒng)······1 1.1 數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)的工作 流程 2 1.1.1 獲取2 1.1.2 檢查和探索·················2 1.1.3 清理和準(zhǔn)備·················3 1.1.4 建模3 1.1.5 評(píng)估3 1.1.6 部署3 1.2 Python 庫(kù)和功能···················3 1.2.1 獲取4 1.2.2 檢查4 1.2.3 準(zhǔn)備20 1.2.4 建模和評(píng)估···············26 1.2.5 部署34 1.3 設(shè)置機(jī)器學(xué)習(xí)的環(huán)境···········34 1.4 小結(jié)34 第2 章構(gòu)建應(yīng)用程序,發(fā)現(xiàn)低價(jià)的 公寓35 2.1 獲取公寓房源數(shù)據(jù)··············36 使用import.io 抓取房源 數(shù)據(jù) 36 2.2 檢查和準(zhǔn)備數(shù)據(jù)·················38 2.2.1 分析數(shù)據(jù)···················46 2.2.2 可視化數(shù)據(jù)················50 2.3 對(duì)數(shù)據(jù)建模51 2.3.1 預(yù)測(cè)54 2.3.2 擴(kuò)展模型···················57 2.4 小結(jié)57 第3 章構(gòu)建應(yīng)用程序,發(fā)現(xiàn)低價(jià)的 機(jī)票58 3.1 獲取機(jī)票價(jià)格數(shù)據(jù)···············59 3.2 使用高級(jí)的網(wǎng)絡(luò)爬蟲(chóng)技術(shù) 檢索票價(jià)數(shù)據(jù)60 3.3 解析DOM 以提取定價(jià)數(shù)據(jù)····62 通過(guò)聚類技術(shù)識(shí)別 異常的票價(jià)66 3.4 使用IFTTT 發(fā)送實(shí)時(shí)提醒······75 3.5 整合在一起78 3.6 小結(jié)82 第4 章使用邏輯回歸預(yù)測(cè)IPO 市場(chǎng)·······83 4.1 IPO 市場(chǎng)84 4.1.1 什么是IPO ················84 4.1.2 近期IPO 市場(chǎng)表現(xiàn)·······84 4.1.3 基本的IPO 策略··········93 4.2 特征工程94 4.3 二元分類103 4.4 特征的重要性···················108 4.5 小結(jié)111 第5 章創(chuàng)建自定義的新聞源··············112 5.1 使用Pocket 應(yīng)用程序,創(chuàng)建一個(gè) 監(jiān)督訓(xùn)練的集合················112 5.1.1 安裝Pocket 的Chrome 擴(kuò)展程序·················113 5.1.2 使用Pocket API 來(lái)檢索 故事114 5.2 使用embed.ly API 下載故事的 內(nèi)容 119 5.3 自然語(yǔ)言處理基礎(chǔ)·············120 5.4 支持向量機(jī)123 5.5 IFTTT 與文章源、Google 表單 和電子郵件的集成·············125 通過(guò)IFTTT 設(shè)置新聞源 和 Google 表單···················125 5.6 設(shè)置你的每日個(gè)性化 新聞簡(jiǎn)報(bào)133 5.7 小結(jié)137 第6 章預(yù)測(cè)你的內(nèi)容是否會(huì)廣為 流傳138 6.1 關(guān)于病毒性,研究告訴我們了 些什么 139 6.2 獲取分享的數(shù)量和內(nèi)容·········140 6.3 探索傳播性的特征·············149 6.3.1 探索圖像數(shù)據(jù)···········149 6.3.2 探索標(biāo)題·················152 6.3.3 探索故事的內(nèi)容········156 6.4 構(gòu)建內(nèi)容評(píng)分的預(yù)測(cè)模型····157 6.5 小結(jié)162 第7 章使用機(jī)器學(xué)習(xí)預(yù)測(cè)股票市場(chǎng)·······163 7.1 市場(chǎng)分析的類型················164 7.2 關(guān)于股票市場(chǎng),研究告訴 我們些什么165 7.3 如何開(kāi)發(fā)一個(gè)交易策略·······166 7.3.1 延長(zhǎng)我們的分析 周期172 7.3.2 使用支持向量回歸, 構(gòu)建我們的模型········175 7.3.3 建模與動(dòng)態(tài)時(shí)間扭曲····182 7.4 小結(jié)186 第8 章建立圖像相似度的引擎···········187 8.1 圖像的機(jī)器學(xué)習(xí)················188 8.2 處理圖像189 8.3 查找相似的圖像················191 8.4 了解深度學(xué)習(xí)···················195 8.5 構(gòu)建圖像相似度的引擎·······198 8.6 小結(jié)206 第9 章打造聊天機(jī)器人207 9.1 圖靈測(cè)試207 9.2 聊天機(jī)器人的歷史················208 9.3 聊天機(jī)器人的設(shè)計(jì)·············212 9.4 打造一個(gè)聊天機(jī)器人··········217 9.5 小結(jié)227 第10 章構(gòu)建推薦引擎228 10.1 協(xié)同過(guò)濾229 10.1.1 基于用戶的過(guò)濾······230 10.1.2 基于項(xiàng)目的過(guò)濾······233 10.2 基于內(nèi)容的過(guò)濾···············236 10.3 混合系統(tǒng)237 10.4 構(gòu)建推薦引擎··················238 10.5 小結(jié)251 |
|
|