|
Hadoop是一個(gè)由Apache基金會(huì)所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。用戶可在不了解分布式底層細(xì)節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進(jìn)行高速運(yùn)算和存儲(chǔ)。本系列課程將會(huì)帶領(lǐng)大家從零到一學(xué)習(xí)Hadoop。 開課時(shí)間: 2016年03月31日 20:00-21:00 開課周期: 每周一課,共8課 于博,某金融大數(shù)據(jù)公司首席大數(shù)據(jù)架構(gòu)師。曾任百度集團(tuán)商務(wù)搜索部資深研發(fā)工程師,搜狐集團(tuán)研究院精準(zhǔn)廣告研發(fā)中心大數(shù)據(jù)架構(gòu)師。百度鳳巢系統(tǒng)開發(fā)者,參與了搜狐廣告精準(zhǔn)投放系統(tǒng)、優(yōu)酷視頻人機(jī)協(xié)同推薦系統(tǒng)等多個(gè)系統(tǒng)的研發(fā)工作,多次在技術(shù)論壇授課,有豐富的開發(fā)和系統(tǒng)架構(gòu)經(jīng)驗(yàn)。對(duì)Hadoop生態(tài)圈非常感興趣,實(shí)戰(zhàn)經(jīng)驗(yàn)比較豐富,翻譯出版大數(shù)據(jù)書籍一冊(cè)。 系列課程安排: 分布式系統(tǒng)中的關(guān)鍵概念及Hadoop起源發(fā)展 分布式中的關(guān)鍵概念 Hadoop思想起源:Google Hadoop發(fā)展歷史及其生態(tài)系統(tǒng) Hadoop 中基本概念、環(huán)境搭建 Hadoop的組成架構(gòu) Hadoop的三種運(yùn)行模式 以CDH為例介紹Hadoop的搭建安裝 HDFS HDFS概念與體系結(jié)構(gòu) HDFS中的文件存儲(chǔ)方式 HDFS中的文件讀寫過程數(shù)據(jù)流 HDFS文件操作(命令行) HDFS Java API 接口 YARN YARN 產(chǎn)生的背景 YARN基本架構(gòu)及其工作流程 YARN資源調(diào)度機(jī)制 MapReduce mapreduce計(jì)算框架產(chǎn)生背景 MapReduce工作流 MapReduce編程接口 MapReduce中的數(shù)據(jù)類型和格式 常見MapReduce編程模型 Hadoop監(jiān)控和管理 對(duì)HDFS的監(jiān)控 Hadoop系統(tǒng)中日志 Hadoop系統(tǒng)的升級(jí)和維護(hù) Hadoop配置 Hadoop系統(tǒng)中的幾個(gè)重要的配置文件解析 HBase Hbase體系結(jié)構(gòu) HBase shell HBase API應(yīng)用 Zookeeper ZooKeeper工作原理 ZooKeeper的數(shù)據(jù)結(jié)構(gòu)和組成 ZooKeeper的安裝配置 ZooKeeper命令行工具 ZooKeeper API |
|
|