|
IoT物聯(lián)網(wǎng)技術(shù) 2022-04-10 19:19
國(guó)內(nèi)最大IoT物聯(lián)網(wǎng)開(kāi)發(fā)者社區(qū),1000+行業(yè)資料分享;集結(jié) AWS,阿里云,華為云,微軟Azure,百度云 物聯(lián)網(wǎng)專(zhuān)家;通信模組,物聯(lián)網(wǎng)卡廠商;智能家居,工業(yè)制造,智慧城市解決方案商。 143篇原創(chuàng)內(nèi)容 公眾號(hào) 文本文以淘寶為例講解了大型網(wǎng)站的架構(gòu)演進(jìn)過(guò)程,特此分享給大家,相信看完會(huì)有所收獲。整個(gè)架構(gòu)的演進(jìn)過(guò)程:
1. 概述本文以淘寶作為例子,介紹從一百個(gè)到千萬(wàn)級(jí)并發(fā)情況下服務(wù)端的架構(gòu)的演進(jìn)過(guò)程,同時(shí)列舉出每個(gè)演進(jìn)階段會(huì)遇到的相關(guān)技術(shù),讓大家對(duì)架構(gòu)的演進(jìn)有一個(gè)整體的認(rèn)知,文章最后匯總了一些架構(gòu)設(shè)計(jì)的原則。
2. 基本概念在介紹架構(gòu)之前,為了避免部分讀者對(duì)架構(gòu)設(shè)計(jì)中的一些概念不了解,下面對(duì)幾個(gè)最基礎(chǔ)的概念進(jìn)行介紹:
3. 架構(gòu)演進(jìn)3.1 單機(jī)架構(gòu)![]() 以淘寶作為例子。在網(wǎng)站最初時(shí),應(yīng)用數(shù)量與用戶數(shù)都較少,可以把Tomcat和數(shù)據(jù)庫(kù)部署在同一臺(tái)服務(wù)器上。瀏覽器往www.taobao.com發(fā)起請(qǐng)求時(shí),首先經(jīng)過(guò)DNS服務(wù)器(域名系統(tǒng))把域名轉(zhuǎn)換為實(shí)際IP地址10.102.4.1,瀏覽器轉(zhuǎn)而訪問(wèn)該IP對(duì)應(yīng)的Tomcat。
3.2 第一次演進(jìn):Tomcat與數(shù)據(jù)庫(kù)分開(kāi)部署![]() Tomcat和數(shù)據(jù)庫(kù)分別獨(dú)占服務(wù)器資源,顯著提高兩者各自性能。
3.3 第二次演進(jìn):引入本地緩存和分布式緩存![]() 在Tomcat同服務(wù)器上或同JVM中增加本地緩存,并在外部增加分布式緩存,緩存熱門(mén)商品信息或熱門(mén)商品的html頁(yè)面等。通過(guò)緩存能把絕大多數(shù)請(qǐng)求在讀寫(xiě)數(shù)據(jù)庫(kù)前攔截掉,大大降低數(shù)據(jù)庫(kù)壓力。其中涉及的技術(shù)包括:使用memcached作為本地緩存,使用Redis作為分布式緩存,還會(huì)涉及緩存一致性、緩存穿透/擊穿、緩存雪崩、熱點(diǎn)數(shù)據(jù)集中失效等問(wèn)題。
3.4 第三次演進(jìn):引入反向代理實(shí)現(xiàn)負(fù)載均衡![]() 在多臺(tái)服務(wù)器上分別部署Tomcat,使用反向代理軟件(Nginx)把請(qǐng)求均勻分發(fā)到每個(gè)Tomcat中。此處假設(shè)Tomcat最多支持100個(gè)并發(fā),Nginx最多支持50000個(gè)并發(fā),那么理論上Nginx把請(qǐng)求分發(fā)到500個(gè)Tomcat上,就能抗住50000個(gè)并發(fā)。其中涉及的技術(shù)包括:Nginx、HAProxy,兩者都是工作在網(wǎng)絡(luò)第七層的反向代理軟件,主要支持http協(xié)議,還會(huì)涉及session共享、文件上傳下載的問(wèn)題。
3.5 第四次演進(jìn):數(shù)據(jù)庫(kù)讀寫(xiě)分離![]() 把數(shù)據(jù)庫(kù)劃分為讀庫(kù)和寫(xiě)庫(kù),讀庫(kù)可以有多個(gè),通過(guò)同步機(jī)制把寫(xiě)庫(kù)的數(shù)據(jù)同步到讀庫(kù),對(duì)于需要查詢最新寫(xiě)入數(shù)據(jù)場(chǎng)景,可通過(guò)在緩存中多寫(xiě)一份,通過(guò)緩存獲得最新數(shù)據(jù)。其中涉及的技術(shù)包括:Mycat,它是數(shù)據(jù)庫(kù)中間件,可通過(guò)它來(lái)組織數(shù)據(jù)庫(kù)的分離讀寫(xiě)和分庫(kù)分表,客戶端通過(guò)它來(lái)訪問(wèn)下層數(shù)據(jù)庫(kù),還會(huì)涉及數(shù)據(jù)同步,數(shù)據(jù)一致性的問(wèn)題。
3.6 第五次演進(jìn):數(shù)據(jù)庫(kù)按業(yè)務(wù)分庫(kù)![]() 把不同業(yè)務(wù)的數(shù)據(jù)保存到不同的數(shù)據(jù)庫(kù)中,使業(yè)務(wù)之間的資源競(jìng)爭(zhēng)降低,對(duì)于訪問(wèn)量大的業(yè)務(wù),可以部署更多的服務(wù)器來(lái)支撐。這樣同時(shí)導(dǎo)致跨業(yè)務(wù)的表無(wú)法直接做關(guān)聯(lián)分析,需要通過(guò)其他途徑來(lái)解決,但這不是本文討論的重點(diǎn),有興趣的可以自行搜索解決方案。
3.7 第六次演進(jìn):把大表拆分為小表![]() 比如針對(duì)評(píng)論數(shù)據(jù),可按照商品ID進(jìn)行hash,路由到對(duì)應(yīng)的表中存儲(chǔ);針對(duì)支付記錄,可按照小時(shí)創(chuàng)建表,每個(gè)小時(shí)表繼續(xù)拆分為小表,使用用戶ID或記錄編號(hào)來(lái)路由數(shù)據(jù)。只要實(shí)時(shí)操作的表數(shù)據(jù)量足夠小,請(qǐng)求能夠足夠均勻的分發(fā)到多臺(tái)服務(wù)器上的小表,那數(shù)據(jù)庫(kù)就能通過(guò)水平擴(kuò)展的方式來(lái)提高性能。其中前面提到的Mycat也支持在大表拆分為小表情況下的訪問(wèn)控制。 這種做法顯著的增加了數(shù)據(jù)庫(kù)運(yùn)維的難度,對(duì)DBA的要求較高。數(shù)據(jù)庫(kù)設(shè)計(jì)到這種結(jié)構(gòu)時(shí),已經(jīng)可以稱(chēng)為分布式數(shù)據(jù)庫(kù),但是這只是一個(gè)邏輯的數(shù)據(jù)庫(kù)整體,數(shù)據(jù)庫(kù)里不同的組成部分是由不同的組件單獨(dú)來(lái)實(shí)現(xiàn)的,如分庫(kù)分表的管理和請(qǐng)求分發(fā),由Mycat實(shí)現(xiàn),SQL的解析由單機(jī)的數(shù)據(jù)庫(kù)實(shí)現(xiàn),讀寫(xiě)分離可能由網(wǎng)關(guān)和消息隊(duì)列來(lái)實(shí)現(xiàn),查詢結(jié)果的匯總可能由數(shù)據(jù)庫(kù)接口層來(lái)實(shí)現(xiàn)等等,這種架構(gòu)其實(shí)是MPP(大規(guī)模并行處理)架構(gòu)的一類(lèi)實(shí)現(xiàn)。 目前開(kāi)源和商用都已經(jīng)有不少M(fèi)PP數(shù)據(jù)庫(kù),開(kāi)源中比較流行的有Greenplum、TiDB、Postgresql XC、HAWQ等,商用的如南大通用的GBase、睿帆科技的雪球DB、華為的LibrA等等,不同的MPP數(shù)據(jù)庫(kù)的側(cè)重點(diǎn)也不一樣,如TiDB更側(cè)重于分布式OLTP場(chǎng)景,Greenplum更側(cè)重于分布式OLAP場(chǎng)景,這些MPP數(shù)據(jù)庫(kù)基本都提供了類(lèi)似Postgresql、Oracle、MySQL那樣的SQL標(biāo)準(zhǔn)支持能力,能把一個(gè)查詢解析為分布式的執(zhí)行計(jì)劃分發(fā)到每臺(tái)機(jī)器上并行執(zhí)行,最終由數(shù)據(jù)庫(kù)本身匯總數(shù)據(jù)進(jìn)行返回,也提供了諸如權(quán)限管理、分庫(kù)分表、事務(wù)、數(shù)據(jù)副本等能力,并且大多能夠支持100個(gè)節(jié)點(diǎn)以上的集群,大大降低了數(shù)據(jù)庫(kù)運(yùn)維的成本,并且使數(shù)據(jù)庫(kù)也能夠?qū)崿F(xiàn)水平擴(kuò)展。
3.8 第七次演進(jìn):使用LVS或F5來(lái)使多個(gè)Nginx負(fù)載均衡![]() 由于瓶頸在Nginx,因此無(wú)法通過(guò)兩層的Nginx來(lái)實(shí)現(xiàn)多個(gè)Nginx的負(fù)載均衡。圖中的LVS和F5是工作在網(wǎng)絡(luò)第四層的負(fù)載均衡解決方案,其中LVS是軟件,運(yùn)行在操作系統(tǒng)內(nèi)核態(tài),可對(duì)TCP請(qǐng)求或更高層級(jí)的網(wǎng)絡(luò)協(xié)議進(jìn)行轉(zhuǎn)發(fā),因此支持的協(xié)議更豐富,并且性能也遠(yuǎn)高于Nginx,可假設(shè)單機(jī)的LVS可支持幾十萬(wàn)個(gè)并發(fā)的請(qǐng)求轉(zhuǎn)發(fā);F5是一種負(fù)載均衡硬件,與LVS提供的能力類(lèi)似,性能比LVS更高,但價(jià)格昂貴。 由于LVS是單機(jī)版的軟件,若LVS所在服務(wù)器宕機(jī)則會(huì)導(dǎo)致整個(gè)后端系統(tǒng)都無(wú)法訪問(wèn),因此需要有備用節(jié)點(diǎn)。可使用keepalived軟件模擬出虛擬IP,然后把虛擬IP綁定到多臺(tái)LVS服務(wù)器上,瀏覽器訪問(wèn)虛擬IP時(shí),會(huì)被路由器重定向到真實(shí)的LVS服務(wù)器,當(dāng)主LVS服務(wù)器宕機(jī)時(shí),keepalived軟件會(huì)自動(dòng)更新路由器中的路由表,把虛擬IP重定向到另外一臺(tái)正常的LVS服務(wù)器,從而達(dá)到LVS服務(wù)器高可用的效果。 此處需要注意的是,上圖中從Nginx層到Tomcat層這樣畫(huà)并不代表全部Nginx都轉(zhuǎn)發(fā)請(qǐng)求到全部的Tomcat,在實(shí)際使用時(shí),可能會(huì)是幾個(gè)Nginx下面接一部分的Tomcat,這些Nginx之間通過(guò)keepalived實(shí)現(xiàn)高可用,其他的Nginx接另外的Tomcat,這樣可接入的Tomcat數(shù)量就能成倍的增加。
3.9 第八次演進(jìn):通過(guò)DNS輪詢實(shí)現(xiàn)機(jī)房間的負(fù)載均衡![]() 在DNS服務(wù)器中可配置一個(gè)域名對(duì)應(yīng)多個(gè)IP地址,每個(gè)IP地址對(duì)應(yīng)到不同的機(jī)房里的虛擬IP。當(dāng)用戶訪問(wèn)www.taobao.com時(shí),DNS服務(wù)器會(huì)使用輪詢策略或其他策略,來(lái)選擇某個(gè)IP供用戶訪問(wèn)。此方式能實(shí)現(xiàn)機(jī)房間的負(fù)載均衡,至此,系統(tǒng)可做到機(jī)房級(jí)別的水平擴(kuò)展,千萬(wàn)級(jí)到億級(jí)的并發(fā)量都可通過(guò)增加機(jī)房來(lái)解決,系統(tǒng)入口處的請(qǐng)求并發(fā)量不再是問(wèn)題。
3.10 第九次演進(jìn):引入NoSQL數(shù)據(jù)庫(kù)和搜索引擎等技術(shù)![]() 當(dāng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)多到一定規(guī)模時(shí),數(shù)據(jù)庫(kù)就不適用于復(fù)雜的查詢了,往往只能滿足普通查詢的場(chǎng)景。對(duì)于統(tǒng)計(jì)報(bào)表場(chǎng)景,在數(shù)據(jù)量大時(shí)不一定能跑出結(jié)果,而且在跑復(fù)雜查詢時(shí)會(huì)導(dǎo)致其他查詢變慢,對(duì)于全文檢索、可變數(shù)據(jù)結(jié)構(gòu)等場(chǎng)景,數(shù)據(jù)庫(kù)天生不適用。因此需要針對(duì)特定的場(chǎng)景,引入合適的解決方案。如對(duì)于海量文件存儲(chǔ),可通過(guò)分布式文件系統(tǒng)HDFS解決,對(duì)于key value類(lèi)型的數(shù)據(jù),可通過(guò)HBase和Redis等方案解決,對(duì)于全文檢索場(chǎng)景,可通過(guò)搜索引擎如ElasticSearch解決,對(duì)于多維分析場(chǎng)景,可通過(guò)Kylin或Druid等方案解決。 當(dāng)然,引入更多組件同時(shí)會(huì)提高系統(tǒng)的復(fù)雜度,不同的組件保存的數(shù)據(jù)需要同步,需要考慮一致性的問(wèn)題,需要有更多的運(yùn)維手段來(lái)管理這些組件等。
3.11 第十次演進(jìn):大應(yīng)用拆分為小應(yīng)用![]() 按照業(yè)務(wù)板塊來(lái)劃分應(yīng)用代碼,使單個(gè)應(yīng)用的職責(zé)更清晰,相互之間可以做到獨(dú)立升級(jí)迭代。這時(shí)候應(yīng)用之間可能會(huì)涉及到一些公共配置,可以通過(guò)分布式配置中心Zookeeper來(lái)解決。
3.12 第十一次演進(jìn):復(fù)用的功能抽離成微服務(wù)![]() 如用戶管理、訂單、支付、鑒權(quán)等功能在多個(gè)應(yīng)用中都存在,那么可以把這些功能的代碼單獨(dú)抽取出來(lái)形成一個(gè)單獨(dú)的服務(wù)來(lái)管理,這樣的服務(wù)就是所謂的微服務(wù),應(yīng)用和服務(wù)之間通過(guò)HTTP、TCP或RPC請(qǐng)求等多種方式來(lái)訪問(wèn)公共服務(wù),每個(gè)單獨(dú)的服務(wù)都可以由單獨(dú)的團(tuán)隊(duì)來(lái)管理。此外,可以通過(guò)Dubbo、SpringCloud等框架實(shí)現(xiàn)服務(wù)治理、限流、熔斷、降級(jí)等功能,提高服務(wù)的穩(wěn)定性和可用性。
3.13 第十二次演進(jìn):引入企業(yè)服務(wù)總線ESB屏蔽服務(wù)接口的訪問(wèn)差異![]() 通過(guò)ESB統(tǒng)一進(jìn)行訪問(wèn)協(xié)議轉(zhuǎn)換,應(yīng)用統(tǒng)一通過(guò)ESB來(lái)訪問(wèn)后端服務(wù),服務(wù)與服務(wù)之間也通過(guò)ESB來(lái)相互調(diào)用,以此降低系統(tǒng)的耦合程度。這種單個(gè)應(yīng)用拆分為多個(gè)應(yīng)用,公共服務(wù)單獨(dú)抽取出來(lái)來(lái)管理,并使用企業(yè)消息總線來(lái)解除服務(wù)之間耦合問(wèn)題的架構(gòu),就是所謂的SOA(面向服務(wù))架構(gòu),這種架構(gòu)與微服務(wù)架構(gòu)容易混淆,因?yàn)楸憩F(xiàn)形式十分相似。個(gè)人理解,微服務(wù)架構(gòu)更多是指把系統(tǒng)里的公共服務(wù)抽取出來(lái)單獨(dú)運(yùn)維管理的思想,而SOA架構(gòu)則是指一種拆分服務(wù)并使服務(wù)接口訪問(wèn)變得統(tǒng)一的架構(gòu)思想,SOA架構(gòu)中包含了微服務(wù)的思想。
3.14 第十三次演進(jìn):引入容器化技術(shù)實(shí)現(xiàn)運(yùn)行環(huán)境隔離與動(dòng)態(tài)服務(wù)管理![]() 目前最流行的容器化技術(shù)是Docker,最流行的容器管理服務(wù)是Kubernetes(K8S),應(yīng)用/服務(wù)可以打包為Docker鏡像,通過(guò)K8S來(lái)動(dòng)態(tài)分發(fā)和部署鏡像。Docker鏡像可理解為一個(gè)能運(yùn)行你的應(yīng)用/服務(wù)的最小的操作系統(tǒng),里面放著應(yīng)用/服務(wù)的運(yùn)行代碼,運(yùn)行環(huán)境根據(jù)實(shí)際的需要設(shè)置好。把整個(gè)“操作系統(tǒng)”打包為一個(gè)鏡像后,就可以分發(fā)到需要部署相關(guān)服務(wù)的機(jī)器上,直接啟動(dòng)Docker鏡像就可以把服務(wù)起起來(lái),使服務(wù)的部署和運(yùn)維變得簡(jiǎn)單。 在大促的之前,可以在現(xiàn)有的機(jī)器集群上劃分出服務(wù)器來(lái)啟動(dòng)Docker鏡像,增強(qiáng)服務(wù)的性能,大促過(guò)后就可以關(guān)閉鏡像,對(duì)機(jī)器上的其他服務(wù)不造成影響(在3.14節(jié)之前,服務(wù)運(yùn)行在新增機(jī)器上需要修改系統(tǒng)配置來(lái)適配服務(wù),這會(huì)導(dǎo)致機(jī)器上其他服務(wù)需要的運(yùn)行環(huán)境被破壞)。
3.15 第十四次演進(jìn):以云平臺(tái)承載系統(tǒng)![]() 系統(tǒng)可部署到公有云上,利用公有云的海量機(jī)器資源,解決動(dòng)態(tài)硬件資源的問(wèn)題,在大促的時(shí)間段里,在云平臺(tái)中臨時(shí)申請(qǐng)更多的資源,結(jié)合Docker和K8S來(lái)快速部署服務(wù),在大促結(jié)束后釋放資源,真正做到按需付費(fèi),資源利用率大大提高,同時(shí)大大降低了運(yùn)維成本。 所謂的云平臺(tái),就是把海量機(jī)器資源,通過(guò)統(tǒng)一的資源管理,抽象為一個(gè)資源整體,在之上可按需動(dòng)態(tài)申請(qǐng)硬件資源(如CPU、內(nèi)存、網(wǎng)絡(luò)等),并且之上提供通用的操作系統(tǒng),提供常用的技術(shù)組件(如Hadoop技術(shù)棧,MPP數(shù)據(jù)庫(kù)等)供用戶使用,甚至提供開(kāi)發(fā)好的應(yīng)用,用戶不需要關(guān)系應(yīng)用內(nèi)部使用了什么技術(shù),就能夠解決需求(如音視頻轉(zhuǎn)碼服務(wù)、郵件服務(wù)、個(gè)人博客等)。在云平臺(tái)中會(huì)涉及如下幾個(gè)概念:
4. 架構(gòu)設(shè)計(jì)總結(jié)
|
|
|
來(lái)自: 風(fēng)聲之家 > 《物聯(lián)網(wǎng)》