|
目錄 - 數(shù)據(jù)庫分類維度:關系型/非關系型、交易型/分析型 - NoSQL數(shù)據(jù)庫的進一步分類 - OLTP市場規(guī)模:關系型數(shù)據(jù)庫仍占營收大頭 - 數(shù)據(jù)庫市場份額:云服務和新興廠商主導NoSQL - 開源數(shù)據(jù)庫 vs. 商業(yè)數(shù)據(jù)庫 - 數(shù)據(jù)庫三大陣營:傳統(tǒng)廠商和云服務提供商 最近由于時間原因我寫東西少了,在公眾號上也轉載過幾篇搞數(shù)據(jù)庫朋友的大作。按說我算是外行,沒資格在這個領域品頭論足,而當我看到下面這份報告時立即產生了學習的興趣,同時也想就能看懂的部分寫點心得體會分享給大家。 可能本文比較適合普及性閱讀,讓數(shù)據(jù)庫領域資深的朋友見笑了:) 來自Willian Blair的《Database Software Market:The Long-Awaited Shake-up》,文末我會提供原報告出處?;蛘哧P注本公眾號,從后臺留言“database”獲取下載鏈接。 數(shù)據(jù)庫分類維度:關系型/非關系型、交易型/分析型 首先是分類維度,上圖中的縱軸分類為Relational Database(關系型數(shù)據(jù)庫,RDBMS)和Nonrelational Database (非關系型數(shù)據(jù)庫,NoSQL),橫軸的分類為Operational(交易型,即OLTP)和Analytical(分析型,即OLAP)。 按照習慣我們先看關系型數(shù)據(jù)庫,左上角的交易型類別中包括大家熟悉的商業(yè)數(shù)據(jù)庫Oracle、MS SQL Server、DB2、Infomix,也包括開源領域流行的MySQL(MariaDB是它的一個分支)、PostgreSQL,還有云上面比較常見的SQL Azure和Amazon Aurora等。 比較有意思的是,SAP HANA正好位于交易型和分析型的中間分界處,不要忘了SAP還收購了Sybase,盡管后者今天不夠風光了,而早年微軟的SQL Server都是來源于Sybase。Sybase的ASE數(shù)據(jù)庫和分析型Sybase IQ還是存在的。 右上角的分析型產品中包括幾款知名的列式數(shù)據(jù)倉庫Pivotal Greenplum、Teradata和IBM Netezza(已宣布停止支持),來自互聯(lián)網(wǎng)巨頭的Google Big Query和Amazon RedShift。至于Oracle Exadata一體機,它上面運行的也是Oracle數(shù)據(jù)庫,其最初設計用途是OLAP,而在后來發(fā)展中也可以良好兼顧OLTP,算是一個跨界產品吧。 再來看非關系型數(shù)據(jù)庫,左下角的交易型產品中,有幾個我看著熟悉的MongoDB、Redis、Amazon DynamoDB和DocumentDB等;右下角的分析型產品包括著名的Hadoop分支Cloudera、Hortonworks(這2家已并購),Bigtable(來自Google,Hadoop中的HBase是它的開源實現(xiàn))、Elasticsearch等。 顯然非關系型數(shù)據(jù)庫的分類要更加復雜,產品在應用中的差異化也比傳統(tǒng)關系型數(shù)據(jù)庫更大。Willian Blair很負責任地對它們給出了進一步的分類。 NoSQL數(shù)據(jù)庫的進一步分類 上面這個圖表應該說很清晰了。非關系型數(shù)據(jù)庫可以分為Document-based Store(基于文檔的存儲)、Key-Value Store(鍵值存儲)、Graph-based(圖數(shù)據(jù)庫)、Time Series(時序數(shù)據(jù)庫),以及Wide Cloumn-based Store(寬列式存儲)。 我們再來看下每個細分類別中的產品: 文檔存儲:MongoDB、Amazon DocumentDB、Azure Cosmos DB等 Key-Value存儲:Redis Labs、Oracle Berkeley DB、Amazon DynamoDB、Aerospike等 圖數(shù)據(jù)庫:Neo4j等 時序數(shù)據(jù)庫:InfluxDB等 WideCloumn:DataStax、Cassandra、Apache HBase和Bigtable等 多模型數(shù)據(jù)庫:支持上面不只一種類別特性的NoSQL,比如MongoDB、Redis Labs、Amazon DynamoDB和Azure Cosmos DB等。 OLTP市場規(guī)模:關系型數(shù)據(jù)庫仍占營收大頭 上面這個基于IDC數(shù)據(jù)的交易型數(shù)據(jù)庫市場份額共有3個分類,其中深藍色部分的關系型數(shù)據(jù)庫(RDBMS,在這里不統(tǒng)計數(shù)據(jù)挖掘/分析型數(shù)據(jù)庫)占據(jù)80%以上的市場。 Dynamic Database(DDMS,動態(tài)數(shù)據(jù)庫管理系統(tǒng),同樣不統(tǒng)計Hadoop)就是我們前面聊的非關系型數(shù)據(jù)庫。這部分市場顯得?。ǖl(fā)展勢頭看好),我覺得與互聯(lián)網(wǎng)等大公司多采用開源+自研,而不買商業(yè)產品有關。 而遵循IDC的統(tǒng)計分類,在上圖灰色部分的“非關系型數(shù)據(jù)庫市場”其實另有定義,參見下面這段文字: 數(shù)據(jù)庫市場份額:云服務和新興廠商主導NoSQL 請注意,這里的關系型數(shù)據(jù)庫統(tǒng)計又包含了分析型產品。Oracle營收份額42%仍居第一,隨后排名依次為微軟、IBM、SAP和Teradata。 代表非關系型數(shù)據(jù)庫的DDMS分類中(這里同樣加入Hadoop等),云服務和新興廠商成為了主導,微軟應該是因為云SQL Server的基礎而小幅領先于AWS,這2家一共占據(jù)超過50%的市場,接下來的排名是Google、Cloudera和Hortonworks(二者加起來13%)。 上面是IDC傳統(tǒng)分類中的“非關系型數(shù)據(jù)庫”,在這里IBM和CA等應該主要是針對大型機的產品,InterSystems有一款在國內醫(yī)療HIS系統(tǒng)中應用的Caché數(shù)據(jù)庫(以前也是運行在Power小機上比較多)。我就知道這些,余下的就不瞎寫了。 開源數(shù)據(jù)庫 vs. 商業(yè)數(shù)據(jù)庫 按照流行度來看,開源數(shù)據(jù)庫從2013年到現(xiàn)在一直呈現(xiàn)增長,已經快要追上商業(yè)數(shù)據(jù)庫了。
商業(yè)產品在關系型數(shù)據(jù)庫的占比仍然高達60.5%,而上表中從這列往左的分類都是開源占優(yōu): Wide Cloumn:開源占比81.8%; 時序數(shù)據(jù)庫:開源占比80.7%; 文檔存儲:開源占比80.0%; Key-Value存儲:開源占比72.2%; 圖數(shù)據(jù)庫:開源占比68.4%; 搜索引擎:開源占比65.3%
按照開源License的授權模式,上面這個三角形越往下管的越寬松。比如MySQL屬于GPL,在互聯(lián)網(wǎng)行業(yè)用戶較多;而PostgreSQL屬于BSD授權,國內有不少數(shù)據(jù)庫公司的產品就是基于Postgre哦。 數(shù)據(jù)庫三大陣營:傳統(tǒng)廠商和云服務提供商
前面在討論市場份額時,我提到過交易型數(shù)據(jù)庫的4個巨頭仍然是Oracle、微軟、IBM和SAP,在這里William Blair將他們歸為第一陣營。 隨著云平臺的不斷興起,AWS、Azure和GCP(Google Cloud Platform)組成了另一個陣營,在國外分析師的眼里還沒有BAT,就像有的朋友所說,國內互聯(lián)網(wǎng)巨頭更多是自身業(yè)務導向的,在本土發(fā)展公有云還有些優(yōu)勢,短時間內將技術輸出到國外的難度應該還比較大。(當然我并不認為國內缺優(yōu)秀的DBA和研發(fā)人才) 第三個陣容就是規(guī)模小一些,但比較專注的數(shù)據(jù)庫玩家。 接下來我再帶大家簡單過一下這前兩個陣容,看看具體的數(shù)據(jù)庫產品都有哪些。
甲骨文的產品,我相對熟悉一些的有Oracle Database、MySQL以及Exadata一體機。
IBM DB2也是一個龐大的家族,除了傳統(tǒng)針對小型機、x86(好像用的人不多)、z/OS大型機和for i的版本之外,如今也有了針對云和數(shù)據(jù)挖掘的產品。記得抱枕大師對Informix的技術比較推崇,可惜這個產品發(fā)展似乎不太理想。
微軟除了看家的SQL Server之外,在Azure云上還能提供MySQL、PostgreSQL和MariaDB開源數(shù)據(jù)庫。應該說他們是傳統(tǒng)軟件License+PaaS服務兩條腿走路的。
如今人們一提起SAP的數(shù)據(jù)庫就想起HANA,之前從Sybase收購來的ASE(Adaptive Server Enterprise)和IQ似乎沒有之前發(fā)展好了。
在云服務提供商數(shù)據(jù)庫的3巨頭中,微軟有SQL Server的先天優(yōu)勢,甚至把它移植到了Linux擁抱開源平臺。關系型數(shù)據(jù)庫的創(chuàng)新方面值得一提的是Amazon Aurora和Google Spanner(也有非關系型特性),至于它們具體好在哪里我就不裝內行了:) 非關系型數(shù)據(jù)庫則是Amazon全面開花,這與其云計算業(yè)務發(fā)展早并且占據(jù)優(yōu)勢有關。Google當年的三篇經典論文對業(yè)界影響深遠,Yahoo基于此開源的Hadoop有一段時間幾乎是大數(shù)據(jù)的代名詞。HBase和Hive如今已不再是人們討論的熱點,而Bigtable和BigQuery似乎仍然以服務Google自身業(yè)務為主,畢竟GCP的規(guī)模比AWS要小多了。
最后這張DB-Engines的排行榜,相信許多朋友都不陌生,今年3月已經不是最新的數(shù)據(jù),在這里列出只是給大家一個參考。該排行榜幾乎在每次更新時,都會有國內數(shù)據(jù)庫專家撰寫點評。 以上是我周末的學習筆記,班門弄斧,希望對大家有幫助。 參考資料《Database Software Market:The Long-Awaited Shake-up》 https:///wp-content/uploads/2019/03/Database-Software-Market-White-Paper.pdf |
|
|
來自: kenu > 《科創(chuàng)板》