电竞比分网-中国电竞赛事及体育赛事平台

分享

23種深度學(xué)習(xí)庫(kù)排行榜:TensorFlow、Keras、caffe占據(jù)前三!

 工農(nóng)子弟兵 2017-10-25

“全球人工智能”擁有十多萬(wàn)AI產(chǎn)業(yè)用戶,10000多名AI技術(shù)專家。主要來(lái)自:北大,清華,中科院,麻省理工,卡內(nèi)基梅隆,斯坦福,哈佛,牛津,劍橋...以及谷歌,騰訊,百度,臉譜,微軟,阿里,??低暎ミ_(dá)......等全球名校和名企。


——免費(fèi)加入AI技術(shù)專家社群>>

——免費(fèi)加入AI高管投資者群>>

——申請(qǐng)成為AI高校推廣大使>>

我們對(duì)23種用于數(shù)據(jù)科學(xué)的開源深度學(xué)習(xí)庫(kù)作了排名。這番排名基于權(quán)重一樣大小的三個(gè)指標(biāo):Github上的活動(dòng)、Stack Overflow上的活動(dòng)以及谷歌搜索結(jié)果。


排名結(jié)果


下面是23種用于數(shù)據(jù)科學(xué)的開源深度學(xué)習(xí)庫(kù)的排名,按照Github上的活動(dòng)、Stack Overflow上的活動(dòng)以及谷歌搜索結(jié)果來(lái)衡量。該表顯示了標(biāo)準(zhǔn)化分?jǐn)?shù),1這個(gè)值表示高于平均值(平均值=0)一個(gè)標(biāo)準(zhǔn)偏差。比如說(shuō),Caffe高于Github活動(dòng)方面的平均值一個(gè)標(biāo)準(zhǔn)偏差,而deeplearning4j接近平均值。



方法詳見(jiàn)如下


結(jié)果和討論


排名基于權(quán)重一樣大小的三個(gè)指標(biāo):Github(星標(biāo)和分支)、Stack Overflow(標(biāo)簽和問(wèn)題)以及谷歌結(jié)果(總體增長(zhǎng)率和季度增長(zhǎng)率)。這些是使用可用的API獲得的。制作一個(gè)全面的深度學(xué)習(xí)工具包列表很棘手——最后,我們列出了我們認(rèn)為有代表性的五個(gè)不同的列表(參閱下面介紹的方法,可了解詳細(xì)信息)。計(jì)算每個(gè)度量指標(biāo)的標(biāo)準(zhǔn)化分?jǐn)?shù)后,我們就能看到哪些軟件包在每個(gè)類別中脫穎而出。完整排名在這里(https://github.com/thedataincubator/data-science-blogs/blob/master/output/DL_libraries_final_Rankings.csv),原始數(shù)據(jù)在這里(https://github.com/thedataincubator/data-science-blogs/blob/master/output/deep_learning_data.csv)。


TensorFlow憑最大的活躍社區(qū)一路領(lǐng)跑


在所有衡量指標(biāo)中,TensorFlow比平均值高出至少兩個(gè)標(biāo)準(zhǔn)偏差。相比第二大流行框架:Caffe,TensorFlow的Github分支數(shù)量幾乎是其三倍,Stack Overflow問(wèn)題更是其六倍以上。TensorFlow最初由谷歌Brain團(tuán)隊(duì)于2015年開源,發(fā)展勢(shì)頭已超過(guò)歷史更悠久的庫(kù),比如Theano(第4位)和Torch(第8位),躍居我們榜單的首位。雖然TensorFlow附帶在C 引擎上運(yùn)行的Python API,但本榜單上的幾種庫(kù)可以使用TensorFlow作為后端,提供各自的接口。這些庫(kù)包括Keras(第2位,很快將成為核心TensorFlow的一部分)和Sonnet(第6位)。TensorFlow之所以人氣這么高,可能是由于它結(jié)合了通用深度學(xué)習(xí)框架、靈活的接口、外觀整潔的計(jì)算圖形可視化以及谷歌龐大的開發(fā)者和社區(qū)資源。


Caffe尚未被Caffe2所取代


Caffe在本榜單上排名第三,Github上的活動(dòng)比其所有競(jìng)爭(zhēng)對(duì)手(TensorFlow除外)都要多。Caffe歷來(lái)被認(rèn)為比Tensorflow更專門化,當(dāng)初專注于圖像處理、對(duì)象識(shí)別和預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)。Facebook于2017年4月發(fā)布了Caffe2(第11名),Caffe2已經(jīng)躋身于深度學(xué)習(xí)庫(kù)的上半部分。Caffe2是一種更輕量級(jí)、模塊化、可擴(kuò)展的Caffe,它包括循環(huán)神經(jīng)網(wǎng)絡(luò)。Caffe和Caffe2是獨(dú)立的代碼庫(kù),所以數(shù)據(jù)科學(xué)家可以繼續(xù)使用原來(lái)的Caffe。然而,一些遷移工具(比如Caffe Translator)為使用Caffe2來(lái)驅(qū)動(dòng)現(xiàn)有的Caffe模型提供了一種手段。


Keras是最流行的深度學(xué)習(xí)前端


Keras(第2位)是排名最高的非框架庫(kù)。Keras可以用作TensorFlow(第1位)、Theano(第4位)、MXNet(第7位)、CNTK(第9位)或deeplearning4j(第14位)的前端。Keras在所有三個(gè)衡量指標(biāo)方面的表現(xiàn)均勝過(guò)平均值。Keras之所以人氣很旺,可能歸功于其簡(jiǎn)單性和易用性。Keras允許用戶快速建立原型,代價(jià)是直接使用框架所帶來(lái)的靈活性和控制性方面欠缺一點(diǎn)。Keras頗受對(duì)數(shù)據(jù)集使用深度學(xué)習(xí)的數(shù)據(jù)科學(xué)家的青睞。由于R Studio最近發(fā)布了使用R的面向Keras的接口,Keras的發(fā)展和人氣指數(shù)不斷提升。


即便沒(méi)有行業(yè)的大力支持,Theano依然名列前茅


在眾多新的深度學(xué)習(xí)框架中,Theano(第4位)是本榜單上歷史最悠久的庫(kù)。Theano率先使用了計(jì)算圖,在整個(gè)深度學(xué)習(xí)和機(jī)器學(xué)習(xí)研究界當(dāng)中仍很受歡迎。Theano實(shí)際上就是面向Python的數(shù)值計(jì)算庫(kù),但可以與像Lasagne(第15位)這樣的高級(jí)深度學(xué)習(xí)封裝庫(kù)一起使用。谷歌支持TensorFlow(第1位)和Keras(第2位),F(xiàn)acebook支持PyTorch(第5位)和Caffe2(第11位),而MXNet(第7位)是亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)的官方深度學(xué)習(xí)框架,微軟設(shè)計(jì)并維護(hù)CNTK(第9位),雖然沒(méi)有得到哪家技術(shù)行業(yè)巨頭的官方支持,但Theano依然頗受歡迎。


Sonnet是發(fā)展最快的庫(kù)


2017年年初,谷歌的DeepMind公開發(fā)布了Sonnet(第6位)的代碼,這是一種以TensorFlow為基礎(chǔ)的面向?qū)ο蟮母呒?jí)庫(kù)。這個(gè)季度相比上個(gè)季度,Sonnet的谷歌搜索結(jié)果中返回的頁(yè)面數(shù)量增加了272%,這是我們排名的所有庫(kù)中增幅最大的。雖然谷歌在2014年收購(gòu)了DeepMind這家英國(guó)人工智能公司,但DeepMind和谷歌Brain仍擁有基本上獨(dú)立的團(tuán)隊(duì)。DeepMind專注于強(qiáng)人工智能,Sonnet可以幫助用戶在特定的AI想法和研究的基礎(chǔ)上構(gòu)建神經(jīng)網(wǎng)絡(luò)。


Python是深度學(xué)習(xí)接口的首選語(yǔ)言


PyTorch(第5位)是其單一接口使用Python的一種框架,它是本榜單上發(fā)展速度第二快的庫(kù)。與上季度相比,PyTorch的谷歌搜索結(jié)果多了236%。在我們排名的23種開源深度學(xué)習(xí)框架和封裝庫(kù)中,只有三種沒(méi)有使用Python的接口:Dlib(第10位)、MatConvNet(第20位)和OpenNN(第23位)。C 接口和R接口分別用于23種庫(kù)中的7種庫(kù)和6種庫(kù)。雖然數(shù)據(jù)科學(xué)界在使用Python方面幾乎趨于一致,但是深度學(xué)習(xí)庫(kù)方面還是有許多選擇。


限制


與任何分析一樣,我們一路上做出了決定。所有源代碼和數(shù)據(jù)都在我們的Github頁(yè)面上。深度學(xué)習(xí)庫(kù)的完整列表來(lái)自幾個(gè)來(lái)源。


當(dāng)然,一些歷史更悠久的庫(kù)會(huì)有更高的指標(biāo),因而排名更高。唯一考慮到這一點(diǎn)的指標(biāo)是谷歌搜索季度增長(zhǎng)率。


數(shù)據(jù)帶來(lái)了幾個(gè)難題:


  • Neural Designer和Wolfram Mathematica是專有的,已被剔除

  • cntk又叫微軟認(rèn)知工具包,但是我們只使用了原來(lái)的ctnk名字

  • neon改成了nervana neon

  • paddle改成了paddlepaddle

  • 一些庫(kù)顯然是其他庫(kù)的衍生版,比如Caffe和Caffe2。如果這些庫(kù)有獨(dú)特的github代碼庫(kù),我們決定將它們分開來(lái)對(duì)待。


方法


所有源代碼和數(shù)據(jù)都放在我們的Github頁(yè)面(https://github.com/thedataincubator/data-science-blogs)上。


我們先從五個(gè)不同的來(lái)源制作了23種開源深度學(xué)習(xí)庫(kù)列表,然后為所有庫(kù)收集了指標(biāo),以得出排名。Github數(shù)據(jù)基于星標(biāo)和分支,Stack Overflow數(shù)據(jù)基于含有軟件包名稱的標(biāo)簽和問(wèn)題,谷歌結(jié)果基于過(guò)去五年的谷歌搜索結(jié)果總數(shù)和過(guò)去三個(gè)月較之前三個(gè)月計(jì)算出來(lái)的季度結(jié)果增長(zhǎng)率。


其他一些注意事項(xiàng):


  • 幾個(gè)庫(kù)是常用詞(caffe、chainer和lasagne),因此用來(lái)確定谷歌搜索結(jié)果數(shù)量的搜索詞包括庫(kù)名和“deep learning”這個(gè)術(shù)語(yǔ)。

  • 任何缺少的Stack Overflow計(jì)數(shù)一律轉(zhuǎn)換為零計(jì)數(shù)。

  • 計(jì)數(shù)標(biāo)準(zhǔn)化,均值為0,偏差為1,然后求平均值,以獲得Github和Stack Overflow分?jǐn)?shù),最后結(jié)合搜索結(jié)果得出總分。

  • 進(jìn)行一番手動(dòng)檢查,確認(rèn)Github的代碼庫(kù)位置。

系統(tǒng)學(xué)習(xí),進(jìn)入全球人工智能學(xué)院

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多