电竞比分网-中国电竞赛事及体育赛事平台

分享

[API]Google的語(yǔ)音識(shí)別API,支持各種語(yǔ)言

 quasiceo 2016-03-15

分類: 網(wǎng)絡(luò)與安全

[API]Google的語(yǔ)音識(shí)別API,支持各種語(yǔ)言
08-21
2011
24人簽到 這是laobubu的大作

沒 真的智能機(jī)的孩子你傷不起啊有木有!成天都是倒霉Symbian60啊有木有!上次超流量下載了Google Search for S60,里面神奇的有“語(yǔ)音搜索”……然后就是今天碰到android手機(jī)了,自帶一個(gè)語(yǔ)音輸入法?。∵@準(zhǔn)確率桿桿地!不過(guò)根據(jù)我多秒經(jīng)驗(yàn),S60的廢柴 API庫(kù)絕對(duì)沒有這么完美的語(yǔ)音識(shí)別(玩過(guò)諾基亞的應(yīng)該都知道,待機(jī)狀態(tài)長(zhǎng)按右軟件那個(gè)出來(lái)的是自帶的識(shí)別功能),所以肯定Google留了一手!


(軟件見http://www.google.com/intl/zh-CN_ALL/mobile/google-mobile-app/

廢話多了,現(xiàn)在看看Google的猥瑣API之STT?。▽儆趕peech-api v1的recognize)

http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN

不過(guò)使用不是那么簡(jiǎn)單的哦……

如何調(diào)用

要使用這個(gè)API,你得先有一些心理素質(zhì):面對(duì)倒霉的FLAC格式,因?yàn)檫@個(gè)API只支持FLAC格式的數(shù)據(jù),杯具啊。

不過(guò)你找到了我的博客,那么你是幸福的,因?yàn)槲乙呀?jīng)為你準(zhǔn)備了不少好東西了。(順便說(shuō)一句,如果要轉(zhuǎn)載記得清楚地標(biāo)注“來(lái)自http://blog.”,我信任你。)

現(xiàn)在看看如何請(qǐng)求數(shù)據(jù):

  • 【URL】http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN
  • 【方式】POST
  • 【請(qǐng)求頭】Content-Type:audio/x-flac; rate=16000
  • 【POST】flac文件的數(shù)據(jù)

如果你人品大爆發(fā),你成功了,可以得到類似這個(gè)的結(jié)果

{"status":0,"id":"54e1babccaa58682ffbb02ceb42aa47c-1", "hypotheses":[{"utterance":"測(cè)試程序","confidence":0.8556527}]}

不過(guò)不簡(jiǎn)單哦

實(shí)例:用于Python
#By

  1. import urllib2
  2. FILE='1.flac' #這里假設(shè)在當(dāng)前文件夾下有一個(gè)叫1.flac的文件被識(shí)別
  3. url = 'http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN'
  4. audio=open(FILE,'rb').read()
  5. headers = {'Content-Type' : 'audio/x-flac; rate=16000'}
  6. req = urllib2.Request(url, audio, headers)
  7. response = urllib2.urlopen(req)
  8. print response.read().decode('UTF-8')
頭疼:FLAC文件格式

這里我長(zhǎng)話短說(shuō),google的flac也有限制,22050 Hz 201kbps還正常,如果比這個(gè)大多了就不對(duì)了。

不過(guò)還有最要命的問(wèn)題,怎么生成FLAC文件?

沒關(guān)系,這里有救星:flac.exe包下載

http://datastorage./FLAC.zip (跟你說(shuō)的,上沒錯(cuò)的)

具體使用方法是【flac.exe 文件.wav】這樣在命令行調(diào)用即可,測(cè)試得知:不支持MP3等格式,但是支持基本的wav格式。

好了,你可以去制造你的app了,哈哈。

愛你:來(lái)自laobubu實(shí)驗(yàn)室的福音

為了方便,我寫了一個(gè)python程序,放在Google App Engine上面,只要提交一個(gè)音頻文件的URL(支持MP3、wav等常見格式),且文件不大,就可以得到結(jié)果了哦。(再次強(qiáng)調(diào),跟你說(shuō)的,上沒錯(cuò)的)

API入口:http://laobubumf./stt/
備用入口:http://glab./stt/

喜歡的話記得 1哦,當(dāng)然捐贈(zèng)我最不介意 :)

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多