电竞比分网-中国电竞赛事及体育赛事平台

分享

手機(jī)“本地”也能玩轉(zhuǎn)AI大模型 - 萬物皆可AI

 學(xué)生有禮111 2024-07-02

友友們,大家好!我最近發(fā)現(xiàn)一個(gè)很有意思的AI項(xiàng)目——MiniCPM-V,可以說它將AI技術(shù)的應(yīng)用推向了一個(gè)全新的高度,讓我們能夠?qū)PT-4V級(jí)的多模態(tài)大模型直接部署在我們的手機(jī)上,而且完全不需要聯(lián)網(wǎng),真正的手機(jī)本地玩AI大模型,萬物皆可AI?。ㄒ韵旅缊D,與題目無關(guān),純粹養(yǎng)眼圖片

圖片

MiniCPM-V的核心亮點(diǎn)
1. 強(qiáng)大的圖像處理能力

MiniCPM-V不僅僅是一個(gè)文本生成模型,它還側(cè)重于圖像處理。只需提供一張圖片和一些文本指示,MiniCPM-V就能迅速分析并生成相關(guān)內(nèi)容。無論是將圖片內(nèi)容轉(zhuǎn)化為Markdown格式,還是深入解析圖中細(xì)節(jié),MiniCPM-V都能以驚人的速度和準(zhǔn)確性完成。

圖片

2. 超級(jí)優(yōu)秀的OCR能力

這款模型在OCR(光學(xué)字符識(shí)別)領(lǐng)域表現(xiàn)尤為出色。在OCR的性能測(cè)試中,MiniCPM-V可以處理高達(dá)180萬像素的圖像,并且在OCRBench的測(cè)試中得分高達(dá)725分,超越了許多知名的商用閉源模型,如GPT-4o和Gemini Pro。

圖片

3. 多模態(tài)行為的可靠性  

得益于最新的RLAIF-V對(duì)齊技術(shù),MiniCPM-V的多模態(tài)行為更加可靠,其幻覺率顯著低于其他模型,位列開源模型之首。

圖片

手把手教你體驗(yàn)

MiniCPM-V兼容Windows、Mac以及Android設(shè)備,無論你使用什么設(shè)備,都可以享受到本地部署的便捷。對(duì)于Android用戶,體驗(yàn)這一神奇的AI模型更加簡(jiǎn)單,我又出手了,手把手帶你快速體驗(yàn):

①下載并安裝MiniCPM 1.2B和MiniCPM-V 2.0的APK文件

下載地址:

https://github.com/OpenBMB/mlc-MiniCPM

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多