|
友友們,大家好!我最近發(fā)現(xiàn)一個(gè)很有意思的AI項(xiàng)目——MiniCPM-V,可以說它將AI技術(shù)的應(yīng)用推向了一個(gè)全新的高度,讓我們能夠?qū)PT-4V級(jí)的多模態(tài)大模型直接部署在我們的手機(jī)上,而且完全不需要聯(lián)網(wǎng),真正的手機(jī)本地玩AI大模型,萬物皆可AI?。ㄒ韵旅缊D,與題目無關(guān),純粹養(yǎng)眼
MiniCPM-V不僅僅是一個(gè)文本生成模型,它還側(cè)重于圖像處理。只需提供一張圖片和一些文本指示,MiniCPM-V就能迅速分析并生成相關(guān)內(nèi)容。無論是將圖片內(nèi)容轉(zhuǎn)化為Markdown格式,還是深入解析圖中細(xì)節(jié),MiniCPM-V都能以驚人的速度和準(zhǔn)確性完成。
2. 超級(jí)優(yōu)秀的OCR能力 這款模型在OCR(光學(xué)字符識(shí)別)領(lǐng)域表現(xiàn)尤為出色。在OCR的性能測(cè)試中,MiniCPM-V可以處理高達(dá)180萬像素的圖像,并且在OCRBench的測(cè)試中得分高達(dá)725分,超越了許多知名的商用閉源模型,如GPT-4o和Gemini Pro。
3. 多模態(tài)行為的可靠性 得益于最新的RLAIF-V對(duì)齊技術(shù),MiniCPM-V的多模態(tài)行為更加可靠,其幻覺率顯著低于其他模型,位列開源模型之首。
手把手教你體驗(yàn) MiniCPM-V兼容Windows、Mac以及Android設(shè)備,無論你使用什么設(shè)備,都可以享受到本地部署的便捷。對(duì)于Android用戶,體驗(yàn)這一神奇的AI模型更加簡(jiǎn)單,我又出手了,手把手帶你快速體驗(yàn): ①下載并安裝MiniCPM 1.2B和MiniCPM-V 2.0的APK文件 下載地址: https://github.com/OpenBMB/mlc-MiniCPM |
|
|