科技日?qǐng)?bào)記者 楊雪
近日,字節(jié)跳動(dòng)在火山引擎原動(dòng)力大會(huì)上發(fā)布豆包視覺(jué)理解模型,為企業(yè)提供多模態(tài)大模型能力。豆包視覺(jué)理解模型千tokens(詞元)輸入價(jià)格僅為3厘,一元錢(qián)就可處理284張720P的圖片,比行業(yè)價(jià)格便宜85%,以更低成本推動(dòng)AI技術(shù)普惠和應(yīng)用發(fā)展。
研究顯示,人類接收的信息超過(guò)80%來(lái)自視覺(jué)。視覺(jué)理解將極大地拓展大模型的能力邊界,同時(shí)也會(huì)降低人們與大模型交互的門(mén)檻。
火山引擎總裁譚待介紹,豆包視覺(jué)理解模型通過(guò)算法、工程等技術(shù)創(chuàng)新,大幅優(yōu)化了使用成本。模型不僅能精準(zhǔn)識(shí)別視覺(jué)內(nèi)容,還具備出色的理解和推理能力,可根據(jù)圖像信息進(jìn)行復(fù)雜的邏輯計(jì)算,完成分析圖表、處理代碼、解答學(xué)科問(wèn)題等任務(wù)。
此前,豆包視覺(jué)理解模型已經(jīng)接入豆包App和PC端產(chǎn)品。豆包戰(zhàn)略研究負(fù)責(zé)人周昊表示,為了讓用戶的輸入更快更方便,豆包非常注重多模態(tài)的輸入和打磨,包括語(yǔ)音、視覺(jué)等能力,這些模型都已通過(guò)火山引擎開(kāi)放給企業(yè)客戶。
數(shù)據(jù)顯示,截至12月中旬,豆包通用模型的日均tokens使用量已超過(guò)4萬(wàn)億,較七個(gè)月前首次發(fā)布時(shí)增長(zhǎng)了33倍。大模型應(yīng)用正在向各行各業(yè)加速滲透。
據(jù)悉,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入多家手機(jī)、PC等智能終端,覆蓋終端設(shè)備約3億臺(tái),來(lái)自智能終端的豆包大模型調(diào)用量在半年時(shí)間內(nèi)增長(zhǎng)100倍。
“豆包大模型調(diào)用量的高速增長(zhǎng),是市場(chǎng)快速發(fā)展的一個(gè)縮影。大模型在各種場(chǎng)景中都在全面開(kāi)花,尤其是和企業(yè)生產(chǎn)力相關(guān)的場(chǎng)景。”譚待介紹,最近3個(gè)月,豆包大模型在信息處理場(chǎng)景的調(diào)用量增長(zhǎng)了39倍,客服與銷售場(chǎng)景增長(zhǎng)16倍,硬件終端場(chǎng)景增長(zhǎng)13倍,AI工具場(chǎng)景增長(zhǎng)9倍,學(xué)習(xí)教育等場(chǎng)景也有大幅增長(zhǎng)。
譚待認(rèn)為,豆包大模型市場(chǎng)份額的暴發(fā),得益于火山引擎“更強(qiáng)模型、更低成本、更易落地”的發(fā)展理念,讓每家企業(yè)都能用得起、用得好。
企業(yè)要落地好AI,不僅需要大模型,還需要有平臺(tái)能支持他們做好AI應(yīng)用的開(kāi)發(fā)。在這方面,火山引擎提供了火山方舟、扣子和Hiagent三款平臺(tái)產(chǎn)品。其中,火山方舟平臺(tái)提供了全棧MaaS(模型即服務(wù))能力,支持模型精調(diào)、推理、評(píng)測(cè)等全方位功能,也提供了豐富的插件能力、擴(kuò)展API(應(yīng)用程序接口)和高代碼解決方案。
據(jù)介紹,為幫助企業(yè)構(gòu)建好自身的AI能力中心,高效開(kāi)發(fā)AI應(yīng)用,火山引擎升級(jí)了火山方舟、扣子和HiAgent。其中,火山方舟發(fā)布了大模型記憶方案,并推出prefix cache和session cache API,降低延遲和成本?;鹕椒街圻€帶來(lái)全域AI搜索,具備場(chǎng)景化搜索推薦一體化、企業(yè)私域信息整合等服務(wù)。