“文心一言累計(jì)用戶規(guī)模已達(dá)3億,日調(diào)用次數(shù)也達(dá)到了5億?!?月28日,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰在WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2024上宣布了文心一言的最新數(shù)據(jù),并正式發(fā)布文心大模型4.0 Turbo、飛槳框架3.0等最新技術(shù),披露飛槳文心生態(tài)最新成果。
通用人工智能新視角:技術(shù)通用、能力全面
人工智能的目標(biāo)是模擬、延伸和擴(kuò)展人的智能。王海峰認(rèn)為,大模型為通用人工智能帶來曙光,可以從兩個(gè)角度解讀,一是人工智能技術(shù)的通用性,二是能力的全面性。
人工智能技術(shù)歷經(jīng)幾十年發(fā)展,從早期的人工撰寫規(guī)則,到后來統(tǒng)計(jì)機(jī)器學(xué)習(xí),可以自動從數(shù)據(jù)中學(xué)習(xí),但解決不同場景的問題需要不同的算法,演進(jìn)到深度學(xué)習(xí)時(shí)代,算法的通用性大大加強(qiáng),深度神經(jīng)網(wǎng)絡(luò)一套架構(gòu)和技術(shù)可以解決各種問題,再到大模型時(shí)代,除了算法,模型也變得更加通用和統(tǒng)一。
在技術(shù)的通用性方面,大模型在面向不同任務(wù)、語言、模態(tài)、場景時(shí),通用性越來越強(qiáng)。以自然語言處理為例,之前有分詞、句法分析、語義匹配、機(jī)器翻譯、問答、對話等很多子方向,現(xiàn)在一個(gè)大語言模型就可以解決絕大多數(shù)任務(wù);語言方面,大模型既可以解決單語言的問題,也可以跨語言,不僅學(xué)習(xí)了人類的自然語言,也學(xué)習(xí)了人工定義的形式語言,架起了從思考到執(zhí)行的橋梁;同時(shí),大模型也可以實(shí)現(xiàn)多模態(tài)的統(tǒng)一建模,廣泛賦能各行各業(yè)應(yīng)用等。總體上,人工智能技術(shù)的通用性越來越強(qiáng)。
在能力的全面性方面,理解、生成、邏輯、記憶是人工智能的四項(xiàng)基礎(chǔ)能力,創(chuàng)作、解題、代碼、規(guī)劃、決策等人工智能的典型能力,基本上都是這四項(xiàng)基礎(chǔ)能力的綜合運(yùn)用。以基于文心大模型實(shí)現(xiàn)的運(yùn)營活動系統(tǒng)為例,模型首先理解用戶需求,進(jìn)行系統(tǒng)設(shè)計(jì),然后規(guī)劃相關(guān)的任務(wù)來執(zhí)行,接下來根據(jù)規(guī)劃生成代碼,逐步實(shí)現(xiàn)系統(tǒng)搭建,包括數(shù)據(jù)庫、后端功能、前端頁面,等等,再進(jìn)行服務(wù)的部署,如果部署失敗,模型能夠根據(jù)報(bào)錯(cuò)信息自動反思迭代,直到部署成功,服務(wù)順暢運(yùn)行。大模型完成系統(tǒng)開發(fā)到服務(wù)運(yùn)行的過程,充分體現(xiàn)了大模型的理解、生成、邏輯、記憶四項(xiàng)基礎(chǔ)能力,以及對這四項(xiàng)能力的綜合運(yùn)用。這四項(xiàng)能力越強(qiáng),越接近通用人工智能。
文心大模型4.0 Turbo發(fā)布,文心一言用戶規(guī)模達(dá)3億
大會現(xiàn)場,王海峰發(fā)布了文心大模型4.0 Turbo,網(wǎng)頁版、APP、API陸續(xù)面向用戶開放。據(jù)了解,企業(yè)用戶即刻起登錄百度智能云千帆大模型平臺即可使用API服務(wù)。
以用戶使用文心大模型設(shè)計(jì)調(diào)查問卷為例,展示了文心大模型 4.0 Turbo的速度更快,效果更好。
公開資料顯示,百度自2010年起開始全面布局人工智能,2019年3月推出文心大模型1.0,持續(xù)迭代升級, 去年10月發(fā)布文心大模型4.0,今年4月發(fā)布文心大模型4.0工具版。今天,又發(fā)布了文心大模型4.0 Turbo。文心大模型是基于飛槳平臺研制的知識增強(qiáng)大模型,從萬億級數(shù)據(jù)和千億級知識中融合學(xué)習(xí),具備知識增強(qiáng)、檢索增強(qiáng)和對話增強(qiáng)等核心技術(shù)。
在強(qiáng)大的基礎(chǔ)大模型基礎(chǔ)上,進(jìn)一步創(chuàng)新智能體技術(shù),包括理解、規(guī)劃、反思和進(jìn)化,能夠做到可靠執(zhí)行、自我進(jìn)化,并一定程度上將思考過程白盒化,讓機(jī)器像人一樣思考和行動,能夠調(diào)用工具自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)實(shí)現(xiàn)自主進(jìn)化。目前,文心一言累計(jì)用戶規(guī)模已達(dá)3億,日調(diào)用次數(shù)5億。
大會還發(fā)布了中國工程院朱有勇院士及團(tuán)隊(duì)與百度共同打造的首個(gè)農(nóng)業(yè)智能體——“農(nóng)民院士智能體”。它基于文心智能體平臺創(chuàng)建,學(xué)習(xí)了朱有勇院士的研究成果以及相關(guān)的農(nóng)業(yè)知識,可以為農(nóng)民解答生產(chǎn)生活中的問題,促進(jìn)科技助農(nóng)惠農(nóng)。瀾滄拉祜族自治縣竹塘鄉(xiāng)黨委書記丁杏杏、云山村村民李福受邀來到大會現(xiàn)場,分享了使用“農(nóng)民院士智能體”為他們的農(nóng)業(yè)生產(chǎn)帶來的便利。
飛槳框架3.0發(fā)布,飛槳文心生態(tài)開發(fā)者達(dá)1465萬
文心大模型的持續(xù)快速進(jìn)化,得益于百度在芯片、框架、模型和應(yīng)用上的全棧布局,尤其是飛槳深度學(xué)習(xí)平臺和文心的聯(lián)合優(yōu)化。王海峰發(fā)布了飛槳新一代框架——飛槳框架3.0,具備動靜統(tǒng)一自動并行、編譯器自動優(yōu)化、大模型多硬件適配、大模型訓(xùn)推一體等核心技術(shù),支撐大模型效果更好,性能更優(yōu)。截至目前,飛槳文心生態(tài)已凝聚1465萬開發(fā)者,服務(wù)37萬家企事業(yè)單位,創(chuàng)建95萬個(gè)模型。
王海峰最后表示,縱觀人類經(jīng)歷的前三次工業(yè)革命,其核心驅(qū)動力量機(jī)械技術(shù)、電氣技術(shù)和信息技術(shù)都有很強(qiáng)的通用性,會應(yīng)用于各行各業(yè),當(dāng)它們呈現(xiàn)出標(biāo)準(zhǔn)化、自動化和模塊化的工業(yè)大生產(chǎn)特征,核心技術(shù)就進(jìn)入工業(yè)大生產(chǎn)階段?,F(xiàn)階段的人工智能技術(shù),基于深度學(xué)習(xí)及大模型工程平臺,包括算法、數(shù)據(jù)、模型、工具等,也已經(jīng)具備了非常強(qiáng)的通用性,并具備了標(biāo)準(zhǔn)化、模塊化和自動化的特征,推動人工智能進(jìn)入到工業(yè)大生產(chǎn)階段,通用人工智能將加速到來。