專屬客服號
微信訂閱號
全面提升數據價值
賦能業務提質增效
除了“ChatGPT之父”奧特曼被OpenAI董事會罷免之外,剛剛過去的這幾天,有關大模型的消息多次刷屏。先是馬斯克旗下人工智能初創公司xAI推出首款人工智能模型Grok,公開叫板OpenAI,再是OpenAI轉身甩出一個“王炸”,GPT-4 Turbo、自定義GPT及GPT商店接連登場,令整個業界為之震撼。緊接著,一場DDoS攻擊導致ChatGPT發生全球大宕機,不得不宣布推遲新功能上線時間,并暫停新的ChatGPT Plus注冊。
國內大模型市場也是一片沸騰。招聯金融、馬上消費等連番發布金融大模型,OPPO、小米、vivo等紛紛官宣大模型“上機”,美的、長虹、TCL等家電品牌下場自研大模型……在“模型熱”正酣之時,百度CEO李彥宏卻直言“國內大模型太多、應用太少”,再度引發熱議。“卷”起來的GPT生態圈背后是對大模型未來的思索。
馬斯克“Grok”對戰“ChatGPT”勝算幾何?
馬斯克的高調加入無疑會讓大模型之爭進一步升級。業內人士猜測,馬斯克選擇在這個時間點發布模型,是為了“對抗”OpenAI。不過,相較之下,Grok的入局晚了不少,勝算幾何尚難評估。
OpenAI最近舉辦的首次開發者大會賺足了眼球,比如全新升級的GPT-4 Turbo支持128k上下文,價格卻降低了2/3,沖擊了現有的商用服務價格;新推出的GPTs將大模型從技術推向了商業化,這對產業發展而言是至關重要的一步。
OpenAI創始人Sam Altman對ChatGPT至今的成就進行了回顧。他說道:“到目前為止,我們已經擁有大約200萬的開發者,他們在我們提供的API上構建了各種各樣的應用,并取得了令人驚嘆的成果。超過92%的世界500強企業都在使用我們的產品作為基礎。此外,我們的周活躍用戶數量已經達到了約1億。”這些數據意味著OpenAI在構建大模型商業閉環的過程中,已經成功地吸引了最有付費意愿和需求的客戶群體。
不過,ChatGPT也并非十全十美。北京計算機學會數字經濟專委會秘書長王娟向《中國電子報》記者表示:“ChatGPT對新生事物認知有盲點和漏洞,很多測試開始給模型‘喂數據’誘導結果,大模型也有脫軌的時候。”
“生成式AI的市場應用依然處于早期階段,一切皆有可能。”Forrester副總裁、研究總監戴鯤在接受《中國電子報》記者采訪時分析稱,“xAI的商業版圖融合了大模型、社交平臺、自動駕駛與腦機接口等不同領域,差異化的生態能力為Grok的未來發展提供了獨具特色的發展可能。”
根據已經公布的一些測試數據,Grok在GSM8k(中學數學單詞)、MMLU(多學科多項選擇)、HumanEval(代碼完成)、MATH(初高中數學)等多項數學和推理能力的基準測試中性能均優于GPT-3.5,雖然距離GPT-4還有或多或少的距離,但作為第一次正式發布的公測版本,Grok-1已經有非常顯著的進展。
而在訓練數據方面,GPT-4在訓練數據的廣度和深度方面都具備顯著的先發生態優勢,也可以在調用時實時搜索Web數據,這是Grok所不具備的。Grok的差異化優勢在于它可以更有效地訪問X平臺(即之前的Twitter)的信息,這賦予了Grok實時社交平臺數據洞察及多樣化的生成風格。
“巨量、實時且獨特的數據是該模型的基礎,可以實時從推文中獲取最新知識,主打一個實時性,也就是說,這個模型還在不斷學習和更新。同時,Grok有著不走尋常路的幽默模式語言風格,馬斯克的個人風格在其中凸顯,開發語言是Rust以及深度學習框架新秀JAX,分布式的架構讓系統避免了大模型的系統性風險。”王娟表示。
“Grok的定位并不一定是GPT的競品,GPT定位是全場景的AI平臺,Grok更多是適合X的大模型應用平臺,兩者的定位不一樣。Grok是一個不錯的補充。”開放原子開源基金會TOC主席譚中意對《中國電子報》記者說道。
GPT生態選擇題:開源還是閉源?
無論是Grok與OpenAI的對決,還是國內各種大模型的比拼,想要突出重圍,生態建設是重中之重。這也是OpenAI、阿里云、騰訊等廠商著急做模型商店的根本原因。
“OpenAI的模型商店從理念上與國內大部分廠商的戰略規劃是一致的,都希望通過模型商店的方式打造生態,一方面便于中小廠商引流,另一方面更利于客戶選擇和開發人員與廠商協作,以此實現圍繞GPT大模型更強的黏性,最終推動營收的增長。”戴鯤說道。
但同時他也指出,由于廠商自身的市場定位與發展戰略不同,模型的覆蓋、模型被集成的機制、面向的客戶群體、針對的行業細分與商業場景、對底層云平臺的選擇、與相關云服務的集成、計量計費、許可與定價模式等各個方面肯定會存在差異。
“雖然都要做模型商店,但OpenAI要做的模型商店和騰訊、阿里等要做的模型商店差異很大。騰訊、阿里云提供的是MaaS服務(模型即服務),它們的模型商店支持多種不同的模型(開源和閉源的模型都包括);OpenAI則是在其閉源的ChatGPT上提供各種定制化的服務,依賴于其提供的底層模型。”譚中意說道。
就像持續至今的“iOS”和“安卓”之爭,大模型的生態建設同樣面臨開源還是閉源這道選擇題。譚中意認為:“OpenAI的ChatGPT是閉源的,Meta的Llama2是開源的。以后的大模型生態,將是開源生態和閉源生態之間的競爭和合作同時并存。”
在國內,百川智能大模型、智源AI大模型、騰訊混元大模型、阿里云通義千問大模型等都宣布加入開源的“大部隊”。而華為的盤古大模型、百度的文心一言等則選擇了閉源。
戴鯤指出,與傳統技術領域不同,大模型的開源包含多種不同層次,涉及模型架構、用于模型預訓練的代碼與超參數、完成預訓練的模型權重與參數、用于模型評估的輸入數據預處理代碼與模型評估代碼、全過程配置與開發文檔、API與插件接口、許可證方式等。保持開放的接口與插件體系、搭配開放的文檔與有限開源的商業許可是必然的選擇,而其他層次的開源與否可以根據市場發展動態選擇。
“模型商店帶來的將是更加廣泛的數據和商業模式。如果開源能夠提供閉源所不能替代的活躍度,同時促進開發,當然很好。但如果只是增加了短期的應對負荷和同質化產品競爭,對技術和商業價值都沒有太大意義,閉源就很好。”王娟說道。同時她指出,OpenAI至少目前的目的不是純粹的商業化。騰訊、阿里的模型商店是要用模型盈利和定價帶動應用層的配套,以及云和硬件產業鏈市場。
百川智能創始人、CEO王小川表示,未來開源和閉源會像蘋果和安卓系統一樣并行發展。大部分服務會依賴開源模型,而閉源會提供特定的增值服務。開源模型提供80%,最后靠閉源提供剩下的20%。
模型生態究竟應該怎么建?
發展至今,無論是通用大模型還是行業垂直大模型,賽道上都已擠滿了各類玩家,有互聯網科技公司,有AI技術公司,還有手機廠商、家電廠商、金融機構、文娛公司、教育機構等跨界選手。這反映出業界對大模型抱有極大的熱情與信心,但同時也表明產業尚未形成一個真正具備吸引力和競爭力的模型生態。
談及構建模型生態的關鍵要素,戴鯤表示,模型自身的能力、廠商的平臺化能力和生態運營能力,三者缺一不可。首先,模型要有卓越的性能、出色的多模態支持、良好的開放性與快速迭代、良好體驗的開發環境、完善的文檔與案例等;其次,廠商必須具備平臺化能力,比如涵蓋公有云、私有云與邊緣云在內的服務于ModelOps的全棧云原生能力平臺化,圍繞模型的人工智能平臺與數據管理的全生命周期平臺化,面向各行業細分業務場景進行模型定制的平臺化,以及涵蓋從底層芯片到開發和上層應用的軟硬件適配平臺化等;此外,廠商還需具備生態運營的能力,比如對國內、國際開源社區與產業聯盟的貢獻與影響,從模型開發到工程實踐對開發人員的有效支持以及企業業務與技術決策者的思想領導力等。
“頭部廠商積累的數據客觀上形成模型生態的競爭基礎,所以在生態建設方面,字節、騰訊、阿里這些企業的核心競爭力更具優勢。”王娟表示。實際上,模型并非越多越好,國內現在大模型很熱,已有的大模型愿景大多是做全產業鏈布局的。很多看上去不錯的大模型,實際本身不僅不產生任何價值,還造成了算力、人力和財力的浪費。
根據專家預測,未來幾十年與大模型相關的產業形態,首先是有幾家提供通用大模型服務的企業,包括百度、阿里等;其次是多家企業提供行業大模型的服務,包括金融、能源、制造等行業;最后是數百家甚至上千家技術企業提供企業內部的私有化大模型服務,用于知識管理、軟件開發、供應鏈等具體場景。每家企業內都會有很多大模型的服務,其中大部分是部署在企業內部的私有化大模型服務,也有少部分是訪問公網大模型API服務。
“要建立不錯的生態環境,需要卓越的技術能力和商業能力,從國內大模型廠商來看,百度相對而言技術實力比較靠前,騰訊和阿里云也有豐富的應用場景,都有不錯的前景。”譚中意表示。不過,對比OpenAI,差距還是非常明顯的。比如中文數據集在數量上和質量上還跟英文數據集有很大差距,算力也受到很大限制,架構在大模型上的開發生態才剛剛開始。
“我們需要的大模型是一個能夠持續進化的大模型,是一個能在此基礎上產生健康生態(開發活躍、良性競爭、技術和商業都兼顧)的大模型,中國的大模型生態應該是閉源和開源互相競爭、互相合作的模式。”譚中意表示。
來源:中國電子報、電子信息產業網 記者 宋婧
本文為本網轉載,出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性,如涉及侵權,請權利人與本站聯系,本站經核實后予以修改或刪除。
請完善以下信息,我們的顧問會在1個工作日內與您聯系,為您安排產品定制服務
評論