專屬客服號
微信訂閱號
全面提升數據價值
賦能業務提質增效
面對全球爆紅的ChatGPT,百度閃電應戰。2月7日,百度官宣將在今年3月推出類ChatGPT項目——“文心一言”。一天后,百度CEO李彥宏將“引領搜索體驗的代際變革”列為2023年第一季度OKR關鍵任務。
GhatGPT成為火爆全球的國民級應用后,誰能率先推出中國版的GhatGPT,成為業界關注的焦點。百度看似匆匆迎戰,實則已經為此磨劍十年。百度希望以GhatGPT為起點,找到新的增長曲線。而百度AI的“十年一舞”也將在“文心一言”正式推出之時交出答卷。
百度AI戰略的“新閘口”?
很多人將ChatGPT稱為人工智能領域的里程碑和分水嶺。
自2022年11月底正式推出后,ChatGPT在全球范圍內瘋狂“圈粉”,上線僅5天用戶數量便突破100萬,上線兩個月月活數超過1億。作為AI自然語言生成領域的顛覆性產品,這個會聊天、懂代碼、通翻譯的工具除了好用之外,還為許多行業提供了巨大的想象空間和潛在的創業價值。
研發出ChatGPT的OpenAI已經給谷歌、百度這些利潤豐厚的搜索帝國拉響了“紅色警報”。
一位接近百度的業內人士告訴《中國電子報》記者,在百度三大業務支柱——搜索、云服務、自動駕駛中,搜索引擎業務是“鐵飯碗”,其帶來的廣告收入為公司盈利帶來了超過50%的貢獻,是填補另外兩大支柱業務巨額支出的重要經濟來源。
近幾年,搜索時代退潮、移動互聯網紅利見頂,百度的業務搜索和信息流增量等核心業務已經觸碰到“天花板”。前有字節跳動層層阻擊,后有京東、拼多多、美團等互聯網“后浪”步步緊逼,百度增長受到雙向擠壓。盡管資本市場依舊會將百度、阿里巴巴、騰訊并稱為BAT,但百度企業生存艱難已是不爭的事實。
ChatGPT的橫空出世,讓多年未見戰爭的搜索市場又見硝煙,百度必須做出強有力反擊,捍衛自己的基本盤。這也是ChatGPT爆紅之火,李彥宏迅速做出回應的原因所在。不過在外界看來,百度在以 ChatGPT為標桿重新評估搜索業務的同時,或許也為其未來最為倚重的AI戰略找到了“新閘口”。
“All in AI”,是百度過去10年最重要的戰略。以2013年建立美國研究院為起點,百度在AI方向上的探索長達10年。10年來,百度的研發投入累計超過1000億元,其中核心研發的投入占比連續多個季度超過了20%,這也讓百度成為BAT中最早進行人工智能轉型和投入最多的互聯網廠商,使百度與谷歌、微軟、亞馬遜并列全球四大AI巨頭。
日前,百度官宣,其開發的類似ChatGPT的項目“文心一言”(ERNIE Bot)將在3月份完成內測,面向公眾開放,成為第一個跟進ChatGPT相關項目的中國廠商。據透露,“文心一言”正在做上線前的沖刺,但按照谷歌和微軟對ChatGPT類應用投入緊追不舍的節奏,“文心一言”開放內測有可能提前。官宣第二日,李彥宏曝光了2023年第一季度OKR關鍵任務——“引領搜索體驗的代際變革”。有業內人士推測認為,“文心一言”將首先供給百度自家的搜索引擎,“搜索+生成”或將成為該項目應用落地的第一個爆點。
事實上,對于ChatGPT類生成式AI工具,百度“蓄謀已久”。去年9月,李彥宏公開表示,隨著發展,人工智能在“技術層面和商業應用層面”,都有方向性改變。近期流出的一份百度內部講話中,李彥宏再次強調:“技術已經到了臨界點,類似ChatGPT這樣的技術如何運用在搜索場景上,未來一年,在這方面我們非常有機會”。
接近百度的相關人士向記者透露,百度搜索早就接入了文心相關技術。2019年3月,百度已經開發了文心ERNIE 1.0系統;2020年,百度搜索開始應用“文心大模型”技術,逐步優化搜索的相關性、深度問答和內容理解等。
對于百度來說,推出“文心一言”的用意或首先在于“防御”,捍衛自己的搜索帝國。前幾日微軟將ChatGPT集成到自家Edge瀏覽器和必應搜索后,必應搜索應用程序和Edge瀏覽器在App Store排行榜上的排名迅速躥升,應用程序的全球下載量在一夜之間猛增10倍。全球搜索市場占有率第一的谷歌公司也緊隨其后宣布將推出AI對話式機器人“Bard”,并將此功能整合到自家的搜索引擎中,以挽回已經被動搖的市場。
中國人民大學應用經濟學院教授潘偉告訴《中國電子報》記者,像百度這類有技術、有產品的公司,最怕的是丟失用戶和流量。如果行業中有同類項目“先發制人”且快速聚攏了流量,那么留給百度的窗口期會很短。這種情況下,它采取的往往是跟進策略,在用戶的使用中不斷完善自己的產品,再考慮能否超越的問題。
媲美ChatGPT的機會點
ChatGPT是為數不多以技術為核心的互聯網現象級產品,其成功要素有幾點。一是ChatGPT有強大的技術底座“InstructGPT”模型。在此前三代的演進中,模型參數和數據規模越做越大,ChatGPT又引入了強化學習機制,添加人工標注的數據,通過人類的反饋,有針對性地進行優化。二是ChatGPT在數據質量和多樣性上非常講究。OpenAI雇傭了一個數十人的數據團隊,專門針對數據多樣性、標注體系進行精巧的設計,讓數據發揮出了強大的作用。三是在回復速度上,ChatGPT也領先一截。
記者此前就“百度要推出中國版ChatGPT會和OpenAI產生競爭關系嗎?”向ChatGPT提問。ChatGPT給出了“肯定”的回答:“如果百度真的推出了一個中國版的ChatGPT,那么它很可能與OpenAI產生競爭關系。兩家公司都試圖通過提供優質的人工智能模型和技術服務來吸引客戶和支持者,因此在市場上可能會出現競爭情況,影響兩家公司的市場份額和營收。”
想要超越ChatGPT并不容易。最近,谷歌剛剛推出Bard就遭遇“翻車”,因答錯問題市值蒸發了1000億美元,無非是因為用戶對ChatGPT類競品的期望值和關注度過高。谷歌如此,百度也不例外。
當被問及誰能推出抗衡中國版ChatGPT,一位業內專家告訴《中國電子報》記者,他首先想到的就是百度。“BAT各有各的優勢,比如百度的技術、阿里的運營、騰訊的產品。從這個角度來看,ChatGPT作為一個以AI技術為核心的產品,很適合長于技術、弱于運營的百度。”
“文心一言”背后的文心大模型(ERNIE)已經歷三次迭代,訓練數據超過千億,這為百度比肩ChatGPT奠定了一定基礎。雖然百度對文心大模型相關參數信息披露不多,但《Technology Review》兩年前的一份報告提到,百度在通用語言和理解評估競賽中擊敗了微軟和谷歌。根據百度此前發表的論文,文心大模型3.0Titan包含2600億個參數(ChatGPT使用1750億參數的GPT3.5模型),是當時中國最大的密集預訓模型,在68個NLP數據集上的性能已優于現階段最先進的語言模型,包括ChatGPT所應用的GPT3.5模型。
百度打造的“文心大模型家族”,已經形成“模型層+工具與平臺層+產品與社區層”的整體布局。2022年11月底,百度發布11個大模型和基于文心大模型的2大產品,即AI作畫產品“文心一格”和產業級搜索系統“文心百中”,如今已經在不同領域成功“試水”,比如“補全”《富春山居圖》、數字人度曉曉AI畫作賣出17萬元等。
雖然一些人工智能資深人士認為,在類ChatGPT技術上,中美基本持平,但華為諾亞方舟實驗室語音語義首席科學家劉群坦言,中國在技術上還是有差距的。其中一個是基礎模型本身的差距,雖然我們訓練了很多萬億模型或者是幾千億的模型,但訓練的充分程度,是遠遠不夠的。“我估計到現在為止,沒有哪個模型能吃GPT那么多數據。”劉群說。
在全球科技創新產業專家、海銀資本創始合伙人王煜全看來,ChatGPT類項目中國很多頭部企業也都在做,但更多的是放在后臺做,老百姓無法參與。這樣一來,“藏在深閨”的高科技到最后反而可能落伍。如今,基于ChatGPT的創業慢慢都已經成規模了,中國的AI頭部企業已經錯過了第一波。
或將成為新的增長曲線
“我們有這么酷的技術,那我們能不能把它變成人人需要的產品?”李彥宏此前表示,“這一步其實才是最難的,也是最偉大、最能夠產生影響力的。”此前,谷歌AlphaGo這類AI人機交互技術在圍棋游戲上確實達到了人類達不到的高度,但它的泛化能力有限,其商業前景則遠不如ChatGPT。
王煜全指出:“用戶在這個時代需要的永遠不是產品而是服務,需要的是規模化的服務,因為有人工智能,企業的規模化服務能力能夠做到個性化,用‘我’的能力來解決‘你’的需求。”
目前,ChatGPT尚不支持中國用戶注冊,即使谷歌或其他AI國際大廠下場,短時間內也不太可能為中國提供專屬內容。此外,中文的多義性有天然的高門檻,ChatGPT這類產品背后是整個互聯網龐大的語料庫,對于國內平臺來說自然無法避免合規性的問題。因此,除了自然地理解與回答用戶的各種刁鉆問題,中國版ChatGPT也需要比國外同類產品更嚴格的審核機制,甚至在早期可能還需要人工審核。
這就意味著,填補ChatGPT在國內市場形成的天然空缺,百度有很大機會。專家告訴記者,百度同時擁有“文心一言”技術和搜索市場優勢,相當于中國的“OpenAI+谷歌”。
相關研究報告顯示,截至目前,百度搜索引擎的用戶數已突破10億,是中國最大的搜索引擎。今年1月的百度Create AI開發者大會上,百度搜索杰出架構師辜斯繆介紹,百度搜索2023年最重要的工作是把整個檢索系統變成“檢索+生成”雙模系統。這就意味著,對于百度,生成式AI和搜索引擎將相互疊加,而不是替代。
“‘檢索+生成’雙模系統最終提供的服務質量會遠高于現在待機下的搜索服務質量。對比原來單元對話式的搜索模式,即搜索一個問題得到一個結果,未來的搜索模式可能變成多輪交互形式,但這跟對話式的多輪不一樣,它不追求聊天,而是讓用戶可以更高效地向搜索引擎提出需求,同時讓搜索迭代和調整適應用戶需求。比如搜索一張圖片,再用語言告訴搜索引擎怎么修改這張圖片,最后產生一個真正定制化的答案。”辜斯繆說。
ChatGPT類工具帶來的龐大算力需求無疑需要云的支撐。在這方面,百度同樣具有優勢。AI和云正巧是百度兩大業務支柱。根據IDC的報告,百度智能云在AI服務的維度在中國排名第一。
百度云一直是百度AI技術的“收款碼”。比如在制造業、能源、交通、政務這幾個快速增長的垂直市場,百度智能云可以直接產生云收入。并且,智能云這一塊利潤率也在上升,在擴大運營規模的同時,從低利潤率的定制項目里轉移推動標準化解決方案,提高經營利潤率。
據百度方面介紹,其在人工智能四層架構(底層芯片、深度學習框架、大模型以及上層應用),有全棧的布局。在基礎架構層,百度自研了昆侖芯及太行DPU等AI算力芯片;在應用平臺層,整合了百度AI飛槳深度學習框架和百度文心大模型后,能夠實現從數據存儲到AI模型訓練、生產、部署、測試的全鏈路、批量化生產。
基于這樣的架構,百度的AI應用開發的模式不再是手工作坊式的“一項目一訓練”,而是更像流水線工廠——AI底層技術被抽象出來,形成通用化、模塊化的平臺套件,百度只需要按照實際業務需求“搭積木”。
百度失去了移動互聯網的十年,寄希望于AI贏得未來的十年。ChatGPT是百度又一個新起點,若抓住這次機會,或讓百度找到新的增長曲線。
本文為本網轉載,出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性,如涉及侵權,請權利人與本站聯系,本站經核實后予以修改或刪除。
請完善以下信息,我們的顧問會在1個工作日內與您聯系,為您安排產品定制服務
評論