李彥宏不寒磣:不賺錢,做大模型幹嗎?

2024-04-19 18:40:05    編輯: robot
導讀 在商言商,只要未被利益蒙蔽雙眼,因商業利益而爲自家產品、技術路线強硬站台,無可厚非。對李彥宏和他的百度來說顯然也是如此,其既不是發布會上鼓吹的“讓人人都是开發者”的那樣高尚,也不是周鴻禕反駁中的“胡...

在商言商,只要未被利益蒙蔽雙眼,因商業利益而爲自家產品、技術路线強硬站台,無可厚非。對李彥宏和他的百度來說顯然也是如此,其既不是發布會上鼓吹的“讓人人都是开發者”的那樣高尚,也不是周鴻禕反駁中的“胡說八道和忽悠”。

  作者|Cindy

 編輯|劉珊珊

一位行業領袖對技術路线的斷言甚至是“拉踩”,其影響,或許將遠超公衆預判。

“开源模型會越來越落後。”Create 2024百度AI开發者大會上,一襲白衣的百度創始人、董事長兼首席執行官李彥宏,斷言稱,“大家以前用开源覺得开源便宜,其實在大模型場景下,开源是最貴的。”

這是數天內,Robin對开源大模型潑下的第二瓶冷水——此前4月11日,李彥宏在內部信中也稱,大模型开源意義不大。

作爲國內大模型較早入局者,百度在去年3月發布文心一言大模型,選擇走閉源路线。一年間,文心大模型已迭代至目前的4.0。

李彥宏觀點在行業內引發不小爭議,認爲以他國內AI布道者地位,不應如此武斷。畢竟,开源創新力量幾乎被每一位开發者公認,整個互聯網都建立在开源基礎上,才有了如今信息世界的暢通無阻。

 

因此也有多位現場媒體人猜測,李彥宏是否在暗指或diss行業其他閉源模型。

“百模大战”如火如荼,行業大佬下場對壘成爲常態。如百川智能創始人兼首席執行官王小川,今年3月因李彥宏“文心一言4.0在中文處理上已經超越了ChatGPT 4.0”的表態,與百度高管多次互嗆。

自稱“开源信徒”的360創始人周鴻禕,截至目前已連續兩次(4月13日、4月18日)在公开場合炮轟李彥宏言論,他表示沒有开源,就沒有Linux、沒有互聯網,“开源不如閉源好是胡說八道,是忽悠,連說這話支持閉源的公司都是靠开源才發展起來。”

值得一提的是,百川智能、360都是开源大模型。而大模型开閉源之爭,也早是業界兩大陣營爭論話題,從去年7月Llama 2宣布开源可直接商用就已开始,並在最近馬斯克起訴OpenAI,要求OpenAI恢復开源並給予賠償後,掀起廣泛爭論。

一切技術路线爭議終點,是需要商業化掙錢。大模型加速商業化下半場,對“all in”人工智能的百度來說,作爲國內最早利用通用大模型會員付費模式,向C端用戶收費企業,依靠大模型搞錢想法之迫切顯而易見——此前內部信中,李彥宏說得很直接:閉源才有真正的商業模式。才能夠真正賺到錢的,能夠賺到錢才能聚集算力、聚集人才。

從這個角度看,不賺錢,還做大模型幹嗎?這並不寒磣。但問題是,僅選擇开閉源任一道路,是否在通向極端?开源是否真的落後於閉源?閉源是否能真正代表大模型“商業化”破局之道?

01

开源一直領先閉源?

在李彥宏看來,無論是技術還是商業模式上,閉源模型都會持續地領先,而不是一時領先。

开源和閉源區別上,TechTarget在一篇文章中解釋,开源意味着公开AI模型、訓練數據和底層代碼,閉源則隱藏或保護其中一項或多項。

可以簡單理解爲,开源模型注重开放、共享和協作,推動大模型創新;閉源意味着源代碼僅供擁有它的公司修改和开發,但能更好保護商業利益和技術優勢。

從陣營來看,开源陣營遠比閉源龐大。目前國內外大模型行業,閉源主要以OpenAI GPT、百度文心一言爲代表,开源則是Meta旗下Llama(羊駝)、馬斯克旗下 xAI 公司的 Grok-1,以及國內阿裏通義千問、百川智能、360、昆侖萬維、智譜AI等。其中,有不少企業選擇“兩條腿走路”,既做开源又做閉源。

從普通用戶應用/產品化影響力來看,閉源目前領先开源毫無疑問。李彥宏核心論斷之一也是,無論中美,當前最強基礎模型都是閉源。 

當前“登上神壇”,讓很多大模型有絕望感覺的OpenAI,2019年發布GPT-2時還是开源,此後從GPT-3开始轉變爲閉源,推出“核爆”聊天機器人ChatGPT後,才震驚世界。

最初,OpenAI還公布論文,但到GPT-3.5、GPT-4,連算法、路线、論文都“諱莫如深”。今年初推出Sora時,更是明確表示不分享技術實現細節,只提供模型設計理念及其“炫酷”效果展示。

毫無疑問,大模型賽道近兩年繁榮,很大程度上得益於OpenAI帶動——倘若沒有ChatGPT,不會有如此多科技企業加入大模型賽道,更不會有百花齊放、百家爭鳴的行業形態。

在國內,文心一言是閉源代表。根據李彥宏最新公布的數據,文心一言用戶數、API日均調用量均突破2億。百度在大模型賽道初步建立起自己AI生態。

今年格外火爆,引發大模型巨頭“圍剿”的初創公司月之暗面旗下產品Kimi,也是閉源大模型。

大模型爆炒背景下,以上簡單易用、面向To c的閉源大模型可謂盡人皆知,在當下成功佔據市場主導地位——但未來是否能保持當下優勢,尚未定論。

大獲好評的Llama 2後,开源逐漸成爲大模型主流趨勢,其進化速度越來越快,迅速成爲大模型競爭重要一極。

3月底,也就是Grok-1公开後幾天後,初創公司Databricks公布旗下开源大模型DBRX,基於混合專家(MoE)架構,在語言理解、編程、數學和邏輯等標准行業上,战勝了Llama2-7B、Mixtral 以及Grok-1。整體性能超越GPT-3.5,編程方面更是輕松擊敗GPT-3.5。

根據最新消息,Meta將在下個月發布Llama 3,支持多模態處理。屆時,Llama 3或又將超越DBRX,直接對標GPT-4,復現後者大部分能力。

多位業內人士認爲,如無意外,Meta將遵循Llama 2路线,將Llama 3訓練數據、訓練方法、數據標注等大量細節都公布,成爲“任何人都可以拿到模型權重的最強大語言模型”。同樣,DBRX爲开放社區和企業提供了僅限於封閉模型的API功能。

過去,閉源大模型有“遙遙領先”的參數。如今开源模型參數正越來越大,DBRX參數規模達1320億,Grok有3140億,Llama 3預計其大規模版本參數量可能超過1400億。國內昆侖萬維也在4月17日宣布开源4000億參數的大模型天工3.0,一躍成爲全球參數最大开源大模型,號稱超越GPT-4V。盡管相比閉源大模型萬億參數有距離,但追趕速度越來越快。所以谷歌工程師說,谷歌沒有護城河,OpenAI也沒有。

對諸多开源大模型——特別是中國大模型賽道創業者而言,拉平認知的Llama,事實上遠比GPT更爲重要。不少行業、垂直大模型多是通過對Llama等开源大模型進行微調或修改實現。“如果沒有Llama,國內大模型整體水平會被國外甩下不少身位。”

“無需閉門造車,重復發明輪子。”周鴻禕和金沙江創投主管合夥人朱嘯虎等均認爲,开源社區聚集的工程師和科學家的數量是閉源的數百倍,借助全球技術力量,實現迭代、體驗改進和生態擴張。“开源會很快超過閉源。”

但李彥宏並不認可這種說法,他表示大模型开源跟Linux、安卓不同,實際上最主要开發者就是Meta,“不是一個真正大家一起來協同开發的產品。”

02

开源成本真比閉源貴? 

兩大陣營最激烈交鋒,目前發生在馬斯克與OpenAI之間——2016年,馬斯克還是OpenAI聯合創始人、投資人、聯席CEO,如今早已徹底走向決裂。

自ChatGPT發布後,馬斯克多次暗諷OpenAI,斷掉OpenAI對推特的數據訪問權限,並在今年2月克起訴OpenAI跟山姆·奧特曼,理由是OpenAI違背了造福人類非營利的宗旨。

整體來看,伴隨兩大陣營的交鋒態度日益強硬,誰也說服不了誰。开源陣營認爲,开源更容易創新,更容易被大衆理解和監督,閉源是奉行保守主義,容易權力集中,壟斷市場和數據,AI技術發展也會滯後。

閉源陣營則認爲,开源模型是套殼,存在濫用風險,無法基於此自行演進,影響某些企業商業化策略,特別是注重安全、隱私的企業。

但從李彥宏論斷來看,开源模型會一直越來越落後,核心論點是因爲成本更昂貴——這是行業最新爭議點,畢竟印象中,开源使用成本更低甚至免費,而且开源成本的高低,從邏輯而言並不等於技術路线的高低。

李彥宏的依據是,基於文心大模型4.0,降維裁剪出來的“小模型”,要比直接拿开源模型調出來的模型,同等尺寸下效果明顯更好;同等效果下,成本明顯更低。

這話有一定道理,此前有業內人士就在X平台表示,Grok-1沒有對特定任務進行微調,普通用戶使用它的基礎門檻並不低。如何开源、什么可以开源、开源到何種程度仍有待實踐回應。

但也有中小开發者表示,盡管Llama2的开發和使用並沒有完全面向全體公衆开放,但對中小开發者也非常友好,只需一台PC就可以零代碼微調大模型,花不了多少錢,且性能並不差。

事實上,業內公認的是,當前大模型技術路线都未成熟,包括ChatGPT也出現過將三星機密資料外泄嚴重事件。开源閉源各有利弊,“兩條腿走路”才是目前大部分公司的選擇,即構建一系列AI模型,既有閉源也要开源。

比如微軟130億元投資了OpenAI,但也擴大了开源ONNX Runtime投資力度,以及下場推出开源Phi大模型;谷歌也是從過去押注堅持閉源,在今年2月突然推出“开源”大模型 Gemma,雙线作战去對抗OpenAI和Llama。

在國內,兼顧开源閉源的大模型更多。比如阿裏通義千問,雖然以开源爲主,但也有閉源模型,去年12月進階至2.1版。包括百度也是如此,去年發布的文心千帆大模型平台2.0,就接入了30多個主流大模型,包括Llama2等諸多开源大模型。

可以說,沒有开源大模型,就沒有如今百度智能雲生態的成熟,在千行百業的落地——根據最新數據,文心千帆大模型生態夥伴數量過去半年增長 5 倍,API 調用量指數級增長,超8.5萬客戶,300多款進入千帆應用市場。對這些用戶和开發者而言,表面是在文心一言上,實際用到的也很可能是Llama2等开源模型。

既然如此,李彥宏爲何還會多次斷言,开源大模型會一直落後?

有業內人士就認爲,這或許與百度當下大模型的战略定位,以及需要爲產品工具宣傳背書直接相關。

“以後人人都是开發者。”Create 大會上,李彥宏給出AI時代答案的同時,也發布了被廣泛宣傳的三大AI“开發神器”——AgentBuilder、AppBuilder、ModelBuilder,將個人、企業、开發者統統囊括在百度體系內,加速搶佔應用入口,甚至是基礎模型通喫AI,構建國內最強大大模型生態的“野心”。

“如果說开源大模型开放且正逐漸強大,那么有多少人還愿意給閉源大模型送錢,甚至是加入受控制的生態體系?”一位網友評論說,長期以來,全球开發者對蘋果iOS封閉生態系統的“霸道”行爲,深感不滿卻又無可奈何。

03

利用大模型賺錢,百度跑在前面

實際上,在大模型下半場,探索商業化路徑成爲所有玩家亟待選擇的問題。

在這方面,李彥宏相當坦誠,表示百度之所以堅持閉源,是因爲市場有足夠多的开源,百度要开源還得自己去維護一套开源版本,從成本來說非常不劃算。更重要的是,閉源有着真正的商業模式,能夠賺到錢。

大模型當前如何商業化,或者說賺錢?盡管各大模型還在探索ToB還是ToC的不同路徑,但重點布局方向都是“脫虛向實”,向“應用爲王”傾斜。 

這一點,從李彥宏、周鴻禕或者其他行業大佬、專家表態來看,已成共識。

大模型商業化如何變現答案上,“all in”姿態的百度堪稱行業樣本,在國內跑在最前面。

B端,構建“文心千帆”一系列商業化矩陣,爲客戶產品嫁接文心大模型能力,通過調用API調取實現營收。

這種收費方式可以簡單理解爲,模型租賃。360、阿裏通義千問、騰訊混元、科大訊飛星火等通用大模型,以及更多行業大模型也有類似嘗試,但當前大模型工具推動千行百業生產力進步還需要過程,且門檻更高(如針對各行各業的定制化服務),基於tokens(“字”或“詞”)計價方式的ROI(投入產出比)各家並不算高,更多是通過API的綁定,向客戶出售雲、廣告等其他服務。

李彥宏曾在2023年財報會中披露,去年Q4百度智能雲總營收84億元,其中大模型爲雲業務帶來約6.6億元增量收入,同時文心大模型重構後的廣告系統,爲百度帶來數億元增量收入。根據李彥宏的預計,上述兩項增量收入,將在2024年增加到數十億。或許,這會成爲百度智能雲加快追趕阿裏雲、華爲雲等的希望。

更值得一提的是C端。在國外,ChatGPT率先推出收費Plus服務;在國內,百度緊隨其後,率先在C端推出了“文心一言”會員訂閱模式。

目前,文心一言3.5基礎版仍可免費使用,只是體驗並不完美。能力更強的4.0則需要升級成會員,會員服務有兩種,分別是單獨的會員服務和聯合會員服務。

單獨會員服務價格上,連續包月優惠價爲49.9元,單月購买價格爲59.9元,連續包年588.8元,12個月658.8元。選擇這種會員服務,用戶將能夠體驗文心大模型4.0的高級服務,比如更強的模型能力和圖片生成能力。

此外,百度還推出了文心一言4.0與文心一格白銀的聯合會員服務,限時特惠價爲99元/月。除文心大模型4.0服務外,用戶還可以獲得文心一格白銀會員的權益,包括極速生成多尺寸高清圖像、創作海報和藝術字,以及AI編輯改圖修圖等功能。

不過,這也引起了部分用戶的爭議。雖然會員付費是互聯網行業常見盈利模式,但像大模型會員這么貴價格的比較少見,比如鬧得沸沸揚揚的愛奇藝,多次漲價後會員包月價目前爲每月25元。

如此貴的會員費,業內人士認爲大部分是AI 知識工作者、开發者等买單,從普通用戶角度看,如果一年用不上幾次,購买並不合適。

但客觀來看,如今生成式AI產品收費是大勢所趨,且大模型會員價格貴,和服務器、芯片、訓練、電費等高額成本有關,如果不收費,以百度的彈藥儲備,恐怕也難以支撐燒錢多久。

從財報來看,大模型C端會員收費並未在百度最新財報中有所體現,有多少用戶付費難以得知。但無論是B端還是C端的AI故事,想真正體現更大提振效應,還需要很長的路要走。2023年百度總營收1345.98億元,在线營銷貢獻751億元的收入。

這不只是百度的問題。目前能從AI身上賺到錢的公司並不多,百度已經算是其中佼佼者,一是迅速推動旗下大部分產品和大模型的融合,二是文心一言、百度廣告、智能雲、自動駕駛等領域,都开始有了來自AI的落地收入,AI商業化布局呈多元化態勢。

OpenAI成功,首先是商業模式的成功。2022年全年,OpenAI收入僅爲2800萬美元。今年2月有外媒稱,OpenAI的年化收入已超過20億美元,其估值達驚人的1000億美元。一些OpenAI的領導認爲,到2024年年底,該公司年化收入可以達到50億美元。

在商言商,只要未被利益蒙蔽雙眼,因商業利益而爲自家產品、技術路线強硬站台,無可厚非。

對李彥宏和他的百度來說顯然也是如此,其既不是發布會上鼓吹的“讓人人都是开發者”的那樣高尚,也不是周鴻禕反駁中的“胡說八道和忽悠”。區別,在於企業路线,在於未來策略。包括馬斯克和OpenAI 的決裂,本質同樣如此。

當然周鴻禕有一點沒有說錯,那就是OpenAI、文心一言也是自开源成長起來——如今所有主流大模型的核心機制(包括开源、閉源),都是基於Transformer架構,熱潮起點則源自2017年的谷歌,其發表了《Attention is all you need》的經典論文,對Transformer模型做出了具有歷史意義的重大改進,有了Transformer框架下的“不可能三角”(並行訓練能力、性能和低成本推理),才有了後來的GPT。

從這個角度看,AI和大模型注定引領一場新工業革命的當下,斷言某一種技術路线會一直落後,也是一種極端。

END

出品人:黃槍槍

       原文標題 : 李彥宏不寒磣:不賺錢,做大模型幹嗎?



標題:李彥宏不寒磣:不賺錢,做大模型幹嗎?

地址:https://www.utechfun.com/post/360257.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅爲傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

猜你喜歡