對所有大模型而言,其真正考驗如同科大訊飛創(chuàng)始人劉慶峰所說,在最后一公里的應用和商業(yè)化落地上。
作者|Cindy
編輯|楊 銘
恐怕誰也不會想到,百模大戰(zhàn)進入商業(yè)化下半場,圍繞大模型大規(guī)模、曠日持久的戰(zhàn)爭,竟是開源和閉源路線的交鋒。
最近,在2024世界人工智能大會(WAIC)上,劉慶峰、李彥宏、王堅、朱嘯虎、傅盛等行業(yè)大佬,發(fā)表的截然不同觀點,再次引發(fā)外界對大模型路線的關注。
比如,持續(xù)輸出“開源落后于閉源”“大模型場景下,開源是最貴的”觀點的百度創(chuàng)始人李彥宏,再次直言不諱認為,開源是一種智商稅。獵豹移動董事長兼CEO傅盛,則繼王小川、周鴻祎之后,直接不客氣反駁李彥宏,稱“付費閉源大模型才是智商稅”。谷歌前董事長施密特甚至在近日表示,中國AI發(fā)展基本靠西方開源,因此必須限制開源模型。
大模型賽道的開源閉源,主要是指模型源代碼、模型權重、訓練數(shù)據(jù)是否公開。這場AI浪潮下科學界的戰(zhàn)爭,并非僅發(fā)生在中國企業(yè)身上——相比中國企業(yè)家的“文明交鋒”,國外企業(yè)和大佬更是采用直接短兵相接的肉搏戰(zhàn)方式。
去年2月以來,馬斯克屢屢發(fā)難,稱轉向閉源的OpenAI應改名為“Close AI”。今年2月,馬斯克在舊金山法院對OpenAI及CEO阿爾特提起訴訟,要求OpenAI恢復開源并給予賠償。市場方面,去年7月Meta將Llama2(羊駝)開源后,和ChatGPT發(fā)生的一輪輪攻防戰(zhàn),同樣精彩紛呈。
風云涌動中,圍繞大模型開閉源的白刃戰(zhàn)超過一年半。但至今誰也說服不了誰,誰也未取得決定性勝利,未來走向撲朔迷離。
唯一能確定的是,對公眾和企業(yè)來說,無論路線如何,解決不了最后一公里難題,開閉源都一文不值。對所有大模型而言,其真正考驗如同科大訊飛創(chuàng)始人劉慶峰所說,在最后一公里的應用和商業(yè)化落地上。
01
開閉源路線之爭的本質
回顧互聯(lián)網和軟件史,開源和閉源的戰(zhàn)爭一直都在上演。
直到今天,這依然是兩股并行、截然不同的力量。開源方面,以Linux、Android、unix為代表;閉源方面,則有Windows、Mac OS、iOS、WP等等。
戰(zhàn)爭核心,在于技術進步、安全保障、社會價值與經濟效益之間的平衡探索。
開源認為,應允許任何人獲得并修改軟件的源代碼,如同一座橋梁,分享、融合才是其存在意義。閉源則認為,軟件和代碼屬于勞動成果,勞動成果需要保護和用來獲取財富。
客觀看,開源促進軟件繁榮和全球范圍內合作,拓寬創(chuàng)新邊界上,居功至偉。但就商業(yè)價值層面來看,此前所有領域都被閉源吊打。
一切技術路線爭議終點,需要商業(yè)化掙錢。這無可厚非,但需要意識到的是,AI大模型的路線戰(zhàn)爭,和此前任何一次開閉源戰(zhàn)爭都沒可對比性——業(yè)界共識是,大模型本身就是一個黑盒子,外界至今難以徹底揭開它的神秘。
從模型、算法到數(shù)據(jù),如何產生一個可以使用的模型,無人知曉。未來到底是走向中心化,還是去中心化,都是矛盾而又流行的說法。
這種神秘性,造就大模型的獨特性——無論是國外還是國內,都不是巨頭的一枝獨秀,從科研到創(chuàng)業(yè)者,再到千行百業(yè)開發(fā)者,都可以參與其中,讓大模型呈現(xiàn)百花齊放、百家爭鳴的蓬勃生態(tài)。
技術實力來看,如果以ChatGPT為標尺,那么開源曾很長一段時間落后于閉源——到去年下半年,這種情況已經改變,很多超過 ChatGPT 3.5,甚至追趕ChatGPT 4.0能力的大模型陸續(xù)發(fā)布。不過,在Sora發(fā)布后,閉源又獲得一段時間領先。
“閉源和開源大模型,很難說誰就會永遠領先誰,這是一個永遠在動態(tài)平衡變化的狀態(tài)。”多位業(yè)內人士就認為,其差距取決于,研發(fā)團隊能力的差異,以及背后團隊所持有的資金、算力、數(shù)據(jù)。
非得在開源與閉源之間,做選擇題嗎?顯然不是。
如今,在開閉源陣營之爭外,還有一條技術路線陣營正迅速擴大——開源和閉源同時并行發(fā)展。在國外,以谷歌為代表;在國內,則包含科大訊飛、昆侖萬維、零一萬物、百川智能等企業(yè)。
這個陣營的技術實力,并不遜色任何開源或閉源企業(yè)。比如訊飛星火,V3.0版本在中文上全方位超越Chat GPT,英文上實現(xiàn)對標。而在V4.0版本中,在8個國際主流測試集中排名第一,在文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力等方面實現(xiàn)了對GPT-4 Turbo的整體超越。
02
開源與閉源,為何可以兩條腿走路
“極點商業(yè)”觀察來看,選擇開源、閉源“兩條腿”走路的企業(yè),布局大多主要遵循以下路徑:在最大模型上選擇閉源,在較小模型上選擇開源。
比如谷歌,就在推出“開源”大模型Gemma后,走上閉源+開源并行道路。有報道認為這代表谷歌大模型策略的轉變——開源主打性能最強大的小規(guī)模模型,希望戰(zhàn)勝Meta和Mistral AI;閉源則主打規(guī)模大效果最好的大模型,希望盡快追上OpenAI。
在國內,“兩條腿走路”的企業(yè)也類似。以科大訊飛為例,整體超越GPT-4 Turbo的訊飛星火V4.0是閉源,通過昇騰AI和訊飛星火的合作,打破大模型訓練的瓶頸;而130億參數(shù)的星火開源-13B則是開源,在多項知名公開評測任務中名列前茅。
其實,大模型不像手機操作系統(tǒng),必須在IOS或安卓之間二選一,對開發(fā)者、用戶、企業(yè)來說,考慮的很直接:這個大模型是否易用好用,又同時具有性價比?穩(wěn)定性、安全性是否可以保證?其生態(tài)和場景打造,又是否滿足用戶需求?
這意味著,讓所有用戶、企業(yè)、開發(fā)者乃至產業(yè),都能選擇合適自己的大模型,就是最好的大模型。
這也是科大訊飛“兩條腿走路”核心目的,通過“閉源+開源”完整體系,閉源專注商業(yè)應用、產業(yè)落地,開源策略是生態(tài)開放,兩者優(yōu)勢“合二為一”,激發(fā)中國大模型的產業(yè)、生態(tài)活力。
在閉源部分,基于星火大模型V4.0,科大訊飛有面向TOC的AI應用訊飛星火APP/Desk、星火智能批閱機、訊飛AI學習機、訊飛曉醫(yī)APP;面向TOB和生態(tài)伙伴,有星火企業(yè)智能體平臺、招采助手、機器人超腦平臺2. 0等等,讓企業(yè)可以構建自己的智算底座。
星火開源公開測評數(shù)據(jù)
在開源的星火大模型,科大訊飛的策略是生態(tài)開放,通過免費大模型,為開發(fā)者、學術界賦能。
“開源+閉源”兩條腿想順利走路關鍵,需要解決幾個關鍵問題,一是模型架構自主可控,有一定技術優(yōu)勢,二是產業(yè)落地、商業(yè)模式完整,三是通過社區(qū)吸引更多開發(fā)者。
“誰控制了過去,誰就控制了未來;誰控制了現(xiàn)在,誰就控制了過去。”近年來,被“卡脖子”事件屢屢在我國科技產業(yè)上演,算力、數(shù)據(jù)是否會“卡大模型的脖子”,業(yè)界也是議論紛紛。
這意味著,主流國產、自主可控的模型架構,才可能最大限度發(fā)揮生態(tài)力量,匹配產業(yè)上下游環(huán)境,更好推進開源、閉源的并行融合。
“所有算法都是我們自主可控的,大模型的每一行代碼、每一個數(shù)據(jù)都是我們自己編寫、清洗出來的。”劉慶峰表示。
而對處于早期的大模型來說,無論是開源、閉源,都需要聚集更多開發(fā)者,參與到開源模型的改進和優(yōu)化。
在國外,包括Meta、谷歌和微軟以及第三方開發(fā)者都在社區(qū)內發(fā)布模型、參數(shù)、數(shù)據(jù)集;在國內,訊飛開放平臺之上大模型總開發(fā)者超35萬,其中企業(yè)開發(fā)者超22萬,推動大模型應用加速落地。
回顧PC、軟件、手機歷史,其實也有類似案例。比如在數(shù)據(jù)庫市場,Oracle就是“開源+閉源”兩條腿走路,在開源社區(qū)、商業(yè)應用均取得了巨大成功。
谷歌、科大訊飛們的大模型“兩條路”邏輯其實也類似。一種解讀是,在大模型時代,開源、閉源只是手段,在不同產品和應用場景中,兩者本是相輔相成。開源模型和開源社區(qū)可以在上游用免費策略負責擴大用戶基數(shù)、拓展產業(yè)生態(tài)、迭代模型技術。
來自開源部分的經驗,也可以復用到閉源,讓閉源大模型的產業(yè)化、商業(yè)化落地更順暢——最終兩條路線以多元化、靈活化的方式演進,并行甚至融合互補。
“實際上這兩塊是相互補充的。”科大訊飛創(chuàng)始人劉慶峰也認為。他以星火開源13B模型為例指出,等650億、1500億、1750億參數(shù)以及更大模型出來,就知道了它的天花板和邊界,再對它進行裁剪、濃縮,就變成13B,那13B的效果也提升了。
“如果不做閉源,不探索行業(yè)最高的天花板,開源也做不到最好。”劉慶峰就認為。
“兩條腿”走路的互補價值,浙江大學人工智能研究所所長吳飛一個觀點是,任何開源基座模型,都是千錘百煉而來,不是所有公司和機構都具備這樣的能力。“在開源之上進行閉源,可以很大程度上降低閉源模型研發(fā)的門檻。”
03
最后一公里才是真正挑戰(zhàn)
從劉慶峰、李彥宏、王小川等行業(yè)大佬觀點來看,一個共同之處是:閉源、開源只是手段,關鍵是讓大模型,如何快速應用千行百業(yè)場景里,如何作為生產力工具,更好地普惠,去替代人類完成各類業(yè)務流的碎片、繁雜工作。
這意味著,對國內目前尚處于高速發(fā)展階段的大模型而言,隨著開源、閉源路線的逐漸并行融合,選擇什么路線不是關鍵問題。
不同場景適配不同的參數(shù)。如同劉慶峰所說,無論大模型如何演進,最后一公里的產品體驗和應用落地,才是真正挑戰(zhàn)。
這也是誰能在“百模大戰(zhàn)”中占有一席之地,擁有更多的話語權的關鍵。如果解決不好最后一公里,那么技術路線將一文不值。當前國內大模型企業(yè)的應用開發(fā)的普遍思路是,并未等到技術完全成熟再落地應用,而是在快速迭代技術同時,從ToC、ToB兩端入手,相應地進行產業(yè)和應用落地。
這一點,在剛剛結束的WAIC上也體現(xiàn)得很明顯。科大訊飛、百度、阿里巴巴、騰訊、華為、字節(jié)跳動、快手等行業(yè)巨頭,以及百川、智譜等新銳帶來眾多新技術和新產品,展現(xiàn)了大模型和金融、醫(yī)療、教育、政務等多個行業(yè)、產業(yè)的深度融合。
關于如何更好地解決企業(yè)大模型應用的“最后一公里”問題,科大訊飛經過和大量的央國企和行業(yè)合作伙伴的共同探討,他們認為用智能體平臺打造每個崗位專屬助手的時間已經到了。
在這之前,星火已經成功賦能了很多場景,無論是代碼、數(shù)字勞動力,還是評標、客戶、APP智能互動。科大訊飛與太平洋保險合作是從審計這個崗位做起的,包括客服和評標;此外,國家能源集團、中國石油等公司選了科大訊飛作為合作伙伴;同時,星火大模型賦能中國移動APP幾億用戶,使中國移動APP更加智能、交互更順暢。
通過這么多的場景可以看到,大模型賦能企業(yè)“人工智能+”行動有兩個方面:一方面是大模型直接完成任務,訊飛星火一開始啟用,文本生成、語言理解、知識問答、邏輯推理和代碼能力對應到下面相關的各種各樣的工具,它自己就完成了,不需要借助任何外力。
還有一種模式是以認知大模型為中心大腦,它調動各種專用模型,比如說振動的模型、味覺模型、氣體模型,濕度模型等各種模型,然后配合相應的工具,再對接內外部的各種信源和數(shù)據(jù),打通內部的辦公OA、ERP系統(tǒng),再對接外部實時性來聯(lián)合完成任務,相當于用大模型來指揮調度一系列的能力,從而完成一個綜合的任務。
面向B端,從劉慶峰闡述來看,訊飛星火大模型在“最后一公里”用智能體平臺打造專屬于每個崗位的工作助手,在智能家電、智能汽車、運營商、機器人等行業(yè)場景實現(xiàn)全面賦能,甚至成為各行各業(yè)創(chuàng)新發(fā)展的重要驅動力。
面向具身智能和人形機器人企業(yè)需求,目前400+機器人企業(yè)已經采用訊飛機器人超腦平臺。另外,星火企業(yè)智能體平臺將圍繞智能體關鍵能力,覆蓋400+AI原子能力,集成 90+外部信源,打通100+內部 IT 系統(tǒng),可供企業(yè)結合業(yè)務場景快速構建可落地的智能體應用。
“解決AI+行動的最后一公里的問題,是前所未有的機遇。”劉慶峰就表示,星火已經成功賦能了很多場景,無論是代碼、數(shù)字勞動力,還是評標、客戶、APP智能互動。
不完全統(tǒng)計顯示,訊飛星火大模型正成為國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、海爾集團、美的集團等多領域頭部企業(yè)的首選。
公開招標網數(shù)據(jù)就顯示,今年上半年到6月中旬,整個公開招標數(shù)量約為234件。其中,60%以上的項目來自央國企。在央國企大模型訂單中標企業(yè)中,訊飛星火高居第一。
“我們能走多遠,取決于我們是否擁有自主開發(fā)的、可控的基礎能。”從劉慶峰表態(tài)來看,這是大模型如何解放生產力、釋放每個人、每家企業(yè),甚至每位開發(fā)者想象力的關鍵。
“合抱之木,生于毫末,九層之臺,起于壘土。”如同劉慶峰的說法,這正是大模型能力階段跨越的體現(xiàn)——意味著大模型從技術附加工具,轉向引領行業(yè)變革、助力企業(yè)降本增效、普惠大眾生活的關鍵階段。而針對更多商業(yè)化模式的探索,也正悄然形成“模型越強、落地越多、用戶越廣、算力越大”的增長飛輪。
從這個角度看,只要能做大生態(tài),加速產業(yè)最后一公里的落地,無論是大模型技術路線是閉源,還是開源,其實一點都不重要。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
文|智能相對論作者|陳泊丞在2024世界人工智能大會暨人工智能全球治理高級別會議產業(yè)發(fā)展主論壇上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏談了些對于AI大模型的看法,語驚四座。他先是指出,“百模大戰(zhàn)造成了社會資源的巨大浪費,尤其是算力的浪費。但同時也使得我們追趕世界上最先進基礎模型的能力得到了建立。”而
文|智能相對論作者|陳泊丞蘋果終于公布了最新的AI進程。一個月前,正如此前預期的那樣,人工智能是今年WWDC發(fā)布會的焦點。全程105分鐘的主題演講,就有40多分鐘用于介紹蘋果的AI成果。蘋果似乎還有意玩了一把“諧音?!保匦露xAI為“AppleIntelligence”。但不管怎么說,此次蘋果AI
北京時間6月25日凌晨,多個地區(qū)的OpenAI用戶收到了一封來自官方的郵件。郵件顯示:“您所使用的APl流量來自OpenAl目前不支持的地區(qū)。我們將從7月9日開始采取額外措施,阻止來自不在我們支持的國家和地區(qū)列表中的地區(qū)的APl接口?!彼^的API,就是應用程序編程接口。開發(fā)者通過使用OpenAI的
高考一結束,忙壞了海內外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問……掀起了一波“AI趕考”大戰(zhàn)。據(jù)悉,去年高考期間,大模型的成績才勉強過一本線,今年集體晉升985。據(jù)悉,豆包甚至過了清北的錄取線。頭部大模型在高考“考場”上玩得不亦樂乎,中小AI創(chuàng)企的處境卻日益尷尬
文/二風來源/節(jié)點財經每年高考成績放榜后,數(shù)千萬考生和家長將迎來另一場硬仗——填報志愿。今年,這一領域迎來了AI的全面介入,多家互聯(lián)網大廠和教育公司紛紛推出智能志愿填報產品,為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國高考志愿填報市場付費規(guī)模約9.5億元,近九成考生愿意借助志愿填報服
蘋果還沒從WWDC25的“群嘲”中走出,又迎來了一次新的痛擊。據(jù)路透社報道,21日,蘋果公司遭到股東集體起訴,被指在信息披露中低估了將先進生成式AI整合進語音助手Siri所需的時間,導致iPhone銷量受影響、股價下滑,構成證券欺詐。在這份訴訟中,庫克、首席財務官凱文·帕雷克及前首席財務官盧卡·馬埃
華為的盤古大模型終于推出新版本了。6月20日華為云計算CEO張平安宣布基于CloudMatrix384超節(jié)點的新一代昇騰AI云服務全面上線,盤古大模型5.5同步發(fā)布。不過,當前國內的AI大模型競爭可謂是相當激烈,華為的盤古大模型在眾多大模型中并不是十分出眾。華為云此次重磅推出的盤古大模型5.5能否從
一場沒有羅永浩的“羅永浩直播”,正在改寫帶貨規(guī)則當數(shù)字人羅永浩在百度直播間舉起青島啤酒,以標志性幽默回應粉絲提問時,彈幕瘋狂刷出“這是真的還是假的?”的疑問。這場持續(xù)近7小時的直播,創(chuàng)下1300萬人次觀看、GMV突破5500萬元的驚人戰(zhàn)績,甚至超過了他本人一個月前真人直播5000萬元的成績。數(shù)字人主
高頻互動、個性化教學、突破成本壁壘,AI老師讓英語學習更普惠。6月24日,新東方正式推出面向消費者的首款原創(chuàng)AI教育產品——“新東方AI1對1”。這款產品標志著新東方在教育+AI戰(zhàn)略布局中邁出關鍵一步,旨在以科技力量推動優(yōu)質教育資源的普惠發(fā)展。在發(fā)布會現(xiàn)場,新東方教育科技集團CEO周成剛表示:“AI
大家好,我是白楊SEO,專注SEO十年以上,全網SEO流量實戰(zhàn)派,AI搜索優(yōu)化研究者。為什么想分享這個AI工作流及coze扣子這個?因為我們搞流量的如果學會了用AI給我們生產提效將更有助于我們去獲客。目前白楊SEO用得并不是很好,分享僅供參考,希望給你一些啟發(fā)。老規(guī)矩,先說下文章大綱如下:1、AI工
近期,“AI新云”(NeoCloud)概念在科技圈和投資圈引發(fā)熱潮。今年3月,被業(yè)內稱作“英偉達親兒子”的AI基礎設施企業(yè)CoreWeave上市。這家依托英偉達GPU資源沖擊新云市場的初創(chuàng)公司,上市不到3個月市值飆升359%,達881億美元。CoreWeave的“身價暴漲”吸引了無數(shù)視線。對此,不少