“創(chuàng)新的速度比創(chuàng)新本身更重要。”埃隆·馬斯克曾這樣說到。
近日,由馬斯克所掌舵的特斯拉,在2024年世界人工智能大會上正式推出了第二代Optimus(擎天柱)人形機器人,距離第一代面世,僅過去9個月。
加速升級的人形機器人不負所望,成了今年WAIC大會(世界人工智能大會)的一大看點。除此以外,今年的WAIC大會還引發(fā)了哪些熱門話題?帶來了哪些前瞻指引?
開源和閉源,是互補關系
今年,華為盤古、百度文心、阿里通義、騰訊混元等國內知名大模型悉數(shù)都參加了WAIC,大模型依舊是重頭戲之一。
大會開幕期間,在談及大模型閉源與開源的選擇時,兩大頭部企業(yè)陷入明顯分歧。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏稱,模型開源無法做到眾人拾柴火焰高,商業(yè)化閉源模型才最能打。
阿里云CTO周靖人則重申了阿里云開源開放的選擇,并強調阿里兩年前決定將通義大模型開源開放,時至今日,通義千問已經實現(xiàn)真正意義上的全尺寸、全模態(tài)開源,拉平了開源、閉源模型之間的差距。
相較而言,開源大模型和閉源大模型孰好孰壞,其實并沒有定論。
從技術層面來看,閉源由于不公開源代碼,安全性和服務質量更高,而且可以通過銷售許可或提供基于模型的服務來盈利;但同時許可費高昂,外界難以審查監(jiān)管,而且升級迭代高度依賴內部團隊,速度有限。
開源則恰好相反,技術門檻和成本較低,吸引了全國范圍的開發(fā)者和研究者參與,創(chuàng)新和迭代速度更快,適配更多應用領域,但無門檻的技術共享也帶來了權益被侵犯的風險,質量、穩(wěn)定性和安全性難以保證。
對比來看,閉源想要走向“成功”,唯一的路徑就是進化為“超級應用”,從而創(chuàng)造價值;而開源憑借獨有的兼容性打造了強有力的獲客手段。由此可見,看似截然不同的兩個方向背后,是由各自的商業(yè)利益驅使。
從應用層面來看,開源和閉源并不像手機端的iOS系統(tǒng)或者安卓系統(tǒng)只能二選一,尤其在ToB的情況下,應用端既需要技術共享也會考慮應用安全性,還需要滿足多樣化需求。
對此,百川智能CEO王小川表示,預計未來將有80%的企業(yè)會用到開源大模型,因為閉源沒辦法對產品做更好的適配,或者成本特別高,閉源可以給剩下的20%提供服務。
由此可見,二者并不是非此即彼的對立關系,在不同產品和應用場景中也可以是互補的關系。但歸根究底,大模型在發(fā)展之余如何創(chuàng)造價值,選擇開源還是閉源就不是核心問題,因為僅有基礎模型卻沒有應用,就等同于一文不值。
AI落地的三大方向:大模型、機器人、終端產品
大模型作為人工智能大家族的組成部分,一直是熱議的話題之一。隨著WAIC 2024的落幕,AI應用落地的最新趨勢也昭然若揭。
(一)大模型加速商業(yè)化
繼百模大戰(zhàn)后,大模型的“精耕細作”一直在持續(xù)。以ChatGPT和Sora為代表的大模型技術,也已進入新一輪迭代。從今年的WAIC來看,百度、阿里巴巴、騰訊、華為等行業(yè)巨頭帶來眾多新技術和新產品,展現(xiàn)了大模型在金融、醫(yī)療、政務等多個行業(yè)場景的應用潛力。
截至目前,百度有千帆大模型平臺、文心一言,阿里有阿里云百煉、通義大模型,騰訊有騰訊云混元大模型、元寶大模型,字節(jié)跳動有火山方舟、豆包大模型等等。
在過去的2023年里,大模型的長文處理能力、數(shù)字能力、推理能力、RAG(檢索增強生成)、GPTs、多模態(tài)、原生應用、開源等多方面都有大幅增強。同時,訓練和部署成本、行業(yè)適配能力、幻想問題以及數(shù)據安全這四大挑戰(zhàn)也得以優(yōu)化和解決。
圖源來自數(shù)巔科技
在此基礎上,定制化的大模型給To B和To C業(yè)務帶來了非常深刻和徹底的改造,企業(yè)用戶和終端個人用戶也逐漸呈現(xiàn)剛性需求?;诖耍琓o C產品可以通過不斷收集用戶反饋、積累模型的應用實踐,來反哺ToB業(yè)務,從而加速大模型商業(yè)化落地。
(二)機器人和AI高度結合
今年,人形機器人專區(qū)也是大會的一大亮點。在世博展覽館的中廳,18臺人形機器人組成陣列展示“才藝”,并與觀眾親切互動,可見機器人技術的協(xié)同效應以及在"異構群智"領域的重大突破。
隨著人形機器人和AI兩大領域的高速發(fā)展,產業(yè)進入深度融合階段,AI大模型+人形機器人正掀起下一波技術熱潮。
從技術角度看,兩者在自然語言交互、知識庫與推理、多模態(tài)感知與決策、運動規(guī)劃、任務規(guī)劃與執(zhí)行、情感交互、持續(xù)學習等七個板塊均有結合應用的可能性。
在實際應用方面也已經取得突破。比如WAIC 2024大會上,特斯拉的Optimus二代機器人將深度學習應用于視覺感知,實現(xiàn)了精準的目標識別與抓取,而且可以直立行走,進行路線規(guī)劃。
自然語言交互領域,Xiaomi CyberOne等人形機器人搭載大語言模型,實現(xiàn)了高自然度語音交互。情感交互領域,Hanson Robotics的Sophia機器人通過面部表情合成和聲音合成,實現(xiàn)了豐富的情感表達。
通過以上技術的融合,我們有望創(chuàng)造出具備感知、決策、規(guī)劃、控制、交互、學習等多維能力的人形機器人,最終賦予其真正的智能化、人性化。
(三)AI終端“新物種”涌現(xiàn)
除了大模型、人形機器人,AI的終端產品逐漸滲透至日常生活。正如三次工業(yè)革命,蒸汽時代誕生蒸汽機、電氣時代發(fā)明電燈泡、信息化時代創(chuàng)造計算機,每一件革命性的“新物種”都被應用于終端場景,AI大航海時代的產物也將如此。
楊元慶展示AI PC新產品
今年,多個行業(yè)涌現(xiàn)了"終端新物種"。比如戴爾、聯(lián)想、華為的AI PC新產品、內置大模型語音助手的雷鳥AR眼鏡X2 Lite、實現(xiàn)AI翻譯的時空壺同聲傳譯器X1,以及今年上半年被熱議最多的蘋果vision pro混合現(xiàn)實頭顯,等等。
追本溯源,終端產品的涌現(xiàn),主要得益于AI模型、AI應用、AI硬件的協(xié)同發(fā)展。從AI產業(yè)結構來看,產業(yè)鏈上游為基礎層,包括算力等,中游為算法和模型層,下游為應用層。先有算力、芯片等“硬件”的完善和加持,再是大模型、算法的“精耕細作”,終端“新物種”應運而生。
隨著AI生態(tài)和技術的不斷進化,未來AI終端還將迎來架構設計、交互方式、內容、應用生態(tài)等的全面創(chuàng)新和升級。或許,我們會從提問“AI終端應該長什么樣”,轉為好奇“AI終端會長什么樣”。
2024,開啟“AI+”時代
2024年,伴隨大數(shù)據處理、高性能計算、深度學習等技術的快速發(fā)展和成熟,人工智能已經能夠解決大量的復雜問題,加上日益成熟的大模型技術,人工智能的準確度、效率、通用性、靈活性得到顯著提升。
應用層面,隨著現(xiàn)代社會產生的數(shù)據開始爆發(fā)式增長,為人工智能的進化提供了“養(yǎng)料”,人工智能得以更好地學習和理解現(xiàn)實世界。加之,個人用戶和企業(yè)客戶對于個性化、高效的服務需求日益增強。
在底層技術高速發(fā)展,以及市場需求的牽引下,人工智能(AI)已經由“+AI”模式轉型至“AI+”模式的階段。
對比來看,早前的“+AI”階段,人工智能還只是一項補充技術,被運用于傳統(tǒng)行業(yè)的既有業(yè)務流程和產品之中,目標在于提升效率、解決特定問題。
如今的“AI+”階段,AI不再僅僅是業(yè)務流程的附屬部分,更是各行各業(yè)創(chuàng)新發(fā)展的重要驅動力,其核心在于數(shù)據驅動和自我學習,利用神經網絡模型進行大量數(shù)據的訓練,模擬人腦的學習機制,從而實現(xiàn)語音識別、圖像識別等多領域超越人類的表現(xiàn)。
這一階段跨越的完成,意味著AI從單純的技術附加工具轉向了引領行業(yè)變革的關鍵要素,從賦能單一功能升級為重塑整個業(yè)務形態(tài)。
業(yè)務形態(tài)的重塑具體到應用場景,覆蓋了交通出行、生活服務、工業(yè)制造、文化傳播、醫(yī)療健康、農村建設等多個領域。
AI+交通領域,在AI算法的加持下,車輛能夠處理海量的傳感器數(shù)據,實現(xiàn)對車輛周圍環(huán)境的高精度感知。同時,還能預測其他車輛的行駛軌跡,為自動駕駛車輛提供決策依據。最重要的是,AI算法通過不斷學習和優(yōu)化,可以提升自動駕駛系統(tǒng)的性能和安全性。
AI+制造領域,由于大模型、機器學習、計算機視覺等細分技術實現(xiàn)突破,人工智能可以被應用于制造業(yè)全流程各環(huán)節(jié),通過挖掘各單一環(huán)節(jié)的數(shù)據信息,進而賦能整體的預測、生產、管理、決策,從而實現(xiàn)精細化管理,助力企業(yè)降本增效。
工信部數(shù)據顯示,經過智能化改造,制造業(yè)研發(fā)周期縮短約20.7%、生產效率提升約34.8%、不良品率降低約27.4%、碳排放減少約21.2%。
長遠來看,“AI+”的潛力已經開始展現(xiàn)。
結語
2024年,AI應用落地的想象力無效迸發(fā)。大模型加速商業(yè)化、AI 和人形機器人深度結合、終端新物種大量涌現(xiàn),大航海時代的歷史齒輪開始高速運轉。
不只是人工智能行業(yè),整個產業(yè)鏈也在加速擴容,AI+交通、AI+汽車、AI+文化、AI+制造等都開始從理論走向實踐,走進生產和生活。
“AI+”時代真的來了。
作者:琴聲奏響時
來源:松果財經
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
北京時間6月25日凌晨,多個地區(qū)的OpenAI用戶收到了一封來自官方的郵件。郵件顯示:“您所使用的APl流量來自OpenAl目前不支持的地區(qū)。我們將從7月9日開始采取額外措施,阻止來自不在我們支持的國家和地區(qū)列表中的地區(qū)的APl接口?!彼^的API,就是應用程序編程接口。開發(fā)者通過使用OpenAI的
每一次新舊代際轉換時,都會上演這樣的一幕:“暢想很多,落地很少”,AI原生應用似乎也不例外。關于AI原生應用的呼聲已經持續(xù)一段時間,但普通用戶對“AI原生”依然陌生。除了新業(yè)態(tài)普及的周期性,AI原生應用的爆發(fā)與否還涉及另一個議題,即怎么降低AI原生應用開發(fā)的難度和門檻。剛剛結束的華為開發(fā)者大會202
近期,蘋果發(fā)布M4芯片,號稱“比當今任何AIPC的任何神經引擎都強!”緊隨其后微軟攜“Copilot+PCs”的概念加入AIPC激戰(zhàn)。截至目前,包括聯(lián)想、惠普、華為等多家主流PC廠商在內,已經至少推出了超50款AIPC產品。AI重塑行業(yè)的機遇,誰都不想錯過。對于企業(yè)來說,能否積極擁抱AIPC十分關鍵
我花了2天時間,把松松最近1年的爆款文案+關鍵詞+情緒+口頭禪整理出來,4000多字的Prompt,都是一點點打出來的,再投喂到AI大模型里。使用的平臺包括:通義千問、文心一言、智譜清言。接下來我吐槽下這3家AI模型的創(chuàng)建指令(Prompt)的體驗:(注,本文只說指令功能,不說其他)(1)智譜清言智
Manus撕開一道真相
文/八真來源/節(jié)點財經具身智能賽道,誰最有可能拔得A股資本市場的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬粉絲科技UP主稚暉君(彭志輝)創(chuàng)立的智元機器人。近期,從事新材料研發(fā)與生產的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機器人及相關主體將通過收購其至少63.62%的股
文/道哥大舉裁員、清空賬號、國內IP無法訪問——曾被譽為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時刻“閃離”中國市場。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內團隊也將大幅裁撤——原有120人規(guī)模團隊除40余
四個月前邀請碼炒至10萬元,如今官網變灰、社交賬號清空,這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日,打開Manus官網的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時,Manus官方微博和小紅書
文/十界來源/節(jié)點財經一場圍繞算力自主的競賽,正在科創(chuàng)板上演。近日,國產全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書,擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國產英偉達”上市的第一槍。據招股書顯示,摩爾線程自2020年成立以來,主營全功能GPU芯片的研發(fā)與銷售,以自主
“AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關鍵:(1)拿下河北(2)學習科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術為核心,徹底重構復雜文檔處理邊界。此次升級標志著OCR領域首次實現(xiàn)對同一文檔內任意混合語言文本的精準識別,為全球化企業(yè)、跨境業(yè)務及多元文化場