還在玩只限于人臉的AR玩法嗎?一鍵美體塑形、視頻體感游戲、用手機(jī)就能玩虛擬形象全身驅(qū)動……隨著5G即將全面普及以及智能圖形技術(shù)的不斷創(chuàng)新,原本受限于高端硬件的全身AR技術(shù),現(xiàn)在用智能手機(jī)就能玩,視頻AR玩法也將全面進(jìn)入了全身時代。
相芯科技此次對人體AI技術(shù)進(jìn)行全面升級,在視頻AR特效的功能基礎(chǔ)上進(jìn)行玩法升級,同時新增開放7大功能的算法接口,分別是2D人體關(guān)鍵點(diǎn)、3D人體骨骼、人像分割、頭部分割、頭發(fā)分割、動作識別、手勢識別。每項(xiàng)技術(shù)革新背后都能帶來新的應(yīng)用層的火花,相芯更新的技術(shù)效果到底如何,一起來看下吧。

打開APP 閱讀最新報道一、2D人體關(guān)鍵點(diǎn)
通過2D人體關(guān)鍵點(diǎn)算法接口,實(shí)現(xiàn)人體全身2D關(guān)鍵點(diǎn)的跟蹤效果,點(diǎn)位準(zhǔn)確性高,即使做大幅度動作、遮擋以及轉(zhuǎn)身的情況下,也能準(zhǔn)確穩(wěn)定跟蹤。同時針對用戶在短視頻、直播拍攝時的自拍場景,2D人體關(guān)鍵點(diǎn)還提供半身模式的點(diǎn)位跟蹤,這樣用戶在單手持手機(jī)自拍的情況下,也能準(zhǔn)確定位人體數(shù)據(jù)。

在高精度的人體關(guān)鍵點(diǎn)模型的基礎(chǔ)上,對視頻中的人物實(shí)現(xiàn)全身美體功能,是這項(xiàng)技術(shù)比較熱門的應(yīng)用場景。相芯的技術(shù),可以從瘦身、長腿、細(xì)腰、美肩、美臀、小頭、瘦腿等七個美化維度,對人物的身體進(jìn)行精細(xì)化調(diào)整,從而達(dá)到一件瘦身塑形的作用。

二、3D人體骨骼
相芯科技開放的3D人體骨骼的算法接口,主要應(yīng)用于基于3D關(guān)鍵點(diǎn)和3D骨骼,實(shí)現(xiàn)3D虛擬形象的全身驅(qū)動。這項(xiàng)技術(shù)不依賴于深度攝像頭,只需要手機(jī)的普通攝像頭就能獲得視頻中的人體3D骨骼數(shù)據(jù),即使人物做大幅度的動作、有動作遮擋、轉(zhuǎn)身等情況都能穩(wěn)定跟蹤。除了身體軀干動作,在手指細(xì)節(jié)上,也能識別和跟蹤常見的14種手勢。讓3D虛擬形象能夠更細(xì)膩地復(fù)原人物的動作。同樣針對他人拍攝和自拍兩種拍攝場景,相芯提供全身和半身兩種模式,支持3D人體骨骼數(shù)據(jù)的輸出。

三、人像分割
通過人像分割的算法接口,可對輸入的視頻進(jìn)行內(nèi)容理解,將人物進(jìn)行高精分割解析,將人像區(qū)域分離出來,并實(shí)時追蹤。例如視頻直播過程中,識別用戶的人體輪廓,為人物實(shí)時替換各種背景特效。也可以與各具創(chuàng)意的人體AR貼紙相結(jié)合,讓貼紙實(shí)時跟隨人體移動,貼紙素材與人體的前后位置關(guān)系可靈活定義,可以充分發(fā)揮運(yùn)營者的互動創(chuàng)意,為用戶帶來更加豐富的娛樂體驗(yàn)。

四、頭部分割
通過頭部分割接口,企業(yè)和開發(fā)者可以對人物頭部區(qū)域做更多的特效創(chuàng)意。例如搞笑大頭玩法特效,可以實(shí)現(xiàn)視頻中的人物頭部放大的萌態(tài)效果。這項(xiàng)技術(shù)還能和其他技術(shù)進(jìn)行組合實(shí)現(xiàn)更加新穎的玩法效果。比如將頭部分割和表情系數(shù)結(jié)合,即可用特點(diǎn)的表情,觸發(fā)大頭效果,并用表情的夸張程度來實(shí)時控制頭部的放大程度。用頭部分割+哈哈鏡+AR貼紙這樣的技術(shù)組合,就可以實(shí)效惡搞版的效果,充分發(fā)揮腦洞創(chuàng)意。

五、頭發(fā)分割
通過頭發(fā)分割接口,可以在視頻和照片中人物的頭發(fā)區(qū)域高精度地分離出來,可以給頭發(fā)切換各種各樣的顏色,可以是純色,也可以是漸變色,實(shí)現(xiàn)一鍵換發(fā)色的特效。同時頭發(fā)的色值支持自定義,并可以進(jìn)行上色程度的調(diào)整,實(shí)現(xiàn)想要的發(fā)色,想換就換。

六、動作識別
相芯科技的動作識別接口,能夠支持15種全身動作的識別。將動作識別和匹配算法相結(jié)合,可以開發(fā)出各種體感小游戲,比如“尬舞機(jī)”游戲,跟著屏幕的動作提示即可開始跳舞了。同時動作識別也可以與AR貼紙相結(jié)合,用特定動作來觸發(fā)貼紙?zhí)匦?充分發(fā)揮體感互動的娛樂性。

七、手勢識別
通過手勢識別接口,可精準(zhǔn)識別常見的14種手勢動作。在短視頻直播領(lǐng)域,用戶在拍視頻和拍照過程中,可以通過手勢動作來觸發(fā)各種貼紙?zhí)匦?從而衍生出創(chuàng)意視頻的各種玩法。同時,在智能設(shè)備領(lǐng)域,比如智能家電、智能機(jī)器人、可穿戴設(shè)備、智能互動大屏等智能硬件,可以實(shí)現(xiàn)用手勢控制對應(yīng)的功能。用戶在不接觸設(shè)備的情況下,通過簡單的手勢,就能實(shí)現(xiàn)對設(shè)備的交互和控制,讓人機(jī)交互方式更加智能化、自然化。

相芯科技專注于人工智能和計(jì)算機(jī)圖形學(xué)的融合與創(chuàng)新,致力于為消費(fèi)級應(yīng)用提供內(nèi)容創(chuàng)作工具、平臺和解決方案。相芯科技的人臉人體AI解決方案目前已累計(jì)服務(wù)700多家B端客戶,產(chǎn)品被廣泛應(yīng)用于短視頻、直播、社交、游戲、智能家居、在線教育、廣告營銷、新零售等領(lǐng)域,月均調(diào)用量達(dá)40億。
此次的人體AI SDK大更新,相芯針對不同體驗(yàn)需求推出了兩個版本的體驗(yàn)demo,分別是特效版和算法版demo。
【特效版demo】模擬真實(shí)的用戶應(yīng)用場景,提供技術(shù)的功能演示和體驗(yàn),可以在這個demo里面直觀體驗(yàn)美顏、美妝、道具貼紙、Animoji、美發(fā)、輕美妝、AR面具、搞笑大頭、海報換臉、表情識別、音樂濾鏡、哈哈鏡、美體、全身Avatar、動作識別、人像分割、手勢識別等功能。
同時針對開發(fā)者用戶,為了能更好地體驗(yàn)各個功能接口在算法層的效果,相芯全新推出【算法版demo】,使用這個demo就能直觀地看到各種人體關(guān)鍵點(diǎn)、人體骨骼、mask類功能的算法效果,便于進(jìn)一步開發(fā)使用。目前開放的接口為2D人體關(guān)鍵點(diǎn)、3D人體骨骼、人像分割、頭部分割、頭發(fā)分割、動作識別、手勢識別。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營商、科研院所等優(yōu)秀團(tuán)隊(duì)
這幾個月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓(xùn)練模型來實(shí)現(xiàn)圖像識別、聲音識別、語言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個平臺+四大開發(fā)服務(wù),建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時間6月29日收盤,涂鴉智能美股股價上漲5.6%,來到1.87美元/股。近日股價穩(wěn)定
美團(tuán)曾經(jīng)的二號人物王慧文對標(biāo)OpenAI的創(chuàng)業(yè)項(xiàng)目光年之外,以20億賣給美團(tuán),再度引發(fā)市場對大模型的熱議。
2020年底,王慧文在朋友圈寫下這句話時,外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺。但是,一個曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
我覺得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就
文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來源/節(jié)點(diǎn)財經(jīng)一場關(guān)于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國產(chǎn)GPU領(lǐng)域取
技術(shù)的進(jìn)步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對阿里云最新9代ECS
9月24日,杭州云棲大會技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級,打造Agentic-SOC安全運(yùn)營,提升安全威脅檢測和響應(yīng)效率。在過去的一年,AIAgent正在