2025年6月17日,字節(jié)跳動旗下智能助手豆包正式在電腦版及網(wǎng)頁端全量上線“AI播客”功能,用戶只需上傳PDF文檔或網(wǎng)頁鏈接,即可一鍵生成由兩位AI主播演繹的對話式播客節(jié)目。這一創(chuàng)新功能憑借高度擬人化的語音效果和秒級轉(zhuǎn)化效率,迅速引發(fā)內(nèi)容創(chuàng)作者、學(xué)生群體及職場人士的關(guān)注。
技術(shù)突破:真人級語音交互,秒級生成播客
據(jù)豆包團隊介紹,該功能基于其自主研發(fā)的語音播客模型,通過流式模型與端到端技術(shù),將文本創(chuàng)作到音頻生成的全流程壓縮至數(shù)秒內(nèi)完成。生成的播客不僅音色自然、停頓合理,還融入了日常對話中的語氣詞和附和習(xí)慣,例如“嗯”“對”“其實呢”等口語化表達,使對話更貼近真人交流場景。
內(nèi)測用戶反饋顯示,該功能尤其適用于處理長篇學(xué)習(xí)資料或行業(yè)報告。例如,學(xué)生可將課堂PPT拍照上傳,AI自動提取文字后生成深度講解的播客;職場人則可將網(wǎng)頁文章轉(zhuǎn)化為通勤路上的“聽書”內(nèi)容。一位參與測試的用戶表示:“以前看一篇萬字報告要半小時,現(xiàn)在直接生成播客,邊走邊聽效率翻倍。”
場景覆蓋:學(xué)習(xí)、工作、娛樂全適配
目前,豆包AI播客支持多種輸入方式:
文檔轉(zhuǎn)播客:上傳PDF、Word等格式文件,AI自動解析內(nèi)容并生成對話; 鏈接轉(zhuǎn)播客:支持微信公眾號、知乎、騰訊文檔等公開鏈接,一鍵抓取文字生成音頻; 拍照轉(zhuǎn)播客:通過手機拍攝PPT、書籍等紙質(zhì)資料,OCR識別后轉(zhuǎn)化為播客。
此外,用戶可自由選擇主播音色(如“新聞主播風(fēng)”“輕松對話風(fēng)”)及對話模式(男女對談、雙男或雙女組合),甚至自定義角色身份(如“專家訪談”“師生討論”)。例如,將學(xué)術(shù)論文轉(zhuǎn)化為“教授與學(xué)生探討”的播客,或把產(chǎn)品說明書改寫為“客服與用戶問答”形式,極大提升了內(nèi)容的趣味性和可聽性。
行業(yè)對比:差異化優(yōu)勢凸顯
與市場上同類產(chǎn)品相比,豆包AI播客的核心競爭力在于“低成本、高時效、強互動”。例如,有道文檔FM雖支持多格式輸入,但生成音頻需手動調(diào)整角色分配;而谷歌NotebookLM的中文播客功能則存在語言適配性不足的問題。豆包團隊表示,其模型通過海量中文對話數(shù)據(jù)訓(xùn)練,更符合國內(nèi)用戶的表達習(xí)慣。
目前,該功能已在豆包電腦版、網(wǎng)頁端及扣子空間平臺上線,手機端App也已開啟小流量測試,預(yù)計近期全量開放。豆包產(chǎn)品負責人透露,未來將推出“多角色扮演”功能,允許用戶上傳劇本或故事大綱,由AI生成多人對話的廣播劇,進一步拓展內(nèi)容創(chuàng)作邊界。
市場影響:重新定義“聽書”體驗
隨著AI播客功能的普及,內(nèi)容消費場景正從“閱讀”向“聆聽”遷移。艾瑞咨詢數(shù)據(jù)顯示,2025年中國有聲內(nèi)容市場規(guī)模預(yù)計突破800億元,其中AI生成內(nèi)容占比將達30%。豆包AI播客的推出,不僅降低了播客創(chuàng)作門檻,也為教育、出版、傳媒等行業(yè)提供了新的內(nèi)容分發(fā)渠道。
例如,出版社可將新書章節(jié)轉(zhuǎn)化為播客試聽片段,吸引讀者購買;企業(yè)則可將產(chǎn)品白皮書轉(zhuǎn)化為音頻,通過播客平臺觸達更多用戶。一位教育行業(yè)從業(yè)者評價:“AI播客讓知識傳播更碎片化、更沉浸,未來或成為在線教育的重要工具。”
結(jié)語:AI賦能內(nèi)容創(chuàng)作的新里程碑
豆包AI播客功能的上線,標志著AI技術(shù)在內(nèi)容生成領(lǐng)域的又一次突破。從文本到音頻的“一鍵轉(zhuǎn)化”,不僅解放了用戶的雙手,更讓知識獲取變得更加高效、便捷。隨著技術(shù)的持續(xù)迭代,AI播客或?qū)⒊蔀槊總€人口袋里的“私人電臺”,重新定義信息傳播與消費的方式。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
Manus撕開一道真相
文/八真來源/節(jié)點財經(jīng)具身智能賽道,誰最有可能拔得A股資本市場的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬粉絲科技UP主稚暉君(彭志輝)創(chuàng)立的智元機器人。近期,從事新材料研發(fā)與生產(chǎn)的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機器人及相關(guān)主體將通過收購其至少63.62%的股
文/道哥大舉裁員、清空賬號、國內(nèi)IP無法訪問——曾被譽為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時刻“閃離”中國市場。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內(nèi)團隊也將大幅裁撤——原有120人規(guī)模團隊除40余
四個月前邀請碼炒至10萬元,如今官網(wǎng)變灰、社交賬號清空,這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日,打開Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時,Manus官方微博和小紅書
文/十界來源/節(jié)點財經(jīng)一場圍繞算力自主的競賽,正在科創(chuàng)板上演。近日,國產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書,擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國產(chǎn)英偉達”上市的第一槍。據(jù)招股書顯示,摩爾線程自2020年成立以來,主營全功能GPU芯片的研發(fā)與銷售,以自主
“AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場