5月20日,火山引擎正式推出豆包·語音播客模型,作為豆包大模型語音語言技術(shù)的重大場(chǎng)景化升級(jí)成果,該模型基于流式模型構(gòu)建,實(shí)現(xiàn)了從文本創(chuàng)作到雙人對(duì)話式播客的秒級(jí)轉(zhuǎn)化,為用戶帶來“低成本、高時(shí)效、強(qiáng)互動(dòng)”的全新創(chuàng)作體驗(yàn)。無需復(fù)雜剪輯,熱點(diǎn)內(nèi)容就能瞬間轉(zhuǎn)化為生動(dòng)播客,讓創(chuàng)意落地快人一步!
豆包·語音播客模型效果
僅輸入一句“睡得少和睡得晚,哪一個(gè)危害更大?”秒級(jí)生成播客音頻
在當(dāng)今信息爆炸的時(shí)代,播客作為一種受歡迎的內(nèi)容傳播形式,正吸引越來越多的用戶。然而,傳統(tǒng) AI 播客創(chuàng)作存在諸多痛點(diǎn),如內(nèi)容重復(fù)廢話連篇、不夠口語化、聽感機(jī)械且缺乏互動(dòng),嚴(yán)重影響了用戶體驗(yàn)。豆包·語音播客模型針對(duì)這些問題進(jìn)行了重點(diǎn)攻克,帶來了三大核心優(yōu)勢(shì):
雙人對(duì)話自然流暢:以往的 AI 生成語音往往生硬死板,像機(jī)器人在說話,而豆包·語音播客模型憑借高度擬人的語音效果,結(jié)合真人專業(yè)播客中自然附和等口語習(xí)慣,讓對(duì)話效果達(dá)到了專業(yè)播客錄制的水準(zhǔn);
播客創(chuàng)作高效快捷:傳統(tǒng)播客制作可能需要耗費(fèi)大量的時(shí)間和精力,而豆包·語音播客模型構(gòu)建了端到端的便捷鏈路,一氣呵成地完成整個(gè)創(chuàng)作過程;
時(shí)事熱點(diǎn)跟隨:在信息更新?lián)Q代極快的當(dāng)下,緊跟時(shí)事熱點(diǎn)是播客保持吸引力的關(guān)鍵。豆包·語音播客模型具備深度搜索功能,用戶只需輸入熱點(diǎn)話題,5秒即可聽到利用最新信息生成的播客音頻。
此外,豆包·語音播客模型不僅支持用戶靈感創(chuàng)作,用戶輸入一個(gè)主題,它就能將想法轉(zhuǎn)化為深度播客觀點(diǎn),為創(chuàng)作者提供豐富的思路和內(nèi)容;模型還支持超長(zhǎng)文本轉(zhuǎn)播客,用戶輸入文檔或 URL 網(wǎng)頁(yè)地址,就能輕松創(chuàng)作媲美真人的播客作品。
豆包·語音播客模型的 URL 模式操作演示(豆包 PC 版即將上線)
豆包·語音播客模型即將在豆包 APP 及 PC 端、扣子等產(chǎn)品中陸續(xù)上線。敬請(qǐng)關(guān)注6月11日「2025火山引擎 Force 原動(dòng)力大會(huì)」,更多播客創(chuàng)作玩法將于大會(huì)揭曉!
本文轉(zhuǎn)載自:,不代表科技訊之立場(chǎng)。原文鏈接:https://v.gaoduanedu.cn/index/index/yulan/id/345794