微軟剛剛發布了VibeVoice - 1.5B SoTA文本到語音模型 - MIT許可



它可以生成最長 90 分鍾的音頻
AUDIO2.66%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 5
  • 轉發
  • 分享
留言
0/400
TokenTaxonomistvip
· 20小時前
嗯,从统计学的角度来看,90分钟比我在我的文本到语音模型分析电子表格中预测的多97.8%
查看原文回復0
GateUser-bd883c58vip
· 20小時前
语音转文本最近真卷啊
回復0
NotFinancial_Advicevip
· 20小時前
这波微软能处啊
回復0
SorryRugPulledvip
· 21小時前
又是微软?巨头真的卷疯了
回復0
LiquidatedDreamsvip
· 21小時前
微软这也太卷了...
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)