微软刚刚发布了VibeVoice - 1.5B SoTA文本到语音模型 - MIT许可



它可以生成最长 90 分钟的音频
AUDIO-2.07%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 转发
  • 分享
评论
0/400
TokenTaxonomistvip
· 16小时前
嗯,从统计学的角度来看,90分钟比我在我的文本到语音模型分析电子表格中预测的多97.8%
查看原文回复0
GateUser-bd883c58vip
· 16小时前
语音转文本最近真卷啊
回复0
NotFinancial_Advicevip
· 16小时前
这波微软能处啊
回复0
SorryRugPulledvip
· 17小时前
又是微软?巨头真的卷疯了
回复0
LiquidatedDreamsvip
· 17小时前
微软这也太卷了...
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)