VoiceCraft:官宣超过XTTS的语音模型
VoiceCraft:官宣超过XTTS的语音模型,支持克隆音频,支持通过修改原始音频的文本来编辑音频。
一款免费文字转语音工具/文本转语音工具,提供语音合成服务,支持多种语言
Stable Diffusion 是一种潜在的文本到图像扩散模型,能够在给定任何文本输入的情况下生成逼真的图像,培养自主自由以产生令人难以置信的图像,使数十亿人能够在几秒钟内创造出令人惊叹的艺术。
「通义听悟」是通义家族新成员,依托通义千问语言模型、音视频AI模型能力,为用户带来音频和视频内容记录和阅读的全新体验,成为在工作和学习中的AI助手,让每个人都能亲身去体验AI功能给我们带来的效率提升和灵感迸发。
世界上最大的艺术家风格、流派/媒介合集,涵盖所有流行的图像生成模型,8~11 个共同主题画廊 或每个艺术家或流派
集成「ChatGPT+Midjourney+GPTs+TTS+Whisper」的开源 UI 面板
一键提取视频文案, 总结内容, 改写内容