VoiceCraft | itisChat

VoiceCraft：官宣超过XTTS的语音模型，支持克隆音频，支持通过修改原始音频的文本来编辑音频。

数据统计

翻译视频和音频利用人工智能释放全球潜力

一键提取视频文案，总结内容，改写内容

科大讯飞推出的移动互联网智能交互平台，为开发者免费提供：涵盖语音能力增强型SDK，一站式人机智能语音交互解决方案，专业全面的移动应用分析

集成「ChatGPT+Midjourney+GPTs+TTS+Whisper」的开源 UI 面板

Stable Diffusion 是一种潜在的文本到图像扩散模型，能够在给定任何文本输入的情况下生成逼真的图像，培养自主自由以产生令人难以置信的图像，使数十亿人能够在几秒钟内创造出令人惊叹的艺术。

「通义听悟」是通义家族新成员，依托通义千问语言模型、音视频AI模型能力，为用户带来音频和视频内容记录和阅读的全新体验，成为在工作和学习中的AI助手，让每个人都能亲身去体验AI功能给我们带来的效率提升和灵感迸发。