Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

综合介绍 Step-Audio 是一个开源的智能语音交互框架,旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话(如中文、英文、日语)、情感语音(如快乐、悲伤)、区域方言(如粤语、四川...
Il y a 3 mois
08050