快手AI美音 - 3秒把你从五音不全变成天籁之音

课程 ID: 18297

描述:
案例背景: 回森是快手孵化的一款的音乐社交产品,对于回森的用户来说,最大的痛点是觉得自己唱歌不好听、跑调之类,所以回森本质上需要一款类似美图的声音美化能力,来帮助用户唱的更好听。 我们早期也尝试过一些传统修音的手段,但是限于当时的技术条件,整体效果是不够的;AI美音是我们基于AIGC能力打造出来的一种声音美化的方案。 解决思路: 回森在sovtis模型的基础上研发出了AI美音功能,该功能直观的理解是可以抽用户的音色,结合专业歌手的唱法,重组成一个最终的K歌作品,使用户感觉到自己的音准和节奏有很大的提升,从而提升用户发作品的意愿。 为了给用户提供极致的体验,我们的方案是在原生模型的基础上做了改良,使得AI美音功能可以覆盖全量的用户,且推理的速度很快,成本极低。 成果: 对于业务的收益是核心的作者渗透率提升极大,彻底解决了用户发布难的问题,端内使用AI美音的作品占比接近50%,说明用户对AI美音的认可度很高。