多人AI合唱功能上线！Soul App“懒人KTV”活动以AIGC助力社交新玩法

网络 · 2024-02-28 15:32:27

“为你唱这首歌没有什么风格”

“它仅仅代表着我希望你快乐”

逛街路上、欢聚时刻，与朋友你一言我一语嗨唱喜欢的歌曲，是不少年轻人抵御精神内耗、治愈自己的“良药”。如今，在AIGC助力下，音乐互动有了新玩法。

近日,兴趣社交社区平台Soul App上线“懒人KTV”活动，用户录制30秒音频，即可生成专属声音模型，并能够通过三种AI唱歌模式——均衡、相似度、表现力，一键合成个性化音乐翻唱作品。值得注意的是，此次活动除了支持单人演唱，更支持“AI合唱”玩法，用户可以邀请好友，共同完成音色克隆，跨越时空进行音乐“合唱”，实现差异化的社交体验。

打造创新体验的背后，是Soul对人工智能领域的持续布局。作为较早使用AI技术解决人与人连接需求的社交平台，Soul 在2016年上线后，陆续推出了自研的灵犀引擎（基于AI技术及 Soul 用户站内全场景画像的智能推荐系统）和NAWA引擎（集AI、渲染与头像处理于一体的集成化SDK，包含了AR增强现实能力、PTA图像生成虚拟形象、TTA文字生成动画、STA语音生成动画等技术），持续探索以AI助力交互效率、质量和社交体验的综合提升。

为给用户带来更沉浸、更智能、更深度的社交体验，2020年，Soul启动对AIGC（生成式人工智能）的技术研发工作，并在智能对话、图像生成方面拥有了前沿能力积累。例如，Soul推出的自研垂类语言大模型Soul X,已应用于智能对话机器人“AI苟蛋”、AI辅助聊天、虚拟陪伴等多元场景。

音乐是重要的沟通“语言”和社交方式。在强调兴趣社交的Soul，音乐是非常受用户欢迎的兴趣垂类之一，平台上不仅聚集了大量优质的音乐创作者，众多用户也会自发通过音乐评论、歌词分享、歌曲合唱等方式放松心情、互动娱乐。

因此，在语音、音乐方向，Soul持续加码布局。此前，Soul语音团队推出了自研的个性化音乐创作引擎“伶伦”，具备业内领先的音频深度学习能力。基于该引擎，Soul于2023年上线了“Soul次元歌手”活动，帮助每个人打造自己的AI歌手分身，获得了广大用户的热烈欢迎。

目前，伶伦引擎已完成2.0版迭代。例如，在音域控制方面，升级为多人多尺度自适配模型，提升了多人合成的相似度和表现力控制；在歌声合成方面，升级为前沿的去噪扩散概率模型，进一步提升了合成的音质和准确性。

此次，“懒人KTV”活动在国内社交领域中创新实现多人UGC“AI合唱”体验正是得益于此。而差异化的交互体验也获得了广大用户的认可，此次活动推出后，众多平台用户积极参与，并邀请好友一起体验“AI合唱”。

据了解，Soul团队将持续升级伶伦引擎。例如，后续将基于AIGC个性化交互的音乐创作能力，支持一键AI音乐创作，包括词、曲、编、唱、混等多种功能，进步一降低用户通过音乐表达自我、以音乐悦己、以音乐共鸣、以音乐社交的门槛，满足年轻人群体对更具沉浸感、更差异化交互体验的渴望，并通过AIGC助力每个人创造力的释放。

现阶段，以AIGC为代表的新一轮技术浪潮加速了各行业的发展和突破。在互联网社交领域，新技术、新需求正重新定义“社交”的含义和形态。作为行业前沿探索者代表，Soul将深化“AIGC+社交”战略，以持续的技术能力建设为基础，围绕用户实际的社交需求，不断推动社交的综合互动体验创新。