“为你唱这首歌 没有什么风格”
“它仅仅代表着 我希望你快乐”
逛街路上、欢聚时刻,与朋友你一言我一语嗨唱喜欢的歌曲,是不少年轻人抵御精神内耗、治愈自己的“良药”。如今,在AIGC助力下,音乐互动有了新玩法。
近日,兴趣社交社区平台Soul App上线“懒人KTV”活动,用户录制30秒音频,即可生成专属声音模型,并能够通过三种AI唱歌模式——均衡、相似度、表现力,一键合成个性化音乐翻唱作品。值得注意的是,此次活动除了支持单人演唱,更支持“AI合唱”玩法,用户可以邀请好友,共同完成音色克隆,跨越时空进行音乐“合唱”,实现差异化的社交体验。
打造创新体验的背后,是Soul对人工智能领域的持续布局。作为较早使用AI技术解决人与人连接需求的社交平台,Soul 在2016年上线后,陆续推出了自研的灵犀引擎(基于AI技术及 Soul 用户站内全场景画像的智能推荐系统)和NAWA引擎(集AI、渲染与头像处理于一体的集成化SDK,包含了AR增强现实能力、PTA图像生成虚拟形象、TTA文字生成动画、STA语音生成动画等技术),持续探索以AI助力交互效率、质量和社交体验的综合提升。
为给用户带来更沉浸、更智能、更深度的社交体验,2020年,Soul启动对AIGC(生成式人工智能)的技术研发工作,并在智能对话、图像生成方面拥有了前沿能力积累。例如,Soul推出的自研垂类语言大模型Soul X,已应用于智能对话机器人“AI苟蛋”、AI辅助聊天、虚拟陪伴等多元场景。
音乐是重要的沟通“语言”和社交方式。在强调兴趣社交的Soul,音乐是非常受用户欢迎的兴趣垂类之一,平台上不仅聚集了大量优质的音乐创作者,众多用户也会自发通过音乐评论、歌词分享、歌曲合唱等方式放松心情、互动娱乐。
因此,在语音、音乐方向,Soul持续加码布局。此前,Soul语音团队推出了自研的个性化音乐创作引擎“伶伦”,具备业内领先的音频深度学习能力。基于该引擎,Soul于2023年上线了“Soul次元歌手”活动,帮助每个人打造自己的AI歌手分身,获得了广大用户的热烈欢迎。
目前,伶伦引擎已完成2.0版迭代。例如,在音域控制方面,升级为多人多尺度自适配模型,提升了多人合成的相似度和表现力控制;在歌声合成方面,升级为前沿的去噪扩散概率模型,进一步提升了合成的音质和准确性。
此次,“懒人KTV”活动在国内社交领域中创新实现多人UGC“AI合唱”体验正是得益于此。而差异化的交互体验也获得了广大用户的认可,此次活动推出后,众多平台用户积极参与,并邀请好友一起体验“AI合唱”。
据了解,Soul团队将持续升级伶伦引擎。例如,后续将基于AIGC个性化交互的音乐创作能力,支持一键AI音乐创作,包括词、曲、编、唱、混等多种功能,进步一降低用户通过音乐表达自我、以音乐悦己、以音乐共鸣、以音乐社交的门槛,满足年轻人群体对更具沉浸感、更差异化交互体验的渴望,并通过AIGC助力每个人创造力的释放。
现阶段,以AIGC为代表的新一轮技术浪潮加速了各行业的发展和突破。在互联网社交领域,新技术、新需求正重新定义“社交”的含义和形态。作为行业前沿探索者代表,Soul将深化“AIGC+社交”战略,以持续的技术能力建设为基础,围绕用户实际的社交需求,不断推动社交的综合互动体验创新。
02-28 15:10
02-28 14:47
02-28 11:43
02-28 10:18
02-28 10:14
02-27 14:14
02-27 13:43
02-27 10:13
02-27 09:01
02-26 14:07