首页 · 快讯 · 正文

数字人数十秒完成作画、一天卖出17万元,文心大模型创作价值不容小觑

  一年一度的国内顶尖艺术院校的毕业展,成为最值得期待的中国艺术新兴力量们的展示舞台。在今年6月初,初出茅庐的“AI画家”度晓晓创作的AI绘画数字藏品卖出了超过17万元的高价。而她售卖的四幅画作,平均只需数十秒就能完成,极大展现了百度飞桨文心大模型的AIGC(AI Generated Content)能力。

  近日,百度数字人度晓晓带着她的画作“现身”西安美术学院2022年“时空留痕·无界西美”本科毕业展,开设专属展区,被美院教授评价为具有“美院毕业生水平”。

从一段话到一幅画,跨模态生成能力尽显

  “时空留痕”毕业展是西安美术学院每年规模及影响力较大的展览之一,今年西安美术学院首次提出了“无界西美”的展览理念,让社会各界通过线上、线下等方式走进毕业展。

  度晓晓此次展出的“无界”系列六幅高清艺术画作在展览现场吸引不少观展者驻足欣赏。围绕展览主题,度晓晓创作了“无界”系列画作,《自然与虚拟》、《火星上的月亮》、《沙漠中的孤岛》、《颜色与星空》四幅作品,分别诠释了生灵、自然、宇宙和色彩之间的“无界”,尽显丰富的想象力和独特的艺术审美。与此同时,在百度飞桨文心大模型的支持下,度晓晓每幅作品的创作时间仅需数十秒。

  此外,度晓晓还以西安著名的大慈恩寺雁塔为素材,创作了两幅作品。一幅是落日熔金,鸿雁北归,慈恩寺内长明的油灯与嗒嗒的木鱼声相伴千年,展现的是文明的无界。另一幅是百年之树木与林立的高楼互相碰撞,新生的飞鸟绕着古老的佛寺滑翔。现代化都市与伫立千百年的雁塔互相依偎,展现的是时光的无界。

  仅仅需要输入一段语言描述,AI系统就可以在数十秒内生成一幅高清艺术画作,充满想象力的构图、流畅的笔触和丰富的色彩无不彰显着独特的艺术审美。文心大模型不仅能让AI根据需求画出多样场景,还能博采众长,实现水彩、油画、水墨画、印象派等多种风格。

  和高考作文写作一样,度晓晓“无界”系列画作背后,体现的是百度产业级深度学习平台飞桨以及产业级知识增强大模型文心的强大技术实力。度晓晓创作的“无界”系列作品使用了文心大模型跨模态图文生成模型ERNIE-ViLG,它具备了领先的跨模态理解和生成能力。

  让机器具备跨越文本、图像等多种模态的跨模态生成能力是人工智能的重要目标之一,也是一种为艺术创作、虚拟现实、虚拟数字人等领域的未来发展提供无限可能的原动力。以艺术创作为例,首先,AI要对人们输入文字的含义进行深度理解,结合背景知识在给定文字上进一步扩展,再根据扩充后形成的丰富信息搜寻契合的元素,进而产生创作的“灵感”;然后,AI将“灵感”落实初步落实为草图,再进行优化填充,逐渐调整为切合主题的高质量图片。

  除了艺术创作外,度晓晓创作“无界”系列作品使用的文心跨模态图文生成大模型ERNIE-ViLG更是一种图像-文本双向生成模型,它通过自回归生成模式对图像生成和文本生成任务进行统一建模,更好地捕捉模态间的语义对齐关系,同时提升图文双向生成任务的效果。也就是说,使用ERNIE-ViLG不仅可以根据个性化需求自动化生成油画、水彩画、中国画等多种风格的不同分辨率图像,还能实现“看图说话”的效果。

文心大模型助力智能创作,推动AIGC时代到来

  AI技术不断迭代之下,除UGC、PGC以外的一种利用AI自动生成内容的新型生产方式——AIGC已悄然走进我们的生活。百度研究院在今年初发布的科技趋势预测中提到,2022年AIGC借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,将实现大规模应用。度晓晓在挑战高考作文写作中的表现更是让媒体感受到“AIGC元年已至”。

  AI在艺术领域的学习与创作能力正在颠覆我们的认知,也让公众对科技与艺术的融合创新有了更大的想象空间。百度全新推出的基于文心大模型的创意社区——文心·旸谷社区,希望让更多用户可以零距离感受到文心大模型的魅力和应用创新潜力,迸发出更多富有想象力的新事物。未来,基于文心大模型的AIGC将会带来更多新的创新性探索,并开放赋能到更多的内容生产领域。

  预训练大模型的研发从持续增大参数规模向实用化的转变,使人工智能技术的落地应用的成本进一步降低。2019年开始,百度大模型实力逐渐显现,自主研发的产业级知识增强文心系列大模型不断升级迭代。

  在刚刚结束的WAVE SUMMIT 2022深度学习开发者峰会上,文心大模型迎来一系列升级:发布10个新的大模型,包括融合学习任务知识的知识增强千亿大模型、多任务统一学习的视觉大模型、跨模态大模型、生物计算大模型、行业大模型等;提出支撑大模型产业落地的3个关键路径:建设更适配场景需求的大模型体系,提供全流程支持应用落地的工具、平台和方法,建设激发创新的开放生态等。

  此外,除了在智能创作方面,在百度内部,文心大模型也全面应用于智能搜索、信息流、智能音箱等互联网产品,大幅提升了用户获取信息、知识和服务的效率和体验。同时,文心大模型的落地应用已经覆盖工业、能源、教育、金融、通信、媒体等众多行业,例如工业领域的零部件质量检测、能源领域的输电线路巡检、金融行业的合同信息抽取等等,真正帮助企业实现降本增效以及智能化升级。

  作为人工智能“基础设施”的一部分,预训练大模型拓宽了人工智能技术落地场景的覆盖广度,同时降低了渗透到产业应用的难度。未来,持续升级的文心大模型将继续降低应用门槛,覆盖更多场景,惠及各行各业。