AI大模型时代启幕算力底座玩家联想为大国科技注入战略资源

网络 · 2023-03-20 09:15:24

从ChatGPT走红到GPT-4降临,人工智能技术大突变将整个世界迅速带入算力时代。

算力,即对数据的处理能力,如果说数据是AI模型的“燃油”,那算力就是AI模型的“发动机”。目前AI算力已进入大模型时代,大模型的实现更需要强大的算力来支撑训练和推理过程。在国内,以全球最重要的算力公司之一、算力基础设施供应商联想集团为代表的“算力卖水人”,成为算力生态链的重要玩家,同时为科技进步和数字经济发展以及综合国力提升贡献算力战略资源。

大模型尽头是算力

据OpenAI的相关论文透露,ChatGPT的前身GPT-3就使用了3000亿单词、超过40T的大规模、高质量数据进行训练。ChatGPT在其基础上设有1750亿参数,训练集“投喂”了总计约320TB的文字信息,涵盖超4000亿词和约31亿个网页。

并且,ChatGPT加入了人工打标的监督学习,即对话式模型给出结果后,由训练师对结果做出评价并修改结果以更贴切对话内容。数据维度越多,模型参数量越多,模型越复杂,模型的准确度越高,对算力的指数需求越高。

同时在模型训练方面,ChatGPT底层技术使用了强大的Transformer 算法,Transformer强于RNN等算法的原因是它添加了注意力机制,Transformer的综合特征提取能力、远距离特征捕获能力、语义特征提取能力,全部明显增强。

因此,ChatGPT的总算力消耗约为3640PFdays(即假如每秒计算一千万亿次,需要计算3640天),需要7-8个投资规模30亿、算力500P的数据中心支撑运行。微软专门为Open AI打造了一台E级超级计算机,用来在Azure公有云上训练超大规模的人工智能模型。这台超级计算机拥有28.5万个CPU核心,超过1万颗GPU。

据OpenAI测算,自2012年以来,全球头部AI模型训练算力需求3-4个月翻一番,每年头部训练模型所需算力增长幅度高达10倍。

与仅能处理NLP的GPT-3.5相比,支持多模态的GPT-4能够同时处理图像及文本输入,并生成文本输出。GPT-4可以完成一些传统的视觉语言任务,如图像描述、生成字幕、图像分类等;此外,它还具有较强的逻辑分析能力。GPT-4在完成这一系列更为丰富和复杂的任务的同时,其对算力的需求也达到GPT3.0的数倍。

AI应用底座是算力基础设施

ChatGPT带来惊艳的背后,是大语言模型的功劳。目前国内算力玩家大概分成两类,一类是以百度ERNIE、腾讯混元、京东ChatJD、华为盘古、阿里、字节跳动、科大讯飞等各行业领先公司,走的是ChatGPT这种生成式大模型路线;另一类是以联想集团、浪潮信息等为代表的算力基础设施提供商,以“算力卖水人”的身份为更多的AI场景落地提供保障。

而实际上,第一类走生成式大模型路线的算力玩家,在用算法、数据、算力三大要素训练大模型时,也离不开联想集团等基础设施提供商的算力支撑。

经过多年的转型发展和技术沉淀,联想已经成为全球领先的高性能计算解决方案提供商与智能基础设施提供商。公司早在2017年就提出“智能化”转型,2018年,董事长杨元庆提出了“端-边-云-网-智”技术架构与“硬件+软件+服务”的商业模式。在接下来的几年时间里,联想投入重金打造了智能基础设施及数字底座,升级边云网基础设施,建设了支撑数据智能的敏捷柔性技术中台,同时构建了包含智能供应链、智能营销、智能销售、智慧客服等能力的业务中台。

2021年4月,联想集团将智能基础设施这块业务升级独立出来,成立了新的基础设施方案业务集团,即ISG,并明确了“新IT”的概念,即从Information Technology 到 Intelligent Transformation,基于“端-边-云-网-智”技术架构赋能各行各业,实现智能化变革所需要的技术、服务与解决方案。

值得注意的是,ISG业务提供的正是给ChatGPT这样的AI模型应用所需的算力,联想集团在多年前就已经意识到了数智化时代的核心就是算力,算力就是生产力,并为此进行了大量的布局,现在回过头来看,联想集团早在AI算力革命到来之前就做好了提前布局和卡位。

如今,凭借着在服务器、存储、高性能计算、云边计算等领域的深厚积累,以及包括AI服务器在内端到端的全栈型基础设施产品,联想集团已经身为行业领先的“算力卖水人”。

服务器是算力输出的重要载体,联想目前也已成为全球三大服务器供应商之一,拥有多种高密度存储、人工智能负载优化的服务器产品。自2001年以来,联想共创下800余项性能基准测试世界纪录,是创造服务器世界纪录数量最多的IT厂商;截至2022年12月1日,联想保持着294项世界纪录。

此外,联想集团目前已拥有横跨公有云、私有云和混合云的交付能力,可以为多种算力需求客户提供更“普慧”的算力产品。并在异构计算与负载均衡、设备之间的互联互通、数据安全与隐私保护、模型本身的伸缩性与扩展性等方面有长期且深厚的技术积累。

在2022年11月最新的全球HPC Green500榜单上,联想集团交付的Henri系统以每瓦特电力消耗可执行65.091亿次浮点运算的认证性能,成为全球最节能的高性能计算系统。在最新公布的全球HPC TOP500榜单中,联想以入围160套、独占32%的份额,连续第10次蝉联冠军。

数字经济时代,算力即国力

中国信通院对全球47个国家测算得出,2020年数字经济增加值总规模达到 32.6 万亿美元。同年,中国数字经济规模达到39.2万亿元,占GDP比重38.6%,预计2022年这一比重有望升至41%。

在数字经济加速发展的时代背景下,全球数据总量和算力规模呈现高速增长态势。2021年我国算力产业规模达到2.6万亿元,直接和间接分别带动经济总产出2.2万亿和8.2万亿。在ChatGPT热点持续发酵下,高算力需求快速增长,从需求层面看,2022年我国智能算力规模达到268百亿亿次/秒(EFLOPS),超过通用算力规模,未来5年我国智算规模年均复合增长达52.3%。

继热力、电力之后,数字时代算力成为新的核心生产力,以算力为核心的数字信息基础设施已成为国家战略性布局的关键组成部分。2020年4月,国家发改委就对“新基建”的含义首次进行阐释,并将数据中心、智能计算中心为代表的算力基础设施列为信息基础设施。

在未来的大国竞争中,算力之强弱将直接深度影响到新技术的研发效率和研发成果。算力能帮助海量的数据搭建起精确的AI模型,并对其进行复杂的模拟训练。可以说,算力是数字经济时代最底层的驱动器,无人驾驶、智慧城市、智能交通、智慧金融、仿生科技、生命医学、气候预测以及农业精细化等,都离不开超大算力。以联想集团为代表的算力基础设施供应商正在为大国科技战略提供至关重要的算力战略资源。

AI大模型时代启幕 算力底座玩家联想为大国科技注入战略资源

AI大模型时代启幕算力底座玩家联想为大国科技注入战略资源