“有算力就有GDP。”算力已经成为全球新一轮科技革命和产业变革“必争之地”。
《2022-2023全球计算力指数评估报告》显示,IT支出每投入1美元,可以拉动15美元的数字经济产出,同时也可拉动29美元的GDP产出。换言之,国家的计算力指数每提高1点,数字经济将增长3.6‰,GDP将增长1.7‰。
(资料图)
红星资本局在2023中国算力大会上采访了解到,中国算力产业总规模已位列全球第二,但还面临着算力利用率不高,仍需要解决算力时延及调度问题。
其中,伴随人工智能飞速发展,智能算力的需求被火速点燃,国内运营商及企业均加速布局。有企业方对红星资本局表示,应用场景在哪儿更值得被讨论。“当核心应用出来后,不管基础设施的优化方向,还是案例的增长,都会是水到渠成的事。”
工信部部长金壮龙在大会开幕式致辞时表示,将进一步完善算力设施高质量发展顶层设计,加强算力资源统筹,加大高性能智算供给;同时面向工业、金融、能源、教育等重点领域,支持产业各方通力协作,培育推广一批规模大、带动性强、示范效应突出的应用场景。
资料图片 据视觉中国
增速超过通用算力
智能算力时代加速来临
“全世界GDP和算力是完全正相关的,换句话说,算力就是生产力,有算力就会有GDP。”中国工程院院士高文表示,美国计算力指数比中国多,中国大概是美国的70%左右。但中国在算力增长方面是全世界最强劲的,中国的算力增长速度是年均13.5%,美国只有5%。
算力可以分成三种,普通通用算力,超算算力和智算算力。智算算力典型的应用就是大模型训练。
有企业方告诉红星资本局,人工智能是一个消耗巨大算力的应用,智能算力也是近些年才因此兴起的。通俗的讲,就是以GPU为代表,放到传统数据中心里,变成智能算力。
中国信通院在大会上发布的《中国综合算力指数(2023年)》显示,在目前算力规模中,通用算力规模占比达74%;智能算力规模占比达25%,同比增加45%。这一增速要高于总体算力增速。
“这反映了大模型的发展对人工智能算力起到非常重要的推动作用。”中国信通院院长余晓晖认为,我国算力结构优化,智能算力需求正呈现爆发式增长态势。
随着智能算力需求激增,多方正进一步加大高性能智算供给,加快关键技术攻关,激发AI算力赋能效应。
三大运营商已抢先布局。红星资本局在会上获悉,中国移动的数据中心已实现400G光网超长距离传输的世界纪录,今年正在规划建设亚洲最大单体的智算中心;中国电信当前正联合产业各方共同打造面向智算的高速无损确定性网络;中国联通发布了智算训推一体化中卫枢纽建设行动计划,建设西部枢纽首个智算训推节点。
算力网络建设仍存挑战
中国算力规模居全球第二位,但只有算力还不行,要有“算力网络”把算力输送到最需要的地方。采访过程中,多位专家也对红星资本局指出,在算力网络建设上,我们还面临很多挑战。
中国工程院院士、紫金山实验室主任刘韵洁认为,解决网络方面的挑战,需要创新出新的网络架构、新的网络服务,以支持东数西算,支持算力网。
“如果通过互联网那很便宜,但效率低,也不安全,数据容易被别人盗取。另一个办法是专网,专线能够保证安全、保证质量,但是很贵,大家用不起。”刘韵洁强调,需要一种公用的专网技术,既像专网一样安全和保证质量,又像公网一样经济、方便灵活。刘韵洁表示,国家确定了一个未来网络大科学装置,这个大科学装置就能提供便宜又安全的上网服务能力,今年年底准备验收,明年就能够提供服务。
中国工程院院士高文则指出,好的算力网需要迎接两大技术挑战:连接延迟以及调度挑战。
高文透露,如果把光纤变成空芯的光纤,能做到300公里1毫秒时延,鹏城国家实验室正在攻克,“现在200公里已经攻下来了,正在攻300公里。”
调度方面,高文解释,云算力、智能算力、超算算力三者用户类型不同,要分类输送,三种不同的算力怎么样进行调度,这是近期需要面对的挑战。
高文认为,算力也需要有“高速公路”,全国大的算力中心之间一定要有超宽带、超低延迟的网络直连。
怎么让网的时延更低,传得更快,运营商也在紧迫攻克。中国移动通信集团首席科学家、副总工程师王晓云在接受红星资本局采访时表示,“我们现在形成了20毫秒、5毫秒和1毫秒的时延圈,从东到西,最宽是20毫秒,南北省内部到边远可能是5毫秒,在本地可能就是1毫秒级的就能够完成时延的布局,这样的时延的布局更重要的是网络技术能力提升了。”
王晓云指出,算力网络不是简单的基础设施,也不仅仅是建设的问题,是服务范式的变革,同时也是技术的变革。据王晓云透露,中国移动也在做算力并网的创新模式,完全并网后算力让全国任何一个地方的用户都触手可得,赋能数字经济。
企业锚向智算
应用方面算力资源还待开发
智能算力的高速增长,正在改变算力产业的发展格局。有企业方指出,大模型正在催生更多的AI算力需求,进入“智算”时代。
在本届算力大会上,红星资本局注意到,多家业内巨头也明确锚向智算领域。
“我们认为,包括智算场景在内的算力的应用是未来云计算业务增长的一个新的热点。”腾讯云副总裁沈可表示,腾讯云在底层构建了高性能的计算集群、高性能的网络以及向量的数据库,已经能够让万亿级别参数的大模型训练时间压缩到4天。
“从未来预测来看,智能算力的增长到2023年可能将达近500倍,因此加快发展人工智能计算中心的基础设施建设,进一步夯实智能算力底座,激发AI算力赋能效力,是推动算力产业高质量发展的必由之路。”华为技术有限公司董事长梁华表示,目前华为昇腾算力集群已经在华为云以及中国28个城市的AI智能算力中心大规模商业部署,同时华为云在“东数西算”的枢纽节点——贵州、内蒙建设了昇腾算力云中心,可以随时支持国内高校、关键基础设施行业以及企业客户对AI算力的需求。
智能算力规模具备后,企业方更关注应用和需求在哪儿。前述刘韵洁接受采访时也提到,我们面临“有些算力不足,有些算力过时”的问题,在应用方面算力资源还没有充分发挥出来。
麦肯锡数据显示,商用和企业数据中心的服务器很少超过6%的利用率,高达30%的服务器处于“昏睡”状态,一直在耗费电力但没有提供有用的信息服务。
“大量算力被制造出来了,但是只有6%-12%的利用率。我们一方面极缺算力,另一方面利用率又不是很高,这就是一个关键的矛盾。”蚂蚁集团副总裁、平台技术事业群总裁何征宇说。
通用算力能否迭代成智能算力以解决利用率问题?何征宇给出的回答是,不太可行。
他对红星资本局解释,智能算力的核心部件是GPU,占据智算80%以上的成本。这也意味着普通算力迭代成智能算力会比较难,瓶颈不在于机架本身,而是能源消耗。智能算力机器比普通算力的供电要求是翻倍的,而换GPU的成本几乎与新建设施相差不多。
“算力产业虽然是基础设施工作,但一定要靠应用来‘点爆’它。”何征宇表示,拉动产业发展最终还是要回归到“应用”这个核心。他也呼吁,行业应多关注算力应用环节的创新,以软硬件协同视角建设高质量软件核心能力,实现计算效率最大化。
红星新闻记者 王田
编辑 余冬梅