时间:2024-07-11
米乐m6平台官方版米乐m6平台官方版我国算力基础设施建设的现状和前景如何?未来发展面临怎样的机遇和挑战?产业链上下游如何协同发展?面对高昂电力成本如何降低功耗……
近日,《沪市汇·硬科硬客》第八期节目“筑基算力底座”正式上线。海光信息、芯原股份、佰维存储、概伦电子等4家科创板算力供给侧龙头会师,以专业的思考和企业发展经验直面行业高热话题,为算力基础设施建设高质量发展探明路径。
工信部数据显示,截至2023年底,全国在用数据中心机架总规模超过810万标准机架,算力总规模达到230 EFLOPS,居全球第二位。
2023年10月,工信部等六部门印发了《算力基础设施高质量发展行动计划》,对我国的算力、运载力、存力建设和应用赋能作出了目标指引。计算力方面,到2025年,算力规模超过300 EFLOPS,智能算力占比达到35%。
“2023年是人工智能发展的重要转折年,也是全球算力规模和服务的爆发年,大模型和生成式人工智能领域的技术及场景突破也推动了算力产业格局的变革。从算力类型上看,通用算力、智能算力和超算算力越来越呈现出融合趋势,未来,超智融合的通用算力将成为市场的主要需求。”沙超群表示。
谈及全球算力市场的格局,汪洋认为,2024年呈现出显著的区域性差异和技术驱动的多样化发展趋势。
何瀚对我国算力产业的发展充满信心,认为我国的算力建设正处于一个蓄势待发的阶段,即将迎来一个蓬勃发展的新。
“算力产业链企业既要有信心,又要有决心,大家一起推动国家的算力战略发展。”杨廉峰强调,算力既是市场发展需求,也是国家战略。
综合五位嘉宾观点,我国算力规模能够加速增长,得益于政策引导、技术创新、产业应用和基础设施建设等多方面因素的合力推动。
政策层面,包括东数西算、《算力基础设施高质量发展行动计划》等一系列利好政策出台,明确了发展目标和重点任务,推动算力基础设施的高质量发展。
技术层面,随着人工智能、大数据等技术的发展,对算力的需求不断增加,促进了算力技术的创新和提升。
产业层面,各行各业数字化转型的推进,特别是在政务、工业、交通、医疗等领域,对算力的需求不断增长。
基础设施层面,国家东数西算节点和各地数据中心、智能计算中心、先进计算中心等算力基础设施的建设和升级,为算力规模的增长提供了物理基础。
市场需求层面,我国人工智能技术正加速迈入全面应用时代,大模型和生成式人工智能正对各行各业深入赋能,这催生了巨大的算力需求,推动算力规模的快速增长。
四家公司都非常重视生态建设,海光信息建立了海光产业生态合作组织(以下简称“光合组织”),芯原股份组织了青城山论坛和滴水湖论坛等,概伦电子与MPI、罗德与施瓦茨联合主办“共建半导体测试生态圈”半导体电性测试用户大会,佰维存储的英文名BIWIN其中一层含义便是与上下游合作伙伴共赢。
“‘独行快,众行远’,国产芯片和算力发展离不开开放协同的产业链。”沙超群表示,海光信息在生态建设上投入了巨大精力和人力物力,目的是联合生态伙伴,共同打造一个开放共赢的从国产高端芯片设计到应用服务的全产业链。
据沙超群介绍,目前光合组织有3000余家合作伙伴,海光信息与生态合作伙伴是互信平等、互惠共赢的关系,对合作伙伴秉承开放态度。
汪洋同样肯定了产业链上下游协同发展对于整个半导体行业的重要性。他认为,产业链上下游协同发展有助于优化资源配置,降低生产成本,提高整个产业链的效率和竞争力。
“通过协同,一方面上下游企业可以共享资源,包括技术、信息、市场渠道等,有助于降低研发和生产成本,加速产品创新;另一方面也可以促进知识和技术的交流,推动整个行业的创新。”汪洋表示。
芯原股份更加看重合作伙伴的技术能力和持续创新的精神、市场声誉、战略一致性、双方发展战略一致、稳定性和可靠性、响应速度等方面的特质。
何瀚介绍,佰维存储不仅积极参与构建存储行业的国产生态系统,还发起成立了深圳市存储器行业协会,以此为平台,促进工控、车规级存储、服务器存储等相关领域的交流与合作,通过组织论坛、对接会等形式,汇聚行业力量,推动多方资源整合。
与此同时,何瀚也表示,存储行业固有的波动性致使产业链各环节高度集中,彼此间的信任与合作需经历长期多周期的考验,共同应对行业起伏。佰维存储更看重合作伙伴技术互补与创新、供应链稳定性与质量控制、市场协同与品牌影响力等多方面的能力。
“集成电路产业从九十年代代工厂的商业模式开始,上下游产业链形成了高度协同的全球化生态,EDA是其中主要的支撑环节之一。”杨廉峰认为,从算力背后的产业链看,仅仅靠芯片的算力提升是不足以满足AI的处理需求的。
“英伟达CEO黄仁勋曾表示,在未来的10年里,英伟达将会把深度学习的计算能力再提高100万倍。这100万倍从哪里来呢?一定是需要系统、互联、架构和算法的创新,结合模型的不断演进去实现,这些都是通过产业链协作才可能实现的。”杨廉峰如是表示。
算力供给侧的芯片半导体领域作为技术密集型和人才密集型产业,发展特征多为投入大、周期长、回报慢。企业是如何推动从实验室到市场端的进程的呢?
2023年,海光信息研发投入28.1亿元,占营业收入的比例超过40%,研发技术人员占员工总人数的92%,近八成拥有硕士及以上学历。在研发驱动下,海光双芯已经广泛应用于电信、金融、互联网等多个行业的数据中心,以及大数据处理、人工智能、商业计算等领域。
沙超群表示,海光信息两个方面的优势推动其从实验室到市场端的进程。其一,海光信息秉承“销售一代、验证一代、研发一代”的产品研发策略,产品的推出有着合理的规划和市场节奏。
其二,海光信息在生态合作伙伴上有着很强的优势,“光合组织”中有3000余家生态伙伴互相赋能,这也帮助海光信息更顺利、高效地将产品推向市场。
芯原股份的技术投入也取得了不错的成绩。根据IPnest数据,2022年,芯原半导体IP授权业务市场占有率位列中国第一、全球第七;2022年,芯原的知识产权授权使用费收入排名全球第五。根据IPnest的IP分类和各企业公开信息,芯原IP种类在全球排名前十的IP企业中排名前二。
值得注意的是,按照2023年的营收计算,芯原股份67%的营收来自于一站式芯片定务业务,33%来自于半导体IP授权服务业务。
“通过两个业务的协同效应,两条腿走路比单纯走IP授权或走设计服务来说,更为稳健,也更具核心竞争力。”汪洋分享了芯原股份打造高竞争壁垒,形成技术护城河的战略。
2023年,佰维存储在IC设计、先进封测、芯片测试设备研发等核心技术研发上取得突破性进展。在研发和技术实力加持下,该公司2024年第一季度实现营收17.27亿元,同比增长305.8%,实现归母净利润1.68亿元,同比增长232.97%,创上市以来历史新高。
关于佰维存储推进从实验室到市场端的优势,何瀚认为在于两点核心策略的践行。其一,佰维存储自带市场化基因,会在整个产业链的每个阶段做力所能及的事情确保盈利与现金流的稳健,累积的资源被持续投入到基础能力建设中,一步步实现产业的提升和升级,形成了自我强化的良性循环;其二,佰维存储致力于打造差异化竞争力,率先构建了研发封测一体化的经营模式,在2010年就建造了自己的封测厂。
概伦电子近年来也持续投入大额研发,2023年全年研发投入占营业收入的比例超过72%,高比例的研发投入也为该公司的高速发展注入了增长动力,该公司近3年的营业收入复合增长率超过40%。
“围绕工艺与设计协同优化进行技术和产品的战略布局,公司持续对核心技术进行研发、演进和拓展,在器件建模和电路仿真两个领域的技术上已率先取得突破,产品进入多家国际领先的集成电路设计及制造企业,并持续布局其他关键的核心EDA技术攻关和产品研发。”据杨廉峰介绍,核心技术的创新研发和成果转化是公司持续保持国际竞争力的关键基础和驱动。
中国信通院数据显示,数据中心的电力成本占其运营总成本的60%-70%。随着算力基础设施规模的不断增长,以及人工智能等更高算力密度需求技术的普及,算力基础设施自身的能耗也将带来不小的挑战。
蒯剑表示,整个产业链都在为节能减排做出贡献,各公司一方面提升算力,另一方面也在充分考虑功耗的问题。
其一是CPU和DCU芯片本身,海光信息有系列低功耗设计技术,同时对不同应用场景有复杂的功耗管理;其二是提升服务器的效率,海光信息与系统厂商一起优化软件,提升负载效率,来降低功耗;其三是降低PUE(数据中心消耗的所有能源与IT负载消耗的能源的比值)的数值,海光信息最先进的浸没式冷却可以把PUE降至1.04,从而将整个数据中心的功耗降低27%左右。
“对数据中心和算力基础设施来说,电力成本占比很高,一定不能抛开能耗去讲算力。”汪洋表示,芯原股份的高性能低功耗技术已在数据中心、服务器领域得以广泛应用。
据汪洋介绍,芯原股份第一代视频转码加速解决方案可实现转码能力是传统高端CPU的6倍,功耗仅为其1/13,且芯片面积非常小,可以帮助云服务提供商大幅降低服务器的用电量和占地空间;第二代产品在功耗和性能方面有更大幅度的优化;在此基础上,芯原股份还为国际领先的芯片企业定制了面向数据中心领域的5nm媒体加速卡芯片,现已进入量产阶段。
“第一在主控层面,首先是架构,我们有多级的休眠和多级的时钟,去做低功耗设计;第二在工艺上,我们尽量去选择一些低功耗的库;第三在算法上,我们通过提升LDPC纠错能力,减少搬移次数,也能够降低能耗。”何瀚分享了佰维存储降低功耗的三个方法。
随着大模型参数量的增长,AI运算集群的规模越来越大,英伟达近日宣称明后年分别推出Blackwell Ultra和Rubin GPU,对应的以太网网络平台分别为Spectrum-X800和X1600,可以组建高达数十万和百万张卡规模的集群。
沙超群认为,超大规模集群的建设正在提速,对处理器、存储和网络技术都提出了更高的要求,与此同时也带来了技术创新和产品升级的机会。
“芯片设计厂商、整机厂商、软件团队、应用方……大家要一起优化,一起提升,打造出一套易用、好用、可靠的系统,才能够应对未来万亿以上参数的大模型。”沙超群强调。
从集群发展的行业趋势来看,面对未来的挑战,汪洋表示,这其中每一个环节都不容易做好,但是有机会做好,需要谨慎乐观,步步为营。
“在追赶的时候,我们还要找出一些自己的特殊优势来拔高,这样可以加快追赶的步伐。在这个过程中,我们要考虑的不仅是IP,还要考虑芯片设计时的诸多细节问题。比如芯片面积大小、算力、内存方式、封装的形式,还有级联的方式、驱动的方式、多卡之后互联的选择,同时需要考虑能耗、系统级的设计等等。”汪洋指出。
在存储和封装领域,何瀚认为,在万卡集群甚至更大的计算集群构建之后,首先,内存的调度会面临很大的瓶颈,而产业解决这一问题的思路是做内存的池化。
“英特尔推出CXL协议也是为内存的池化做准备,CXL目前到了2.0的产业推广阶段,可能到3.0就是一个爆发期,会很快适应万卡集群建设的大趋势。所以我们也在CXL领域积极投入,在2.0这一代,我们现在做的是解决方案和模组,到了3.0我们会去探讨是不是要介入到主控的设计和整个软硬件的生态中去。”何瀚表示。
此外,何瀚认为,第二个挑战的互联,在网卡、计算卡增多之后会出现互联,互联有不同的层级去解决,去提升效率。
“人工智能和大模型未来可能会给芯片行业带来一些机会,可能会使得芯片的设计和制造有一些新的可能性。”杨廉峰认为,EDA或是这些可能性落地的一个承载体。
“EDA工具的研发本身就是运用大量算法优化、通过已有数据的学习和识别生成相关内容的过程,应该说EDA是运用AI技术相对较早的领域。”杨廉峰表示,概伦电子也在做一些人工智能领域的探索。