人工智能产业发展催生算力需求扩张,哪种算力中心更适合?

导语:在数字经济、互联网经济快速发展带动下,全球算力中心发展进入新一轮大规模扩张期。加快算力中心等数字基础设施建设,不仅能够对冲疫情对经济的负面影响,更长远来看,将为中国经济转型升级打下坚实基础。


不过,在算力中心的类型选择上,也需要与时俱进,厘清概念,按需选择,需要新的思路和新的做法。


不同算力中心各有千秋


从算力中心的发展现状和趋势来看,中国科学技术信息研究所发布的《人工智能算力中心发展白皮书》显示,超级算力中心(高性能算力中心)、云计算数据中心和人工智能算力中心是目前主流的三种算力中心。


上世纪60年代开始,为了对重大军事研究和科学问题进行计算模拟,超级计算机和超级算力中心诞生。目前,在一些依赖大量内存进行计算,或需要较高的串行计算效率时,超算是更好的选择。2000年互联网产业兴起和2007年大数据、云计算技术的兴起,带动了云计算数据中心的建设。云计算数据中心面向个人或企业提供包括虚拟机计算能力、数据储存和网络传输宽带等能力,以支撑从电子商务到电子政务等方面的云服务。2012年以来,以深度学习为代表的新一代人工智能技术得到快速突破和应用,并逐渐成为重要的算力资源需求之一。人工智能算力中心应运而生,能够提供人工智能计算范式所需的专用算力,为计算基础设施带来了新的建设方式。


实际上,在建设目的、技术标准、具体功能、应用领域和“投—建—运”模式等方面,三类算力中心的区别还是不小的。那么,在区域或者企业规划建设算力中心时,具体应该如何选择呢?


建设算力中心要厘清力概念


“现在人工智能火爆,有些人就说智算中心会取代传统的超算中心,这是错误的。”中国科学院数学与系统科学研究院研究员张林波表示,“不管是超算中心,还是智能算力中心,应该各自发挥各自的特长,做自己适合的事情。”


有人喜欢拿智算中心和超算中心的算力作比较,但实际上,两者是完全不同的度量单位。虽然都以“P”来作为算力单位,但超算的算力单位是“FLOPS”——每秒浮点运算能力,而一些智能计算的单位是“OPS”——每秒操作次数,两者完全是不同的单位度量。同时两者在算力精度有很大差别,超算为双精度浮点运算,智能计算的算力精度多为对精度要求较低的单精度和半精度。在中国科学院半导体研究所研究员李卫军看来,如果单纯拿一个算力的指标去衡量比较,对于超算来讲是不公平的,因为超算的优势是计算精度更高。


对于这个问题,中国科学院计算技术研究所研究员张云泉表示:“超算中心主要是做科学计算和数字仿真,现在也在往多元化发展,也支持云计算和AI,它的优势是精度高,能完成智算中心无法完成的工作。”


所以说,规划建设算力中心,首先要明确自己的算力需求,让算力中心建设有的放矢。若大多是对算力精度要求较高的场景,就需要建超算中心;若应用场景对算力精度要求较低,则可以考虑建人工智能算力中心。


建设算力中心要明确场景需求


厘清了算力需求之后,还要明确场景需求。


超级计算机是一种通用算力,更加擅长高精度计算,其设计目标是提供完备、复杂的计算能力,在高精度计算能力更强,应用范围更广,可胜任行星模拟、新材料开发、分子药物设计、基因分析等科学计算任务,以及能源、气象、工程仿真、生物基因、智慧城市、人工智能等领域。


而智能计算机是一种专用算力,它们擅长于推理或训练等智能计算,但由于AI推理或训练一般仅用到单精度甚至半精度计算、整型计算,多数智能计算机并不具备高精度数值计算能力,这也限制其在AI计算之外的应用场景使用。


由于精度上的限制,智能计算机专用算力强劲,比如在安防领域处理海量视频,在医疗领域进行影像诊疗,在交通领域实现智能管控和调度等,可以对单个场景实现较好的支持,但难以提供平台性的服务。


中国工程院院士陈左宁曾形象地比喻,使用超级计算做AI计算是“大马拉小车”。超级计算机虽然“十项全能”,但毕竟不是为AI量身打造,为了便宜行事,智能计算机才由此兴起。


同时,我们还需要注意的是,即使是人工智能算力中心,应用的推理、训练场景对于算力的要求也是不同的。作为面向社会全域多主体的新型公共基础设施,人工智能算力中心是侧重算力生产供应,还是数据开放共享,亦或是智慧生态建设,还是产业创新聚集,侧重不同功能,则需要的算力也是不一样的。


合适的才“算”好的


张云泉表示,不同的领域有不同的要求,适合当地应用的就是好的计算。他倡议,开放包容,通用融合,绿色低碳,自主安全,一个都不能少。


“用是唯一的目标!”清华大学教授陈文光也持有相同观点,“我非常支持算力与产业相互融合,相互支持,用计算机推进各行各业的发展。”


当前,算力中心仍然面临着能耗密度高、企业应用水平较低等问题,对于我国来说还面临着计算芯片及框架等核心技术受制于人的挑战。因此,在算力中心建设中,需要做好顶层设计、强化统筹推进,有效选择自主可控的技术路线,建立完善的运营机制,积极打造服务平台,促进新一代信息技术与传统产业深度融合,拉动区域经济转型与高质量发展。


中国科学技术信息研究所党委书记、科技部新一代人工智能发展研究中心主任赵志耘表示,我们不要盲目地重复建设和盲目地去抢占算力中心这样的基础资源,未来整体的全球经济可能不会迅速走出低谷,在财力有限的情况下,我们要聚集有限的资源和财力,打造支撑人工智能产业和生态发展的基础设施。


来源/瞭望周刊