算力:数字经济的新引擎
上QQ阅读APP看书,第一时间看更新

1.1
算力基础

所谓算力,简单来讲就是计算能力,具体指的是数据的处理能力。算力的大小代表着对数字化信息处理能力的强弱。算力源于芯片,通过基础软硬件的有效组织,最终释放到终端应用上,比如手机、计算机、超级计算机、自动驾驶汽车等各种硬件设备中。没有算力,智能硬件就无法正常使用。

从原始社会的手动式计算,到古代的机械式计算、近现代的电子计算,再到现在的数字计算,这些都是算力。只是在不同的技术水平下,算力的强弱存在天壤之别,在一定程度上代表了当时的技术水平,以及人类智慧的发展水平。

在计算机中,CPU(中央处理器)就提供了算力,帮助计算机快速运行。玩游戏的时候,需要显卡提供算力;绘制图表的时候,需要算力驱动计算机快速处理图形。不同产品配置的CPU、显卡、内存等都有区别,高配置的计算机拥有更高的算力,能够运行3D类、影音类、视频制作、游戏等要求更高的软件。低配置的计算机算力不够,一般只能上网、运行办公软件等。

以智能手机为例,算力不够,就可能卡顿,而高配置的手机因搭载了高性能的CPU、更大的内存等,则拥有更强的算力,用起来更顺畅。

在人工智能的应用中,同样需要有类似CPU和GPU(图形处理器)的硬件来提供算力,其基本原理在于人工智能里的机器学习要从海量杂乱无章的数据里找到背后的规律,涉及数据收集、算法设计、算法实现、算法训练、算法验证和算法应用,通过大量的数据完成算法的训练,这就需要高性能算力提供支持,快速运算出结果。

算力的计算单位是Flops(Floating-point operations per second),它表示每秒所执行的浮点运算次数。具体使用时,Flops前面还会有一个字母常量,如TFlops、PFlops。其中字母T、P代表次数,T代表每秒一万亿次,P代表每秒一千万亿次。

除了运算次数,衡量算力水平时还要看算力精度,根据数据精度的不同,可把算力分为双精度算力(64位,FP64)、单精度算力(32位,FP32)、半精度算力(16位,FP16)及整型算力(INT8、INT4)。位数越高,则意味着精度越高,能够支持的运算复杂程度就越高,适配的应用场景也就越广泛。

不同算力中心提供的算力其精度可能不同,比如1000Flops的AI计算中心所提供的算力,与1000Flops超级计算机提供的算力相比,虽然算力数值相同,但精度不同,实际算力水平并不一样。

借助专用的测试程序,可以测算不同精度算力的性能,比如用于测试超级计算机性能的Linpack测试,专注于双精度算力;用于衡量智能计算机性能的ResNet-50,则专注于半精度算力。

按照使用主体及级别,算力可分为:个人算力、企业算力、超级算力与AI算力。

1.个人算力:一般情况下,个人算力指的就是PC,它包括台式计算机、笔记本电脑、平板电脑、超极本、智能手机等。通过计算机或智能手机实施的上网、玩游戏等任何操作,都会被转化成二进制数,暂存于计算机的存储器中,再经由CPU解译为指令,然后被调入运算器中进行计算,最后通过输出设备将结果输出。

由于个人计算机一般只安装一个CPU,所以它的性能有限。如果数据量很大,计算量很大,个人计算机的算力难以支撑,无法完成任务,就需要采用更强的计算工具与计算方式。

2.企业算力:当面对上百、上千,甚至上万人同时进行某项操作,并要在同一时间给出计算结果时,个人计算机满足不了这么大的算力需求,只能由服务器来解决。

服务器与个人计算机的主要区别在于,个人计算机一般就一个人使用,而服务器对外提供服务,可以很多人一起使用,而且能够并行处理多人请求,再者,服务器会安装很多个CPU,甚至是集群性质的。它每天24小时工作,全年无休。

但这个请求数量也不是没有上限的,有的服务器一次只能处理100万个请求,那么当第1000001个请求发出的时候,服务器就会卡顿,甚至崩溃。

如何给服务器解压?办法就是依靠数据中心、云计算。数据中心里部署了大量服务器,提供非常强大的算力。例如,阿里巴巴、谷歌、亚马逊等公司,每年都会投入数百亿元建设数据中心,里面会存放数万台计算机。在超大规模的数据中心里,一般拥有5万~10万台服务器。数据中心扮演连接器的角色,可以把算力供给端和需求端连接到一起。

云计算又是如何发挥作用的呢?它是把计算资源放到网络里,然后将网络里的计算机虚拟成一台“超级计算机”,人们可以通过各种终端,享受到云计算提供的计算服务。云计算能够按照用户的需求匹配计算资源,还可以让用户大量使用非本地的计算资源,实现“算力共享”。

云计算也是有瓶颈的,有些项目对计算性能提出了超高要求,那就得借助超级算力,即超级计算机。

3.超级算力:道路上,信号灯可以实时调节等候时间,疏导人车流量;当患者坐在眼底筛查一体机前,深度学习算法自动提取眼底生理结构,评估病变风险;智慧政务大厅里,通过服务机器人可以一站式办理房产过户、公积金缴纳等,这些背后都有超级算力作为支撑。

超级算力来自超级计算机,通常用于需要大量运算的领域,比如天气预报、天体物理模拟、航空航天、科研、石油石化、CAE仿真计算、生命科学、人工智能等,对数据精度要求高,通常超级计算机系统以双精度数值计算为主,为高精尖科学领域提供极致算力的服务。中国目前的“神威·太湖之光”超级计算机,可以在30天内完成未来100年的地球气候模拟。

超级计算机是指能够处理个人计算机无法处理的大量资料,并进行高速运算的计算机。它与普通计算机的构成组件基本相同,但在性能和规模上存在差异。超级计算机具备极大的数据存储容量和极快的数据处理速度,并配有多种外围设备,以及丰富的、高性能的软件系统。

根据处理器的不同,可以把超级计算机分为两类,包括采用专用处理器和采用标准兼容处理器,前者可以高效地处理同一类型的问题,而后者可一机多用,使用比较灵活,范围比较广泛。

以前,超级计算机的运算速度平均每秒在1000万次以上,而现在的超级计算机已进入E级时代,准入门槛也变成了运算速度每秒百亿亿次。

从超算细分市场来看,超算可以分为尖端超算、通用超算和行业超算3类。

尖端超算作为“塔尖上的明珠”,是万核以上的应用,追求极大规模、极致性能,面向攻坚型科研、国家级客户及各行各业顶级研究机构,对超级计算机的硬件系统要求极高。我国重点研发的E级超级计算机,是每秒可进行百亿亿次浮点运算的超级计算机。

通用超算是万核以下的应用,绝大多数是千核以下的应用,针对不同类型的应用,需要提供优质服务,以及更高性价比的资源,还需要满足海量无自建超级计算机用户的日常计算需求。

行业超算是面向行业、按照行业的业务需求设计完整的云上业务流程,往往是单核到几千核应用。这类客户最关注服务,其次是性能和性价比。我国的行业超算集中在能源、电信、工业制造、互联网等领域。

目前,超算已经成为一个国家综合国力的象征,而中国在这一领域已经实现了全球领先。2021年6月,新一期全球超级计算机500强榜单发布,中国共有186台超级计算机上榜。美国以123台位列第二,其后依次是日本、德国、法国。全球超级计算机500强榜单由国际组织“TOP500”编制,约每半年发布一次,是给全球已安装的超级计算机排座次的知名榜单。

中国国家并行计算机工程技术研究中心研制的“神威·太湖之光”超级计算机,由SW26010处理器提供动力。2016年6月在中国无锡国家超级计算中心安装,HPL性能为93 PFlops。

国防科技大学研制的“天河二号”采用Intel至强CPU和定制的Matrix-2000协处理器的混合架构,HPL性能为61.4 PFlops,目前部署在广州的国家超级计算中心。

2021年的排名中,中国超级计算机的数量虽然下降至186台(2020年为212台),但对比美国的123台,依然处于领先位置。不过美国的超级算力更强,综合性能为856.8 PFlops,而中国超级算力为445.3 PFlops。

早在2016年,“神舟十一号”飞船和“天宫二号”进行交会对接,这对飞船和航天器的模拟精准度要求极高,联想为中国载人航天工程总体仿真实验室提供了一套以联想高性能计算系统和ThinkStation图形工作站为核心的仿真系统,在轨道计算、模拟仿真、航天器设计等关键环节承担了大量计算工作。

在2020年抗击新冠肺炎疫情的过程中,各国超级计算机也都倾尽全力。中国“天河二号”超级计算机协助搭建起“15秒断诊”的新冠肺炎CT影像智能诊断平台,并助力筛选能抑制病毒的小分子药物。美国Summit超级计算机同样参与到新药的研制中,模拟新冠病毒与不同化合物的反应。

4.AI算力:近年来,AI(人工智能)快速发展,为匹配AI训练与推理的需求,AI算力系统应运而生,大多用于语音、图片或视频的处理。AI计算擅长推理或训练,但多数不具备高精度数值计算能力。浮点计算下的低精度计算,甚至整型计算,都能满足相应需求。

AI发展已进入与行业深度融合的阶段,AI计算能力反映了一个国家前沿的计算能力。AI计算的占比正逐年提高,从选取的样本国家来看,AI计算占整体计算市场的比例从2015年的7%增加到2019年的12%,预计到2024年将达到23%。

中国和美国是AI算力支出占总算力支出最高的两个国家,占比均超过10%;尤其是中国,以14.1%的占比领跑所有样本国家。这说明中国在战略层面对人工智能的重视,及企业希望以人工智能为发展契机提升核心竞争力的迫切愿望。

IDC的调研发现,超过90%的企业正在使用或计划在3年内使用人工智能,其中74.5%的企业期望在未来可以采用具备公用设施意义的人工智能专用基础设施平台。

企业对AI算力基础设施平台的需求主要包括:用于人工智能训练的数据支撑、人工智能加速计算能力、规模效应下的价格和成本因素,以及丰富的应用场景配置等。

OpenAI测算,自2012年以来,在最大规模的人工智能训练中所使用的计算量呈指数级增长,大概3.43个月的时间翻一倍。而到了2020年左右,人工智能所需算力每两个月就翻一倍,承载AI的新型算力基础设施的供给水平,将直接影响AI创新迭代及产业AI应用。基于大数据和深度学习的人工智能技术,高度依赖于系统的数据处理与学习能力,因此,硬件的计算能力成为继数据、算力之后,另一个影响人工智能发展的关键因素。

超级算力与AI算力比较:超级算力与智能计算的算力精度存在差异,衡量超算采用的是双精度浮点运算能力(64位),而智能计算的衡量精度则是单精度(32位)、半精度(16位)及整型运算(INT8、INT4)。超级计算机的双精度算力可看作重型卡车,是一种通用算力,可以承担各种计算任务;而低精度算力可看作小型货车,是一种专用算力,专门为AI的训练和推理设计的,由于自身性能的限制,无法承担超级计算机的计算任务。

在特定的场景下,算力还有其他意思,比如它是描述对比特币区块做哈希运算的能力,也就是指比特币挖矿机产出比特币的能力,是矿机每秒产生哈希(Hash)碰撞的能力,用来衡量挖矿机器的计算及网络处理能力。某台计算机的算力占全网算力的比例越高,产出的比特币就越多。

计算哈希值进而获得比特币的做法,通常称为“挖矿”,市场上出现了专门用来挖比特币的“矿机”,有些人大规模购进“矿机”形成“矿场”。挖矿是一个计算的过程,矿工需要计算这个新区块的区块头的哈希值。在有关比特币算力的计算中,经常会看到EH/s、PH/s、TH/s等单位,其中H/s代表矿机一秒钟可以做多少次哈希运算。

具体来讲,就是在通过“挖矿”得到比特币的过程中,我们需要找到它相应的解,而对于任何一个64位的哈希值,要找到解,都没有固定的算法,只能靠计算机随机的Hash碰撞,而一个挖矿机每秒钟能做多少次Hash碰撞,就是其算力的代表,单位写成Hash/s,简写为H/s,这就是所谓工作量证明机制POW(Proof of Work)。

EH/s、PH/s、TH/s等都代表比特币算力的单位。

1KH/s=每秒1000次哈希。

1MH/s=每秒100万次哈希。

1GH/s=每秒10亿次哈希。

1TH/s=每秒1万亿次哈希。

1PH/s=每秒1000万亿次哈希。

1EH/s=1000PH/s.

如果看到网络达到10TH/s的算力时,则意味着它每秒能够进行10万亿次计算。

近两年,比特币全网算力进入P算力时代(1P=1024T,1T=1024G,1G=1024M,1M=1024K),在不断飙升的算力环境中,P时代的到来意味着比特币进入新的军备竞赛阶段。

随着矿机技术的快速进步,各大厂商都在推出高算力、低功耗的矿机产品,2018年7月底,阿瓦隆推出搭载了7nm芯片的A921矿机。8月,蚂蚁矿机发布了S9 Hydro水冷矿机,随后的9月,神马矿机发布了搭载16nm芯片的M10矿机。

到2020年,中国两大矿机制造商亿邦国际(Ebang Communications)与嘉楠科技(Canan Inc.)都推出了新型ASIC挖矿设备。其中,嘉楠科技发布了新型设备AvalonLiner 1146 Pro(63TH/s),功耗约为3276瓦;亿邦国际发布了E12+(50TH/s),功耗约为2500瓦。比特币矿商巨头Bitmain推出一款ASIC新一代矿机Antminer 19系列,可以产生84 TH/s(±3%)的哈希率,功率效率为37.5 J/TH(±5%)。大量新型的矿机问世并投入运行,支撑着矿场的庞大算力。

不过,国内正在打击比特币交易炒作,这种挖矿行为耗能较高,给能源供给造成压力。据彭博社的消息,四川迎来大面积矿机集体断电,四川省发展和改革委员会、四川省能源局发文通知,对于虚拟货币“挖矿”项目,在川相关电力企业需要在2021年6月20日前完成甄别清理关停工作。

随后,比特币全网算力隔夜骤降,并引发市场信心大降。比特币跌至30000美元,处于自2021年5月大跌以来的低谷。2021年6月,BTC.com数据显示,比特币全网平均算力为126.83EH/s,相比历史最高点197.61EH/s,已经跌去近36%。

在挖以太坊(ETH)等虚拟货币方面,算力同样是重要的驱动力。目前挖以太坊的矿机有显卡矿机和芯片矿机。显卡矿机就是购买显卡组装成一台多显卡的矿机,一般6片、8片显卡组成一台矿机。芯片矿机是专门针对以太坊设计出来的矿机,不用自己调试,直接插上电源接上网线,然后配置矿机就可以挖。

目前,以太坊挖矿主流机器还是显卡矿机,主要硬件包含显卡、主板、电源、CPU、内存、硬盘等。比如英伟达(NVIDIA)的RTX系列显卡,除用于游戏外,还被广泛用于深度学习、基因测序、天气模拟、“挖矿”等,很多人都用它来挖以太币。挖币网数据显示,以太坊挖矿算力第一的是RTX 3090显卡,且多款不同型号的RTX显卡算力位居前列。比特大陆公布了专用于以太坊的矿机Antminer E9,它的ETH哈希率可达3GH/s,相当于32张NVIDIA RTX 3080显卡。