图片 10

图片 1

图片 2

智东西(公众号:zhidxcom)文 | 心缘

英特尔公司是世界上最大的半导体公司,也是第一家推出x86架构处理器的公司,总部位于美国加利福尼亚州圣克拉拉。

自转向以数据为中心的全方位创新战略以来,英特尔正加速航行。作为重要棋子的FPGA,英特尔也加快了出新步伐。近日,英特尔宣布出货全新Stratix
10 DX
FPGA,而基于10nm工艺的Agilex系列已向参与早期使用计划的客户出货,明年将正式量产。“众所周知,数据已呈指数级增长,客户所寻求的是将这些数据货币化,希望可通过全新应用以及对现有应用提速来实现货币化的目的,而充分利用这些海量数据就需要异构方案。”英特尔公司网络和自定义逻辑事业部副总裁兼FPGA和电源产品营销总经理Patrick
Dorsey指出异构计算在数据时代的优势所在,“这种异构架构包含了CPU、GPU、AI芯片以及FPGA,只有综合性、针对性地解决具体问题,才能打造一个完整的解决方案。”

图片 3

英特尔公司在随着个人电脑普及,英特尔公司成为世界上最大设计和生产半导体的科技巨擘。为全球日益发展的计算机工业提供建筑模块,包括微处理器、芯片组、板卡、系统及软件等。这些产品为标准计算机架构的组成部分。业界利用这些产品为最终用户设计制造出先进的计算机。英特尔公司致力于在客户机、服务器、网络通讯、互联网解决方案和互联网服务方面为日益兴起的全球互联网经济提供建筑模块。

异构方案解决加速挑战

智东西4月3日消息,今日,英特尔正式发布Agilex
FPGA,这一全新FPGA产品与此前英特尔的Stratix系列大不相同,为实现超高敏捷性和灵活性做了大量创新。

近日,英特尔今天宣布出货全新英特尔 Stratix 10 DX FPGA
。这款新的FPGA支持英特尔超路径互连和PCI-Express Gen4
x16,同时还支持英特尔傲腾技术一个新控制器来提供灵活高性能加速。VMware是众多早期使用计划参与者之一。

而在异构平台中,FPGA绝对“不可或缺”。随着摩尔定律的放缓以及大数据、AI、5G、自动驾驶等的发展,对计算能力和带宽提出了前所未有的要求,同时新的算法新的框架层出不穷,要应对这一变化就需要灵活应变的FPGA。据预计到2022年,FPGA市场将达到75亿美元的规模,年复合成长率为9%。

英特尔可编程解决方案事业部首席产品营销官Patrick
Dorsey表示,这是首款提供广泛内存支持,且可无缝连接到英特尔至强可扩展处理器的内存一致性加速器,也是首款提供从100GB到1TB灵活性和敏捷性的FPGA。

英特尔公司网络和自定义逻辑事业部副总裁兼FPGA和电源产品事业部总经理David
Moore表示,英特尔Stratix 10 DX
FPGA拥有整合关键功能的率先设计,与英特尔数据中心解决方案产品组合一起使用时
,可显著提升云和企业中的负载加速。目前还没有其它FPGA能够为基于未来特定的英特尔至强可扩展处理器的服务器设计提供这样的功能组合。

而数据中心的两大指标需要“和衷共济”:即网络吞吐量必须提高,而时延必须降低。Patrick
Dorsey表示,随着服务器需要更高效的计算以处理AI等相关负载,包括FPGA、GPU等在内的硬件加速器被广泛使用,但其有效性能在很大程度上取决于CPU、可用系统内存和加速器之间的通信带宽和延迟。

英特尔Agilex
FPGA家族分为通用型的F系列、适用于高性能处理器接口和大带宽应用的I系列和适用于计算密集型应用的M系列。其软件已能使用,首款设备将于今年9月上市。

主要功能:Stratix 10 DX
FPGA的新接口标准1包括可支持傲腾数据中心级持久内存双列直插式存储模块的选项,可显著提高带宽,并为即将推出的特定的英特尔至强可扩展处理器提供一致性的内存扩展和硬件加速。

于是乎,在4年前英特尔将Altera纳入囊中之后,可打造“全能异构平台”的英特尔继宣布在中国重庆成立全球最大的FPGA中国创新中心以来,又重磅宣布FPGA组合家族当中的一个全新产品Stratix
10 DX,借力至强处理器Xeon+Stratix 10 DX的“组合拳”应对加速挑战。

图片 4

重要意义:当运行网络和云应用的服务器系统需要更高的计算速度时,比如处理人工智能训练/推理或数据库相关的工作负载,数据中心客户越来越多地使用包括FPGA在内的硬件加速器。硬件加速器的有效性能在很大程度上取决于一个或多个服务器CPU、可用系统内存和任何附加加速器之间的通信带宽和延迟。

Xeon+FPGA组合带来高内存扩展能力

总体来看,英特尔Agilex FPGA包含如下特性:

通过将某些任务转移到加速器,更多的CPU核心可以用来处理其它优先级更高的工作负载,从而提高数据中心操作人员的效率。英特尔基于FPGA的加速器在提供硬件辅助性能的同时,具有适应多种负载的灵活性。

对于这一全新组合,Patrick
Dorsey分析其最大优势在于低时延、高带宽以及内存扩展能力。Stratix 10
DX不仅是英特尔首个支持PCIe
Gen4的FPGA,同时通过与至强处理器采取超路径互连UPI,从而带来了关键价值即可快速扩展内存,如可支持8个独立的傲腾DC持久内存控制器,总容量可到4TB。

1、首款集英特尔各创新技术于一体的FPGA:10nm制程工艺、3D集成、英特尔至强可扩展处理器,具有内存一致性、112G
XCVR、PCIe Gen5、eASIC设备、One API、英特尔Optane DC Persistent
Memory支持。

独特之处:与之前的FPGA型号相比,英特尔认为Stratix 10 DX
FPGA提供了新功能和接口特性,其中包括:1.
与特定的英特尔至强可扩展处理器组合,UPI接口可将延迟降低37%
2,并通过一致的数据移动和28GB/秒的理论峰值传输速率而提高整个系统的性能3。我们预计将在2021年提供超高速协议,具有内存一致性的FPGA接口是英特尔路线图的一部分。2.符合PCI-SIG标准的Gen4
x16接口提供32GB/秒的理论峰值数据带宽。数据中心和非数据中心应用的吞吐量大约将提高1倍以上4。

Patrick
Dorsey解释说,内存无论是DDR还是傲腾,通过在至强处理器与FPGA之间共享存储,在共享过程中就不用进行数据迁移或拷贝,因数据迁移和拷贝会带来高成本,同时也会降低系统的性能。从新的内存金字塔层级来看,不同类型的内存包括存储、持久性内存以及标准化内存,Stratix
10 DX则可提高塔尖高层级内存性能,如傲腾和DRAM。

2、任意集成使得FPGA能根据具体应用进行优化和定制,实现更高程度的灵活性和敏捷性。

  1. 内存控制器支持每个FPGA最多 8个英特尔傲腾数据中心级持久内存模块。

  2. Stratix 10
    FPGA的其他现有功能还包括:100GB/秒的以太网,HBM2内存堆栈和带外设的四核ARM
    Cortex-A53处理器子系统。英特尔不仅在微处理器方面表现优秀,而且在显示方面占有60%的市场占有率,如GMA900集成显卡、GMA950集成显卡、GMA3000集成显卡系列,在低端电脑中更是常见。目前还有核芯显卡和锐炬显卡

针对不同应用性能的优化,Patrick
Dorsey列出了具体数字:在边缘计算应用中,Stratix 10
DX在拥有UPI之后,比仅使用PCIe的响应速度快37%。而在网络应用中,因支持PCIe
Gen4,带宽比前一代PCIe
Gen3扩大了两倍,使得数据处理更为快速,同时也拥有以太网功能。而在数据中心方面,通过英特尔的异构即Xeon+FPGA计算,加之PCIe
Gen4与UPI的互联,总带宽可提升2.6倍。

3、适用于边缘计算、嵌入式、网络和数据中心等革命性应用。

虽然英特尔已宣布退出5G基带业务,但仍专注于基础设施。对于正式商用的5G,Stratix
10 DX也大有可为。Patrick Dorsey介绍:“Stratix 10
DX可应用于5G基站,其好处体现在低时延,尤其是当5G走向数据中心、在vRAN方面应用时配合至强处理器,可进行诸多网络功能的加速。”

另外,Patrick
Dorsey还透露,Agilex将被应用于下一代的可编程加速卡,并且英特尔将在今年晚些时候向市场披露其FPGA产品路线图。

目前新款FPGA与至强处理器通过UPI互连,Patrick
Dorsey在谈及未来封装一体化问题提及,多样化的FPGA可使得客户进行灵活的配置和优化,集成封装还非必须。

一、英特尔自研技术的集大成者

下一代Agilex实现诸多创新

图片 5

而祭出的Stratix 10 DX
FPGA还只是一个发韧,对于FPGA英特尔的完整路线图已然浮出水面, Agilex
FPGA系列也已出货,明年量产。

作为面向数据领域的FPGA,Agilex有三大特点:处理、存储和移动。

据悉,英特尔Agilex
FPGA系列几乎集成了英特尔现阶段所有的技术和创新优势,包括架构、封装、工艺、开发工具以及通过eASIC技术实现降低功耗的快速方式。

在数据处理方面,Agilex采用英特尔10nm制程工艺和英特尔自研的第2代Hyperflex架构,与英特尔Stratix
10
FPGA相比,性能最高提升40%,能耗最高降低40%,采用FP16配置时DSP性能高达40
TFLOPS。

Patrick
Dorsey着重说,Agilex采用英特尔的10nm工艺,可对标业界的7nm水平。并且,Agilex将支持下一代UPI,即基于CXL的开放标准接口,同时还将支持第五代PCIe,其他创新还包括第二代HyperFlex架构、DSP创新等。他还强调,目前UPI只可搭配至强处理器使用,未来CXL将是公开的,可适配任何处理器。而从UPI过渡到CXL,只需对硬件接口和一些软件进行更新。最重要的是开发者已可使用UPI进行应用开发,客户也可向CLX进行无缝转移以及迭代。

在数据存储方面,Agilex既有传统的经典数据存储DDR5,也有高带宽存储HBM,并有Optane
DC Persistent memory支持。

放眼FPGA领域的两大巨头,在数字时代做出了殊途同归的选择,英特尔的异构平台显然是其重要筹码。Patrick
Dorsey最后指出,仅仅拥有四种架构是不够的,为保证客户能够充分利用异构的优势,英特尔一方面面向开发者提供产品路线图以及one-API统一应用开发接口等,另一方面针对端到端的硬件部署与客户展开密切合作。

另外,Agilex
FPGA通过计算快速链接和至强处理器之间建立起连接,使得它们之间足以建立一种非常紧密的内存一致性,可以实现数据共享,拥有更低延迟和更大内存空间,能够加快包括数据分析、数据库加速和功能即服务在内的各种工作复杂的处理速度。

英特尔可编程解决方案事业部首席产品营销官Patrick
Dorsey表示,目前为止,这是第一个也是唯一一个支持这种连接的解决方案。

在数据移动方面,Agilex和英特尔至强处理器间稳定的CXL运行在PCIe
GEN5上面,可为400G网络、边缘分析、数据中心工作负载等应用提供高带宽。Patrick
Dorsey称,Agilex的数据收发速率可达112G,是目前行业第一。

图片 6

二、任意异构3D集成

所谓任意异构3D集成(Any-to-Any Heterogenous 3D
Integration),指的是英特尔根据客户或市场的需求,将不同制程工艺、不同功能的小芯片封装在一起,快速供给客户需求。

图片 7

如图中间是FPGA,在它的旁边有一些跟计算有关的接口、存储,客户有需要时就可以把它集成到FPGA上。这使得客户进行数据处理、数据分析的速度加快一倍,更加敏捷、快速和灵活,开发成本也会降低。

当然,异构3D集成的实现,离不开英特尔的“胶水封装”黑科技——嵌入式多芯片互连桥接。这一技术使得英特尔可在同一片基板上连接各种不同类型的小芯片,实现芯片间3D封装互联和无损性能。

图片 8

去年英特尔收购了一个公司eASIC,这家公司能快速生产ASIC芯片,使得TTM性能和成本均得到优化。收购eASIC后,英特尔能够按照客户要求高效实现模组定制化或者优化。

不止于此,因为英特尔自己本身也生产ASIC芯片的,又收购了eASIC,使得英特尔有能力可以非常快地来生产FPGA并对其进行优化,并可将二者结合在一起,可在产品的这个生命周期进行灵活优化,同时英特尔也生产IP硬件,对客户来讲非常方便。

三、强调AI应用的加速器

英特尔很多产品都面向AI,英特尔Agilex
FPGA与英特尔至强、酷睿、Nervana、Movidius、Atom系列产品均互补,可实现高达40
TFLOPS的FP 16性能和高达92 TOPS的INT8性能,可配置FP32、BFLOAT 16、
FP16、INT2转INT8等不同DSP。

图片 9

其中,只有FPGA支持硬件化的BFLOAT16 &
FP16开放式标准,此前已经被谷歌TPU采用。

英特尔还向所有开发人员提供Agilex
FPGA开发者工具,专为硬件开发人员打造的Quartus
Prime设计工具和为软件开发人员打造的One API。

Quartus
Prime可将内存利用率提高15%,编译时间缩短30%,新的工作流和可用性功能提高设计融合速度。

One
API提供单一源、异构编程环境,支持常见的性能库API,FPGA支持包括英特尔VTune放大器、英特尔Advisor在内的英特尔软件开发工具。

当前,英特尔软件工具已经可以使用,开发者可以利用这些工具开发出自己的FPGA。Patrick
Dorsey表示,其首款设备将于今年9月上市。

四、三大适用市场:云、5G和边缘

到2023年,硅潜在市场规模将超过200亿美元。现在市场发展飞快,英特尔每个客户手上都有海量的数据亟待处理,以促进产品的创新和新兴业务的应用。不同客户面临的问题不同,很难统一每个所需要采用的应用。

英特尔认为客户需要更多定制化、个性化的解决方案,Agilex就是能为客户带来这些定制化解决方案的平台。对此,英特尔将其Agilex主要面向的市场分为三类:嵌入式/边缘,通信基础设施,云/企业。

在嵌入式/边缘,很多客户面临如何将实时数据收集和分析的问题,需要针对当下正在发生的事件、相关的信息进行实时反应,做出实时分析处理。

网络正在进行改变,从云到edge方面需要网络速度非常高,云服务供应商对网络有不同想法,在落实时可能会遇到困难,而通过FPGA,可以让他们能在网络方面实现创新的想法。

数据中心最关注的往通常是功率和总拥有成本,往往希望同样配置下做更多事,以降低成本。它和之前提到的网络的工作负载不同,是通过与加速器共享内存,使得效率更高。

据介绍,Agilex是首款提供广泛内存支持,且可无缝连接到英特尔至强可扩展处理器的FPGA。

图片 10

另外一个和英特尔FPGA产品契合的市场是5G。过去的无线市场往往是由无线硬件组成,现在越来越多跟数据相关,客户希望能很快开始使用5G,然后随着时间推移,一边使用一边优化。

对此,英特尔提供自定义逻辑连续体(customer logic
continuum),包括FPGA灵活性、快速优化英特尔eASIC设备、全方位自定义ASIC优化和根据应用选择芯片。Patrick
Dorsey表示只有英特尔提供以上所有自定义选项。

结语:Agilex将被应用于下一代的可编程加速卡

不同于此前英特尔Stratix系列,Agilex是全面借助英特尔自身能力的创新FPGA产品,其内置的基础架构、至强处理器、GPU、处理技术、3D封装技术、软件等均来自英特尔。

“现在在我们的研发部门有超过10万人,”英特尔可编程解决方案事业部首席产品营销官Patrick
Dorsey说,“接下来,公司会充分利用这项技术,在数据移动、数据存储、数据处理方面迈向下一个台阶。简单来说,我们会用Agilex会做我们下一代的可编程加速卡N3000。”

此外,Patrick
Dorsey还在采访中透露,今年晚些时候,英特尔将会向市场披露其FPGA产品路线图。

admin

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注