百万发网站

首页 > 正文

关于GPGPU计算的11个传说

www.dr-khazaee.com2019-07-16
百万发平台

资料来源:本文由公共部门半导体行业(ID:icbank)翻译,来自“Microwaves& RF”,作者Daniel Mor,谢谢。

RVmNSnC8TW7XW8

目前,嵌入式系统设计主要面临两个难点,可归结为:计算能力的损失和功耗的增加。主要的“罪魁祸首”包括:数据源的涌入,技术的不断升级,系统的缩小以及系统内部密度的增加。

高性能嵌入式计算机(HPEC)系统已经开始在通用图形处理器单元(GPGPU)上利用专用的并行计算速度和性能,使系统设计人员能够将卓越的功率和性能带入坚固,紧凑的设计(SFF)。

GPU加速计算将图形处理单元(GPU)与中央处理单元(CPU)相结合,以加速应用程序并将一些计算密集型任务从CPU移至GPU。

在这里,重要的是要注意随着处理要求的不断增加,主计算引擎 CPU最终将不堪重负。 GPU已经发展成为一个极其灵活和强大的处理器,并且具有改进的可编程性,精确性和并行处理能力,它可以比CPU更好,更快地处理某些计算任务。

对GPGPU计算的深入理解,包括其强大的功能和限制,可以帮助设计人员选择为其应用程序提供最佳性能的产品。

下面,我们将分析有关GPGPU的11个陈述和认知,以了解哪些是正确的,哪些是错误的。

1. GPGPU仅适用于消费电子产品,例如游戏中的图形渲染

这不是真的。正如过去几年所证明的那样,GPGPU正在重新定义其在数据处理和深度学习网络方面的能力,以及塑造其在人工智能领域的形象和期望。基于GPGPU技术的越来越多的军事和国防项目被部署在应用中,包括雷达的先进处理能力,图像识别,分类,运动检测,编码和其他系统。

2.因为它是“通用的”,GPU不是为处理复杂的高密度计算任务而设计的。

这种说法也是错误的。典型的强大RISC或CISC CPU具有许多复杂的核心。 GPU拥有数千个“专用”内核,经过优化处理和操作大型数据矩阵,如显示器或输入设备和光学相机(见图1)。这些GPU允许应用程序跨多个内核共享算法,并使构建和执行并行处理变得更加容易。能够在GPU上创建许多并发“内核”每个“核心”负责特定计算的子集使系统能够执行复杂的高密度计算。

RVmNSncEH6LHPH

图1:虽然多核CPU提供增强的处理能力,但基于CUDA的GPU可提供数千个并行运行的核心,同时处理大量数据。

GPGPU管道使用GPU上的并行处理来分析数据,就好像它是图像或其他图形数据一样。尽管GPU在较低频率下运行,但它们通常具有许多核心数量。因此,GPU可以每秒处理比传统CPU更多的图片和图形数据。通过使用GPU并行管道扫描和分析图形数据,可以实现显着的加速。

3. GPGPU的强度不足以承受井下监测,移动或军事应用等恶劣环境。

错误。加固的责任实际上在板或系统制造商身上。在恶劣的电子环境中使用的许多组件在制造时并不那么强大,并且GPGPU与其他设备相同。此时,需要了解可靠系统的设计,包括哪些技术可以最好地减轻环境危害的影响,并确保系统满足特定的应用要求。

例如,由于数十年的系统开发可用于系统开发,Aitech拥有基于GPGPU的电路板和SFF系统,可满足许多航空电子设备,海军,地面和移动应用的需求。专业知识。

4.当处理能力超过系统要求时,替代方案需要增加功耗(即购买功能更强大的硬件)

这个说法是对的。如果用户试图避免使用GPGPU,则通常会导致CPU性能不足。为了解决这个问题,通常会增加额外的CPU板,或者对现有的板进行超频,从而导致功耗增加。在大多数情况下,结果是降低了CPU频率性能,并且需要降低时钟以补偿芯片温度上升。

5.不添加其他处理引擎会增加系统的复杂性和集成问题吗?

在短期内,也许这是因为您需要考虑使用新尖端技术的学习曲线。但从长远来看,事实并非如此。 CUDA已成为图像处理和算法的事实上的计算语言。构建CUDA算法后,您可以在支持NVIDIA GPGPU板的任何不同平台上“重复使用”它。将它从一个平台移植到另一个平台很容易,因此这种方法只需要很少的特定硬件,因此更具“通用性”。

6.由于基于GPGPU的系统处理极大量的数据,因此会增加功耗

没有。今天的GPGPU非常节能。某些GPGPU板消耗的功率与CPU板相同。 GPGPU板可以使用数千个CUDA内核处理更多并行数据。因此,功率 - 性能比是以非常积极的方式受到影响的因素。

7.性能和功耗之间仍有权衡

是的,这些权衡总是存在的。事实上,更高的性能和更快的吞吐量需要更多的功率。但这些都是您在使用CPU或其他处理器时遇到的相同问题,毫无例外。

例如,当使用“NVIDIA Optimus技术”时,由于它是一种计算机GPU切换技术,其中单独的GPU处理所有渲染任务,因此RISC处理器及其集成图形处理器(IGP)仍然可以处理输出到显示器的最终图像。 )。事实上,RISC CPU的IGP仅用作简单的显示控制器,可实现无缝,实时,无闪烁的体验,而无需在GPGPU或共享CPU上进行图像渲染和生成。所有RISC CPU资源上的图像识别。这种负载分配使系统更加强大。

运行不太关键或要求较低的应用程序时,可以关闭独立GPU。英特尔IGP处理渲染和显示呼叫以节省电力并提供最高的每瓦性能。

8.通过简单的电路板升级可以平衡CPU上的负载,并且足以管理系统所需的数据处理

错误。在这种情况下,业界肯定会采用并行处理,即使用GPU处理,这是有根据的。并行处理图像是GPU最擅长的。随着数据输入和相机分辨率的不断提高,对并行处理架构的需求将成为常态,而不是奢侈品。对于需要同时捕获,比较,分析和决定数百个图像的任务和安全行业尤其如此(参见图2)。

RVmNSnz9eJ71Ig

图2:随着数据输入的增加,CPU的处理能力,负载平衡和时钟要求将无法满足实际要求。

9.摩尔定律也适用于GPGPU

是。有一个解决方案。 NVIDIA目前正在为多芯片模块GPU(MCM-GPU)架构进行原型设计。虽然今天的集成电路工艺升级变得越来越困难,并且晶体管小型化显着减慢,但该架构可实现持续的GPU性能扩展。

在GTC 2019上,NVIDIA对MCM-GPU芯片的讨论引入了许多可应用于更高级别计算系统的技术,包括网状网络,低延迟信令和可扩展的深度学习架构,以及有机基板。模具到模具的高效传动技术。

10.学习新的编程语言(如CUDA)需要花费太多时间和金钱来投资

事实上,事实并非如此。目前,CUDA是并行计算的事实上的标准语言,并且已经在市场上部署了许多基于CUDA的解决方案。因此,许多算法已移植到CUDA。 NVIDIA拥有一个大型在线论坛,其中包含许多应用案例,在线培训课程,用户社区等。此外,软件公司愿意帮助设计人员开始使用CUDA。在许多大学,CUDA现在是编程语言课程的一部分。

学习任何新的计算技术似乎令人生畏。但是,由于可用资源和GPGPU技术的巨大潜力,这是一种非常有价值的编程语言。

11.嵌入式市场中没有“工业”GPGPU,特别是SFF,SWaP优化系统

错误。 NVIDIA为嵌入式市场提供完整的“Jetson”产品线(见图3)。目前包括以下系统模块(SoM),每个模块都采用SFF设计,针对尺寸,重量和功耗进行了优化。

TX1

TX2

TX2i:适用于非常“恶劣”环境的特殊“工业”版本

泽维尔

RVmNSoF8oaIhK6

图3:为工业和军事应用设计的GPGPU正在重新定义SWaP优化和SFF系统的预期性能。

实际上,NVIDIA已经推出了具有更长生命周期的TX2i模块,这意味着组件对于长期计划(例如航空航天,国防和太空)以及若干工业应用的风险较小。该行业已经部署了许多相应的军事和工业项目以及客户计划,每天都会推出新的应用程序。

*免责声明:本文最初由作者创建。文章的内容是作者的个人观点。半导体行业观察转载只是为了传达不同的观点。这并不意味着半导体行业观察到这种观点的支持或支持。如有任何异议,请联系半导体行业进行观察。

今天是《半导体行业观察》共享的[2001]内容,欢迎关注。

RGRc6AHG3Y4QXe

半导体行业观察

“半导体第一垂直媒体”

实时专业原创深度

热门浏览
热门排行榜
热门标签
日期归档