“AMD是目前唯一一家并且拥有x86解决器和独立显卡的供应商”
amd是目前唯一拥有x86解决方案和独立显卡的供应商,至少在英特尔的xe显卡发布之前,red team的互联技术具有一定的灵活性。 这项技术在高性能计算( hpc )行业尤为有用,在昨天的rice oil and gas hpc会议上的amd演示中进行了介绍。
amd最初在next horizo n活动中宣布,将在数据中心的mi60 radeon instinct gpu之间扩展infinity结构,以实现像nvidia的nvlink一样的gpu之间的100 gbps链路。 但是,随着5月份frontier超级计算机的推出,amd明确了扩展这一方法以实现cpu和gpu之间的内存一致性。 amd的图表强调了半等级soc与fpga、gpgpu、通用x86计算核心等各种计算处理方式的能源效率差异,强调了flops相对于功耗和组件交付所需硅面积的性能。 表演。 正如您所看到的,通用cpu虽然落后,但使用专用的simd路径优化矢量化代码可以提高两个指标的性能。 但是,gpu仍然在电力效率和消费面积方面占主导地位。
正如公司使用ryzenapu一样,利用缓存一致性可以实现这两者的好处,同时如幻灯片所示,统一数据并为所有代码提供简单的cpu + gpu门户。
amd还提供了采用无统一内存的gpu所需的代码示例,支持统一内存架构,实际上减轻了多个编码负担。
amd使用异构系统体系结构( HSA (在此深入研究) ),结合了carrizo的固定功能模块,并通过其营销资料推广了这一功能。 与在cpu和gpu之间扩展infinity结构链路类似,但hsa提供了缓存一致的共享虚拟内存池。 该池消除了组件之间的数据传输,降低了延迟,提高了性能。
例如,当cpu完成数据解决任务时,数据可能需要由gpu解决。 这需要cpu将数据从内存空传输到gpu内存。 然后,gpu解析数据并将其返回给cpu。 这个复杂的过程会增加延迟,降低性能,但共享内存允许gpu访问与cpu使用的内存相同的内存,从而减少和简化软件堆栈。
数据传输的功耗通常比实际计算的功耗有所增加。 由于消除了这种传输,提高了性能和效率,并且通过在单独的gpu和cpu之间共享内存,这些利益将扩展到系统级,因此amd在hpc行业中具有比竞争对手更大的特点。 。
amd似乎仍然是hsa基金会的成员,但不再积极促进hsa与媒体的交流。 无论如何,显然开放体系结构的核心几乎仍然存在于amd新的独特实现中,也许最重要的是依赖于开放的rocm软件生态系统,现在享受着doe赞助的成果。
虽然amd为这一领域铺平了道路,战胜了百亿级系统,但英特尔正在开发为美国能源部( doe ) argonne国家实验室的aurora超级计算机提供动力的ponte vecchio体系结构。 英特尔的方法严重依赖于oneapi编程模型,其目的是捆绑cpu和GPU (称为Rambo cache )之间的共享内存池。 随着越来越多的消息的传播,我越来越感兴趣知道这两种做法的不同。
免责声明:学习富国网免费收录各个行业的优秀中文网站,提供网站分类目录检索与关键字搜索等服务,本篇文章是在网络上转载的,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,本站的工作人员将予以删除。