“英特尔刚刚在其HPC开发者大会上公布了其基于Xe GPU架构的产品的最新详细新闻”
英特尔刚刚在hpc开发者大会上公布了基于xe gpu架构的产品的最新详细新闻。 英特尔高级副总裁兼架构师兼首席架构师raja koduri在会议上发表了演讲,阐明了英特尔第一个内部图形架构师xe的第一个架构蓝图,以及嵌入其中的各产品线。
英特尔详细介绍了xe gpu体系结构。 -ponte vecchio可通过百亿次计算扩展到1000个欧盟,用于xemf可扩展内存结构、rambo缓存、forveros包装器、各fp64的计算能力提高了40倍等。
这里有很多要讨论的拷贝,让我们来谈谈xe gpu体系结构的第一个方面,即产品阵容本身。 英特尔xe gpu体系结构是支持多种产品的可扩展体系结构。 英特尔计划提供三种源自xe的微体系结构。 这些包括:
英特尔xe lp (集成+入门) ( ) ) ) ) ) ) ) ) ) ) ) ) )。
英特尔XE惠普(中等、狂热、数据中心/人工智能) ( ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) )。
英特尔至强处理器( HPC ) )。
只有从命名方案中,才能了解这些gpu的功能。 lp关键字代表低功耗,而hp关键字代表高性能。 hpc关键字只需比较高性能计算的体系结构,就会采用接下来要介绍的一系列新英特尔技术。 据说xe lp约为5w-20w,但可以扩展到50w。 英特尔的xe hp更高,需要覆盖75w-250w细分市场,xe hpc级的体系结构需要实现更高的目标才能提供比其他产品更高的计算性能。
体系结构是软件兼容性协议。 我们最初计划在xe中设计两个微体系结构,即我们的体系结构( lp和惠普),但我们看到了在hpc中建立第三个微体系结构的机会。 - -拉贾Koduri
英特尔xe系列gpu具有以下可变矢量宽度:
simt
( gpu格式)
simd
( cpu格式)
simt + simd
(最高性能)
raja特别提到了xe hpc系gpu。 因为这是开发者会议的所有复印件。 英特尔的xe hpc gpu可扩展到1000个欧盟,每个执行单元都升级为提供40倍的双精度浮点运算能力。
欧盟将新的可扩展内存结构(称为xemf )和多个高带宽内存通道连接在一起。 xe hpc体系结构还包括一个称为rambo缓存的超大集成缓存,用于连接多个gpu。 该rambo缓存通过提供巨大的内存带宽,在双精度的整个业务负载中提供可持续的峰值fp64计算性能。
xe体系结构的核心是一种称为xemf的新结构。 这是这些机器性能的核心。 这称为rambo缓存。 cpu和gpu的内存可以访问的集成缓存。 - -拉贾Koduri
英特尔用最新的7纳米工艺节点制造xe hpc类gpu。 这也是英特尔先前提到的7纳米产品的领先地位。 英特尔将充分利用新的增强封装技术(如forveros和emib互连)开发下一代100亿次gpu。 以下是比较英特尔宣布的10纳米以上7纳米以下工艺节点的重要改进,以优化工艺。
2倍密度缩放vs 10nm
优化计划中的节点
将设计规则减少4倍
euv
新一代光纤操作系统和emib软件包
xe hpc gpu使用forveros技术与rambo缓存互连,rambo缓存在同一中间层由其他多个xe hpc gpu共享。 同样,emib用于将hbm内存连接到gpu上。 这两种技术都会带来带宽效率和密度的巨大飞跃。 就像他们的至强兄弟一样,英特尔的xe hpc gpu将配备ecc内存/缓存补偿和至强级RAS。
蓝队首台HPC GPU 7纳米庞特Vecchio-2021年登录aurora超级计算机
详细介绍了所有关键技术后,我们将直接介绍第一个使用英特尔xe hpc架构的7纳米产品。 被称为ponte vecchio,是一种超大规模gpu,旨在成为超级计算机下一个单片100亿级的设计。 ponte vecchio gpu包括16个基于xe hpc gpu体系结构的计算小芯片。
免责声明:雪球目录网免费收录各个行业的优秀中文网站,提供网站分类目录检索与关键字搜索等服务,本篇文章是在网络上转载的,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,本站的工作人员将予以删除。