nvidia发布更快功耗更低的新一代图形加速卡

it-artical it-artical     2023-05-02     474

关键词:

导读 不出意外的,Nvidia在其举行的Supercomputing 19大会上公布了很多新闻,这些我们将稍后提到。但被忽略的一条或许是其中最有趣的:一张更快、功耗更低的新一代图形加速卡。

技术图片

多名与会者与多个新闻站点发现了这点,Nvidia 向我证实这确实是一张新卡。Nvidia的“Volta” 这代 Tesla GPU 加速卡在 2017 年就已淘汰,因此升级工作应该早已过期。

V100S 目前仅提供 PCI Express 3 接口,但有望最终支持 Nvidia 的 SXM2 接口。SXM 是 Nvidia 的双插槽卡设计,与 PCIe 卡不同,它不需要连接电源。SXM2 允许 GPU 通过 Nvidia 的 NVLink(一种高带宽、节能的互连)相互之间或与 CPU 进行通信,其数据传输速度比 PCIe 快十倍。

借助此卡,Nvidia 声称拥有单精度 16.4 TFLOPS,双精度 8.2 TFLOPS 并且 Tensor Core 性能高达 130 TFLOPS。这仅比 V100 SXM2 设计提高了 4% 至 5%,但比 PCIe V100 变体提高了 16% 至 17%。

内存容量保持在 32 GB,但 Nvidia 添加了 High Bandwidth Memory 2(HBM2),以将内存性能提高到 1,134 GB/s,这比 PCIe 和 SXM2 都提高了 26%。

通常情况下,性能提升将同时导致功率增加,但在这里,PCIe 卡的总体功率为 250 瓦,与上一代 PCIe 卡相同。因此,在相同功耗下,该卡可额外提供 16-17% 的计算性能,并增加 26% 的内存带宽。

 

本文转自:https://www.linuxprobe.com/nvidia-tesla-gpu.html

nginxstream性能

参考技术ANginxStream是一种用于加速网络应用程序的高性能流服务器,它可以提供更快的响应速度,更低的网络拥塞和更高的吞吐量。 查看详情

atmega328p(arduinopromini)超低运行功耗探索

参考技术A最近在做一个低功耗的项目,需要一款超低功耗的mcu,整体运行功耗不超过3mA(3.3v),同时要有i2c、spi以及uart通信,并且能承载一定的计算量,需要跑100hz以上的两层卡尔曼滤波,最重要的是,要可以用Arduino系的库,为... 查看详情

更快的替代 AVAudioPlayer?

...AVAudioPlayer?【英文标题】:QuickeralternativetoAVAudioPlayer?【发布时间】:2012-10-1304:33:42【问题描述】:我有一个应用程序,其中播放声音时帧速率会显着减慢。我正在使用AVAudioPlayer播放这些声音,并且在很短的时间内播放了许多声... 查看详情

wavesummit+2022大会回顾,nvidia极致性能助力飞桨落地千行百业

...。NVIDIA亚太区资深产品负责人AdamZheng还带来了以“NVIDIA全新一代产品,极致性能赋能飞桨落地千行百业”为主题的分享,以下为内容概要。NVIDIA推出Hopper架构掀起新一代加速计算浪潮NVIDIA作为计算加速行业的领导者,... 查看详情

上传失败您需要使用版本号为29或更低的SDK

...标题】:UploadfailedYouneedtouseanSDKwithaversionnumberof29orlower【发布时间】:2019-11-1302:50:58【问题描述】:尝试在googleplaystore上上传apk或appbundleaab时出现以下错误上传失败您需要使用版本号为29或更低版本的SDK。applyplugin:\'com.android.appli 查看详情

荣耀8详细参数

...感器,同时支持定位,语音识别,低功耗MP3等功能,响应更快,同时也带来更低的功耗。具体参数配置请参考下图: 参考技术B荣耀8使用了麒麟950处理器,麒麟950采用16nmFinFETplus制造工艺,采用4*A72+4*A53八核心的big.LITTLE架构,集... 查看详情

视频“云边端”全流程支持h.265,意味着更低的流量成本与更高的视频质量,计算压力都在边缘侧

作为新一代的安防视频编码技术,H.265编码视频对比同一片源的H.264,H.265视频的码率为610kbps,文件大小3.10MB,而H.264视频的码率达到了1183kbps,文件大小也有6.01MB,H.265(HEVC)标准可比H.264标准节省40%~45%的码... 查看详情

华为海思芯片都有哪些

...麟970芯片是华为海思推出的一款采用了台积电10nm工艺的新一代芯片,是全球首款内置独立NPU(神经网络单元)的智能手机AI计算平台。华为的新款芯片麒麟970,为推出的旗舰机型Mate10和其他高端手机提供更快的处理速度和更低的... 查看详情

centos用amd还是intel

...理器可以提供更好的性能,但Intel处理器可以提供更低的功耗,这取决于您的需求。AMD处理器可以提供更好的多核性能,而Intel处理器可以提供更高的单核性能。因此,您可以根据自己的需求来选择AMD或Intel处理器。参考技术A您... 查看详情

OpenGL 4.1 和更低的黑色纹理,Mac 和 Windows

...Windows【英文标题】:OpenGL4.1andlowerBlackTexture,MacandWindows【发布时间】:2020-06-0921:24:20【问题描述】:我在不支持OpenGL4.5和mac的低端PC上编译OpenGL代码时遇到了这个问题。在我的常规代码中,我会使用glCreateTextures和glTextureStorage2D等... 查看详情

nvidia这款自动驾驶芯片有多强

...SODIMM,70x45mm电源:10W/15W,5V输入参考技术AXavier本质上就是新一代英伟达Tegra芯片,但有 查看详情

阿里云全站加速dcdn重磅发布!打造新一代加速引擎

在数字化转型变革逐步深入的当下,安全高效成为企业上云、全球化部署的关键需求。随着应用场景复杂度不断提升、业务需求差异化发展,为了给企业提供更完善的安全加速服务,阿里云对全站加速DCDN产品进行了... 查看详情

为啥做gpu计算,深度学习用amd显卡的很少,基本都nvidia

...,比如Google也是选择用CUDA而CUDA只支持N卡。以前AMD本身对加速卡领域涉及没有N卡深,近几年看到这边潜力非常巨大,最近才大力打造AMDRadeonInstinct系列加速卡。 参考技术BNVIDIA显卡优化做工功耗稳定性都要比AMD好,价格上NVIDIA比A... 查看详情

嵌入式人工智慧大跃进,nvidia推出具pascal架构的jetsontx2单板电脑

...域展露头角,而NVIDIA稍早也宣布推出基于TegraParker平台的新一代JetsonTX2,将嵌入式人工智慧带到新的领域。JetsonTX2平台约莫名片大小,功耗低于7.5W,不过相较JetsonTX1提升具备两倍的能源效率,同时运算效能也达到两倍,使得Jetson... 查看详情

dvcon2020加速图像ip功耗分析的方法

...这是Intel工程师发表在DVCon2020上的论文,讨论了图形IP功耗分析的加速问题。研究目的  功耗在图形领域变得越来越重要,在硅前完成准确的平均功耗和峰值功耗尤为重要。在Intel内部,常用的功耗估计办法是跑仿真... 查看详情

测量 NVIDIA 张量核心加速

】测量NVIDIA张量核心加速【英文标题】:MeasureNVIDIATensorCoresspeedup【发布时间】:2019-06-1007:58:48【问题描述】:我在Volta架构(V100GPU)上使用NVIDIATensorCores。我想测量张量核心对我的代码的影响(用于测试目的的Tensorflow/Python中的卷... 查看详情

如何在非 NVIDIA 设置上加速深度学习?

】如何在非NVIDIA设置上加速深度学习?【英文标题】:HowcanIspeedupdeeplearningonanon-NVIDIAsetup?【发布时间】:2017-08-2520:42:03【问题描述】:由于我只有AMDA10-7850APU,并且没有资金购买800至1200美元的NVIDIA显卡,因此我正在努力利用现有... 查看详情

移动智能设备功耗优化系列--前言(nvidia资深project师分享)

本文是嵌入式企鹅圈原创团队成员、NVIDIA资深开发project师Terry发表的第一篇文章,其将对“移动智能设备功耗优化”这个专题展开一个系列的总结分享。Terry毫无保留地总结分享其在主导NVIDIA多个项目开发中的移动设备功耗优化... 查看详情