正文

半年内第二块国产全功能gpu，附带首个游戏显卡！摩尔线程造芯神速，张建中“黄”气逼人...

QbitAl  QbitAl  2022-12-12  544

关键词：

金磊发自凹非寺
量子位 | 公众号 QbitAI

他来了，他来了。

手持GPU，一身黑皮衣、下装牛仔裤、黄皮肤长头发，黑框眼镜之下挡不住硬汉气场。

但他不是英伟达的老黄。

他是曾经老黄左膀右臂之一的老张——

张建中，James，此前在英伟达中国区任职一把手长达15年时间。

现在更被人熟知的头衔，是国内GPU公司摩尔线程的创始人兼CEO。

而这次刚刚捂热的GPU，已经是他在今年量产上市的第2个了——

时隔，仅半年之久。

不仅如此，附着在这块GPU上的标签还有更多：

国产、全功能、全球首个、中高端……

而且基于它，张建中更是发布了国内首个中高端游戏显卡。

讲真，很难想象这般“速度”是由一家刚刚成立2年的公司所创造的。

由此不免让人心生疑问：

在做到快的同时，质量和性能上是否也一并跟上了呢？

我们不妨一同来看看。

全球首个支持PCIe接口的全功能GPU

摩尔线程的第二个国产全功能GPU，名为“MT-春晓”。

张建中也是将它作为打头阵的产品发布。

据了解，春晓集成了220亿个晶体管，内置4096MUSA架构通用计算核心以及128张量计算核心，可以支持FP32、FP16和INT8等计算精度。

其它重点参数如下：

GPU核心频率：1.8GHz
FP32计算能力：14.4 TFLOPS
INT8计算能力：57.6 TOPS
显存宽带：448GB/s
显存类型：GDDR6

张健中在现场还提及，春晓解锁了一项“全球第一”：

因为它是业内唯一支持PCIe Gen5接口的GPU。

（许多厂商已经达成共识，PCIe Gen5将会是未来消费级以及企业级存储设备的重点发展方向。）

那么与半年前摩尔线程所发布的“苏堤”GPU相比，二者又有何区别？

张建中表示在摩尔线程GPU四大引擎方面，春晓做到了全面升级：

现代图形渲染引擎性能最高提升3-5倍
AI计算加速引擎性能最高提升4倍
智能多媒体引擎性能最高提升4倍
物理仿真引擎性能最高提升2.5倍

至于为什么摩尔线程要在半年时间就将自家GPU推陈出新，这个问题我们请教了下张健中：

我们第一个全功能GPU苏堤，实际上属于中低端处理器，在GPU行业中可以满足国内国产化应用的需求。

但对于大部分主流用户，他们还是期待更高性能的GPU，因此我们快速发布了春晓，去满足高端的游戏玩家，满足更多用户对图形和计算的需要。

如此一来，我们的产品就能够覆盖高中低端的所有用户。

而提到了游戏，张建中基于春晓GPU，便发布了另一款“国内第一”的产品。

国内首款游戏显卡

其实摩尔线程在半年前基于苏堤也发布过显卡产品MTT S60。

但这张显卡的“用武之地”似乎更多面向的是产业，也就是B端。

而这次基于春晓打造的这张显卡MTT S80，则是能让更多大众摸得着的那种了——国内首款游戏显卡。

在现场，张建中还用了一个比较有意思的词来形容它：“国潮”。

从性能方面来看，其拥有的4096个可编程MUSA核心，在1.8GHz的主频下，能够提供14.4TFLOPS的单精度浮点算力。

与春晓相似的，MTT S80也是业内首款配备PCIe Gen5接口的显卡产品：

配合16GB GDDR6大容量高速显存，再辅以8K超高清与1080P 360Hz高刷新率显示输出能力，能为游戏玩家带来很好的体验。

似乎“光说不练”并不是摩尔线程发布会的风格，跟上次一样，张建中同样是在现场直接上效果。

例如它已经在Windows环境中适配了《暗黑破坏神3》，而这款游戏对于显卡性能要求还是较高的那种。

而有了MTT S80的加持，即便全程是在4K高清画质的情况下，FPS也能保持在60左右（FPS越高画面越流畅）。

除此之外，张建中还展示了赛车游戏爱好者钟爱的《极品飞车》，在MTT S80下的效果，可以说是相当的丝滑了：

据了解，目前MTT S80已经在Windows驱动内置了MUSA DirectX Driver模块，并完成了对数十款主流游戏的适配。

更重要的是，张建中说这款显卡将会在双十一当日限量开售。

那么到手后的实际效果如何、价格香不香，也是可以期待一下了。

新款全功能服务器GPU产品

在服务器方面的产品，摩尔线程这次也有更新——MTT S3000。

同样的，它也是基于MUSA架构、春晓GPU，算力可以覆盖图形渲染、视频处理、深度学习的完整MUSA软件栈。

支持的场景包括AI推理和训练、云游戏、云渲染、视频云、数字孪生、数字内容创作等。

从性能上来看，MTT S3000包含了4096个MUSA流处理核心及128个专用张量计算核心，晶体管规模达到220亿。

其运行频率为1.9GHz，显存位宽256bit；搭配32GB GDDR6显存，带宽为448GB/s；可以支持FP32、FP16、INT8等多种计算精度，其中FP32算力可达15.2TFLOPS。

在张建中看来，生态协作对于AI应用的推进至关重要。

因此，MTT S3000还兼容了PyTorch、TensorFlow、百度飞桨（PaddlePaddle）、计图（Jittor）等多种主流深度学习框架，并实现了对Transformer、CNN、RNN等数十类AI模型的加速。

而且MTT S3000可以说是做到了“与时俱进”，最近大火的AI作画：Disco Diffusion、Stable Diffusion也是同样能够hold住。

不仅仅是硬件的更新

而除了上述的硬件产品之外，纵观正常发布会，“软硬件结合”也是摩尔线程的一大特点。

这一点其实也不难理解，在我们与张建中交流的过程中，他也道出了缘由：

软件生态是推动GPU计算普及的关键。

GPU的研发体系是非常复杂的，有了硬件才能去开发软件，软件在硬件上跑起来了之后，还需要做更多优化；优化之后又会发现架构存在缺陷，反过来又得优化硬件。

硬件、软件是互相迭代、不停提升的一个过程。

为此，摩尔线程这次以MUSA架构为核心，摩尔线程发布了完备的MUSA软件栈。

其目的就是服务广大的开发者和终端用户。

除此之外，摩尔线程在GPU云原生、元宇宙、AIGC方面均有相应的新动作。

One More Thing

还是聚焦在张建中这次的outfit：

这个皮夹克，嗯，着实有点意思。

— 完 —

「AIGC系列直播 - 应用落地与商业化」直播报名

技术热潮之外，AIGC如何实际落地？又如何长期商业变现？

11月3-4日晚7点到8点，量子位智库联手国内头部AIGC企业及投资机构，为你解答，扫码预约～

点这里关注我 👇 记得标星噢 ~

离开英伟达仅19个月，他交出了一块国产全功能gpu

...响，主要还是这块GPU身上有太多的标签值得关注——国产、全功能、耗时仅18个月、量产上市……讲真，很难想象这是一家GPU界“新生儿”能做出来的事情。那么在这场发布会中，张建中和他的摩尔线程，真的做... 查看详情

2999元国产显卡抢疯了，steam游戏实测能玩，老黄旧将打造

...量子位|公众号QbitAI显卡还能搞“国潮”？没错，国产显卡品牌摩尔线程宣布旗下游戏显卡最近上了一批货，不再限制购买资格，而是先抢先得。这样一条消息吸引了不少显卡爱好者关注。在京东，已经被热情... 查看详情

nvidia等被迫采取措施，或为国产芯片提供机会，7纳米gpu芯片已现

...芯片厂商表示已研发出7nm制程的GPU芯片，此举代表着国产GPU芯片的重大突破，NVIDIA和AMD采取措施反而是国产GPU芯片的机会。NVIDIA和AMD是全球独立显卡市场的巨头，在家庭电脑中，普遍都是采用Intel的集成显卡，... 查看详情

国产gpu创业潮喧嚣下的资本游戏

近期，国产GPU又迎来一波融资大潮，多家公司估值接近200亿元。一批GPU厂商横空出世，而且在宣传上非常高调，声称性能如何如何优秀，仿佛追赶英伟达，超越AMD就在眼前。从背景来看，这一波GPU公司... 查看详情

tensorflow中使用gpu

...境变量中指定GPU#只使用第2块GPU，在demo_code.py，机器上的第二块GPU变成”/gpu:0“，不过在运行时所有的/gpu:0的运算将被放到第二块GPU上CUDA_VISIBLE_DEVICES=1pythondemo_code.py#只使用第一块GPU和第二块GPUCUDA_VISIBLE_DEVICES=0,1pythondemo_code... 查看详情

电脑显卡占用率怎么看

...，或者处于后台工作，GPU占用率都是很低的。当处于全屏游戏的时候GPU通常占用在99%左右，就说明显卡负载为满的，这是正常现象，占用越高说明显卡在正常工作，如果占用不满就是游戏优化不好或显卡驱动异常，需要检查。参... 查看详情

使用tensorflow时，关于gpu的设置

查看显卡使用情况：nvidia-smi设置tensorflow按需分配资源：importosos.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"os.environ["CUDA_VISIBLE_DEVICES"]="1"#使用第二块GPU（从0开始）gpu_options=tf.GPUOptions(allow_growth=True)sess=tf.Sessi 查看详情

国产7纳米芯片正式发售，怼上美国芯片丝毫不怵，美国芯片心慌慌

...国内市场，这给美国的竞争对手带来压力。据悉一家国产GPU芯片企业已正式对外发售去年推出的显卡，在价格方面比AMD、NVIDIA的同档次显卡便宜500块钱左右，而性能方面已达到后两者的中高端芯片水平。该款显卡的浮... 查看详情

华为专利收入超过支出/拼多多海外版下载火爆/百度计划增投200台无人车...今日更多新鲜事在此...

...U软件栈和应用工具等。其中，“春晓”是摩尔线程的第二个国产全功能GPU，同时也是国内的首个中高端游戏显卡。另外，摩尔线程官方还透露，他们现已联合数家合作伙伴，斩获了大型央企和大型国有银行台... 查看详情

玩游戏显卡使用率为0

...按钮，在下拉框中选择要使用独立显卡的应用程序;4、在第二条中的图形处理器中选择“高性能NVIDIA处理器”，然后点击右下方应用即可。参考技术A显卡是频率不可能是0，即使显卡工作在2D状态下也不可能是0，如果频率是0代表... 查看详情

转码解密挖矿显卡计算能力大对比

... 于是NVIDIA和AMD的竞争开始逐渐淡化游戏，而强调功能和应用，三屏、3D、PhysX、视频等开始大行其道。不过这些功能都难以量化，随着CUDA和Stream的飞速发展催生了OpenCL和DirectCompute通用计算标准，使得NVIDIA和AMD在另一条道... 查看详情

设置显卡顺序

在最开始的地方加上。os.environ[‘CUDA_VISIBLE_DEVICES’]=‘1,0’这样第二块显卡，在训练的时候就默认为第一块显卡了。查看详情

怎么看显卡使用率?

...显卡的使用率下载GPUZ软件，里面不但有显卡参数型号，第二个选项卡还有显卡的使用率、瞬时主频等等。问题六：怎么查看显存使用率gpuz切换到sensors（传感器）就OK，GPUload就是gpu占用memoryload就是显存占用问题七：显卡使用率... 查看详情

摩杜云2021上半年财报：营业总收入4亿元，同比增长2%

...限公司（以下简称“摩杜云”）正式发布2021年上半年财报，实现营业总收入4亿元，同比增长2%。其中，中小型企业云服务收入同比增长75.5%，继续保持高速发展。报告期内，摩杜云云服务业务保持高增... 查看详情

国产全中文-自动化测试软件apifox

国产全中文-自动化测试软件ApifoxApifox功能API文档、API调试、APIMock、API自动化测试下载地址https://www.apifox.cn/ 查看详情

kvm实现gpu透传(gpupassthrough)

...了方便对人工智能服务器进行自动管理或者实现某种特定功能，我们需要对显卡进行虚拟化。对于显卡这种硬件而言，英伟达有专门支持GPU虚拟化的显卡，比如GRIDGPU系列。以NVIDIAGRIDK2为例，显存8GB，可虚拟出2块GPU。不过这种自... 查看详情

kvm实现gpu透传(gpupassthrough)

国产gpu添新玩家，amd出身，两款业界第一7nm芯片曾由他打造

...成立的瀚博半导体，搞了一个“大动作”——预览了国产7nm云端GPU芯片，SG100。据了解，SG100是集渲染、AI和视频于一体的全功能GPU，在吞吐、延时等性能中具备世界领先水平。至于它所要发力的领域，正是云... 查看详情

正文

半年内第二块国产全功能gpu，附带首个游戏显卡！摩尔线程造芯神速，张建中“黄”气逼人...

金磊 发自 凹非寺量子位 | 公众号 QbitAI

全球首个支持PCIe接口的全功能GPU

国内首款游戏显卡

新款全功能服务器GPU产品

不仅仅是硬件的更新

One More Thing

离开英伟达仅19个月，他交出了一块国产全功能gpu

2999元国产显卡抢疯了，steam游戏实测能玩，老黄旧将打造

nvidia等被迫采取措施，或为国产芯片提供机会，7纳米gpu芯片已现

国产gpu创业潮喧嚣下的资本游戏

tensorflow中使用gpu

电脑显卡占用率怎么看

使用tensorflow时，关于gpu的设置

国产7纳米芯片正式发售，怼上美国芯片丝毫不怵，美国芯片心慌慌

华为专利收入超过支出/拼多多海外版下载火爆/百度计划增投200台无人车...今日更多新鲜事在此...

玩游戏显卡使用率为0

转码解密挖矿显卡计算能力大对比

设置显卡顺序

怎么看显卡使用率?

摩杜云2021上半年财报：营业总收入4亿元，同比增长2%

国产全中文-自动化测试软件apifox

kvm实现gpu透传(gpupassthrough)

kvm实现gpu透传(gpupassthrough)

国产gpu添新玩家，amd出身，两款业界第一7nm芯片曾由他打造

金磊发自凹非寺
量子位 | 公众号 QbitAI