上海张江又一款ai芯发布!性能超英伟达t4,amd背景团队创办,快手投资

QbitAl QbitAl     2022-12-04     643

关键词:

晓查 发自 上海
量子位 报道 | 公众号 QbitAI

今年4月刚刚5亿元人民币A+轮融资的AI芯片公司瀚博半导体,发布了云端推理AI芯片SV100系列,以及搭载该系列芯片的AI推理加速卡VA1

在发布会上,瀚博半导体创始人兼CEO钱军展示了SV100系列的首款产品——SV102智能视觉芯片,瀚博半导体CTO张磊展示了VA1板卡。

瀚博半导体这两款产品主要瞄准了AI领域中成熟的CV市场,主打低延时、多路视频处理能力,相比市面上的GPU在能效上具有优势,可节省60%服务器成本。

瀚博半导体CEO和CTO均来自AMD,公司于2018年2月创立,作为一家新兴AI芯片公司,瀚博发展迅速,在去年5月就完成了首颗半定制7nm芯片流片,之后又获得了快手等领投的5000万美元的A轮融资。

云端推理芯片SV100系列

SV100系列是瀚博为云端推理而打造的服务器芯片,SV102是该系列的第一款芯片,INT8峰值算力达到200TOPS。

瀚博半导体创始人兼CEO钱军认为,目前AI落地应用已经日趋成熟,根据调研机构IDC的报告,从今年开始,AI基础设备市场上的推理负载将超过训练负载,而且今后二者差距将越来越大。

因此瀚博半导体选择进入了云端AI推理硬件的赛道。

钱军表示,SV102具有超高推理性能、超低延时以及高密度视频解码等特点。

SV102支持64路1080p视频解码,最大功耗为75W,接口为PCIe Gen4 x16,采用被动散热。

这款芯片在今年6月刚刚测试成功。据钱军透露,SV100在开始测试之后8分钟就全部点亮,低于40小时之内所有模块基础测试提前完成。

“这个对于一个全新设计的高端芯片是一个奇迹”,钱军说。

VA1板卡

而搭载SV102的VA1采用单宽半高半长75瓦PCIe卡设计,因此相比一般的GPU卡更节省能耗与空间。

张磊表示,在ResNet-50的基准测试中,VA1是英伟达T4吞吐量的2倍以上。

由于VA1节省服务器50%以上TCO,因此在一个2U服务器中,搭载VA1的设备可以解码384路视频,整机算力是T4设备的2.5倍以上,功耗比相同搭载GPU的服务器更低,可节省60%的服务器成本。

在视频处理方面,VA1支持64路以上H264、H265或AVS2 1080p解码,分辨率支持高达8K。

除了硬件产品外,瀚博也搭建了自己的VastStream AI软件平台,支持PyTorch、TensorFlow等主流AI框架,目前正在与CentOS、Ubuntu、Red Hat、银河麒麟等服务器操作系统进行适配。

最后,SV102芯片与VA1板卡预计将于今年第四季度量产。

钱军透露说,未来瀚博半导体还将推出15W~150W不同功耗范围的AI推理产品供用户选择。

极智ai|昆仑芯k200全高全长推理卡

...上有挺多文章拿昆仑k200来对标英伟达T4卡(以表达昆仑芯性能之强悍),这是不对的,昆仑k200是全高全长卡,而T4是半高半长卡,这俩不是一个级别上的对比,所以拿昆仑芯k200对标诸如T4卡、昇腾300卡之类的半高... 查看详情

极智ai|昆仑芯k200全高全长推理卡

...上有挺多文章拿昆仑k200来对标英伟达T4卡(以表达昆仑芯性能之强悍),这是不对的,昆仑k200是全高全长卡,而T4是半高半长卡,这俩不是一个级别上的对比,所以拿昆仑芯k200对标诸如T4卡、昇腾300卡之类的半高... 查看详情

amd首批zen4架构cpu,连低端r5单核性能都超英特尔旗舰,最高降价700元

...构终于来啦!Ryzen7000系列首批四款CPU,今天正式发布。按照AMD测试数据,这四款的Geekbench单核跑分,均超过了英特尔当前的旗舰处理器i9-12900K。与之前传闻的全系列涨价正相反,这次低端的R57600X维持上代价格2... 查看详情

上海张江×百度飞桨打了个样,ai赋能这事儿可算有“参考答案”了

...听上去有点“离谱”的事儿,还就真真切切发生在了上海。事情的起点,始于世界500强冰淇淋厂商工厂里一个看似平平无奇的质检环节。彼时,这家公司面临的问题 查看详情

又一重要进展发布!openmmlab算法仓支持昇腾ai训练加速

摘要:上海人工智能实验室的浦视开源算法体系(OpenMMLab)团队基于昇腾AI发布了MMDeploy0.10.0版本,该版本已支持OpenMMLab算法仓库在昇腾异构计算架构CANN上的推理部署。本文分享自华为云社区《又一重要进展发布&#... 查看详情

又一重要进展发布!openmmlab算法仓支持昇腾ai训练加速

摘要:上海人工智能实验室的浦视开源算法体系(OpenMMLab)团队基于昇腾AI发布了MMDeploy0.10.0版本,该版本已支持OpenMMLab算法仓库在昇腾异构计算架构CANN上的推理部署。本文分享自华为云社区《又一重要进展发布&#... 查看详情

国产cpu新里程碑!龙芯3号新一代发布,性能追赶amd

芯东西12月24日消息,今天,龙芯中科发布龙芯4000系列CPU芯片,分别为<strong>3A4000和3B4000</strong>。性能方面,3A4000/3B4000采用28nmFDSOI工艺,微架构为GS464V核心,通用处理性能提升一倍以上,这将成为我国自主CPU发展史上又... 查看详情

国产cpu新里程碑!龙芯3号新一代发布,性能追赶amd

芯东西12月24日消息,今天,龙芯中科发布龙芯4000系列CPU芯片,分别为<strong>3A4000和3B4000</strong>。性能方面,3A4000/3B4000采用28nmFDSOI工艺,微架构为GS464V核心,通用处理性能提升一倍以上,这将成为我国自主CPU发展史上又... 查看详情

又一款性能调优神器,真香!(代码片段)

点击关注公众号,Java干货及时送达来源:https://zhenbianshu.github.io前言工具的进化一直是人类生产力进步的标志,合理使用工具能大大提高我们的工作效率,遇到问题时,合理使用工具更能加快问题排查的进度... 查看详情

国产处理器再获重大突破,走出国门挑战intel和amd

据媒体报道指海外PC厂商Dannie已推出了一款支持国产兆芯处理器的主板,这代表着国产处理器已不仅在国内市场替代Intel和AMD,还开始走向海外市场,代表着国产芯片的重大突破。兆芯推出的处理器为X86,它的技术... 查看详情

测评|国产“芯”·瑞芯微rk3568性能解析

瑞芯微出品的RK3568是一款定位中高端的通用型SoC,采用22nm先进制程工艺,主要面向工业互联网、HMI、NVR存储、车载中控、工业网关等领域。RK3568兼具CPU、GPU、NPU、VPU于一身,具体性能如下:CPU四核64位Cortex-A55主频... 查看详情

ai芯片与systemverilog参数化

...力需求就会扩大一倍。 根据斯坦福大学和麦肯锡联合发布的《2019人工智能指数报告》,2012年之前最先进AI模型计算量每两年翻一倍;2012年之后计算量每3.4个月翻一番,从2012年到2020年3月已增长30万倍。伴随着大模型的快速... 查看详情

又一款简洁实用的个人博客系统

【公众号回复“1024”,免费领取程序员赚钱实操经验】大家好,我是章鱼猫。今天推荐的这个项目是「van-blog」,一款简洁实用优雅的高性能个人博客系统。VanBlog支持HTTPS证书全自动按需申请、黑暗模式、移动端自适... 查看详情

国产7nm工艺的gpu芯片向英伟达和amd发起挑战

...赶的步伐。不像长沙景嘉微电子在2019年就发布了国产的一款高性能、低功耗的图形处理芯片(JM5400GPU),天数智芯的新BigIslandGPU型号并不像英伟达RTX和AMDRadeon型号一样,面向游戏设计方面开发,它更注重AI和HPC应用,以及教育,... 查看详情

又一款nginx管理可视化神器!通过界面完成配置监控,一条龙!(代码片段)

来自:Nginx-GUI入门链接:https://leanote.zzzmh.cn/blog/post/5cc7f63616199b068300001c需求nginx可视化管理,例如配置管理性能监控日志监控其他配置方案目前已实现前两条:配置管理,和性能监控日志分析监控这块还需要另找方... 查看详情

easycvr智能边缘网关硬件全新升级,强劲性能从“芯”出发

随着AI、云计算、大数据、5G、边缘计算、物联网等技术的发展,以视频技术为核心的安防智能监控平台开始广泛应用于行业领域的各个方面,并且成为领域内最具规模的市场之一。随着视频监控技术的信息化、智能化不... 查看详情

学校医院交通都ai+,上海发布12个人工智能试点应用场景

...CT影像和眼底病的筛查等四个领域开展人工智能应用。”上海市第十人民医院(下称“上海十院”)急诊科副主任、信息办副主任彭沪告诉第一财经记者,今年12月份,医院的智能化胃肠镜也将建成投入使用。目前,上海十院在... 查看详情

百度世界2021:百度大脑升级昆仑芯2量产智能云加速ai落地爆发

...;依托百度智能云加速产业智能化升级。第二代百度昆仑AI芯片“昆仑芯2”也宣布量产,中国“芯”再登新高地。作为百度AI技术积累和产业实践的 查看详情