国家超算深圳中心计划2年内提升计算能力至少1000倍;图神经网络的生成式预训练论文解读

jdclouddeveloper jdclouddeveloper     2022-12-11     398

关键词:

技术图片

开发者社区技术周刊又和大家见面了,萌妹子主播为您带来最新一期“开发者技术联播”。让我们一起听听,过去一周有哪些值得我们开发者关注的重要新闻吧。

技术图片

*国家超算深圳中心计划2年内提升计算能力至少1000倍

*T-Mobile扩大更快中频5G网络 覆盖范围几乎翻一倍

*苹果正研发iMac处理器A14T 采用台积电5nm工艺制造

*MongoDB Atlas现支持多云数据库集群

*维基媒体将代码库迁移到 GitLab

*GPT-GNN:图神经网络的生成式预训练

*图神经网络时代的深度聚类

技 术 要 闻

Industry   News

1, 京东智联云4篇论文入选国际语音顶级大会Interspeech 2020

技术图片

近日,国际语音顶级会议Interspeech 2020在线上举行。京东人工智能研究院有4篇论文脱颖而出,成功入选本次大会。分别在声音事件定位与检测、语音去混响、语音验证系统、神经网络声码器等领域取得突破。Interspeech 2020是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,是全球最大的综合性语音信号处理领域的科技盛会。该会议每年举办一次,今年大会是第21届INTERSPEECH会议,也是第二次在中国举办。本届会议以“Cognitive Intelligence for Speech Processing”为主题,内容涵盖信号处理、语音识别、自然语言处理、神经机器翻译等领域。

2,国家超算深圳中心计划2年内提升计算能力至少1000倍

技术图片

从国家超级计算深圳中心获悉,当前高技术领域角逐的焦点之一的E级计算机即将落户深圳,计划至 2022 年,该中心计算能力将至少提升 1000 倍,为湾区基础科学研究、云计算、大数据和人工智能提供支持。目前,超算中心二期建设正在推进,包括E级机研制、新园区建设、应用生态建设三大部分。

3,T-Mobile扩大更快中频5G网络 覆盖范围几乎翻一倍

技术图片

据国外媒体报道,美国电信运营商T-Mobile宣布了拓展其2.5GHz中频段5G网络,该网络目前在数十个新城市中可用,相比去年9月底一次主要中频段,覆盖范围增加接近一倍。T-Mobile表示,它现在已经在美国近410个城市和乡镇获得了5G中频支持。T-Mobile的5G网络将其广泛使用的600mhz 低频网络(覆盖范围覆盖全国范围,但在速度提升方面不及 LTE)与更快的2.5 GHz网络以及超快的mmWave网络(速度最快,但覆盖范围最差)结合在一起。T-Mobile计划继续积极的中频段5G扩展,目标是到2020年底覆盖1亿人。

4,苹果正研发iMac处理器A14T 采用台积电5nm工艺制造

技术图片

在6月22日开幕的全球开发者大会(WWDC)上,苹果公司公布了基于ARM架构的自研Mac处理器计划,并宣布首款基于自研处理器的Mac,计划今年年底开始出货,在未来的两年完成过渡,届时Mac产品线就将全部采用苹果自研处理器。而从外媒最新的报道来看,除了自研用于Mac笔记本电脑的处理器,苹果还在研发用于桌面电脑iMac的处理器,明年年初推出的iMac预计就会采用。苹果正在研发的桌面电脑处理器是A14T,预计在2021年推出。此外,苹果自研的GPU,也将在2021年推出,这也就意味着苹果明年新推出的iMac,有望同时搭载苹果自研的中央处理器和图形处理器。

5,MongoDB Atlas现支持多云数据库集群

技术图片

新的MongoDB Atlas多云集群功能已于上周二全面推出,并扩展了该公司现有的云数据库产品。这个新的多云集群支持不只是在不同的云提供商上运行托管的MongoDB数据库,在此次更新中,MongoDB还允许用户同时在多个云提供商之间运行数据库,这在此前很难实现。451 Research高级研究分析师James Curtis对此表示:“对于很多企业来说,作为一种流行的数据库选择,MongoDB通过Atlas支持多云很有意义,他们的客户需要这种支持,即使他们现在没有提出要求,将来也会提出这个要求。”但是,Curtis指出,多云对不同企业可能有不同的含义。他认为,现实情况是,多云能够最好地满足目标工作负载,例如高可用性、备份和专业分析,这也是MongoDB在此Atlas更新中的重点。

6,维基媒体决定将代码库迁移到 GitLab

技术图片

维基媒体基金会决定将其代码库从 Gerrit 迁移到自托管的 GitLab 社区版。维基媒体称,过去两年的开发者满意度调查显示对代码审查系统 Gerrit 的不满有点高,志愿者社区对其不满尤其高。越来越多的个人和团队放弃使用 Gerrit 改用第三方托管选项 GitHub。这些证据显示 Gerrit 没有促进开发而是放缓了开发,如果不能解决 Gerrit 上的可用性问题,开发者将会选择在他们偏爱的平台上构建项目。维基媒体发布工程团队在调查和评估之后选择迁移到 GitLab,GitLab 允许自托管,提供了 MIT 授权的社区版,符合基金会的自由和开源原则。

学 术 前 沿

Academic News

1,GPT-GNN:图神经网络的生成式预训练

技术图片

机器学习的成功很大程度上取决于数据。但高质量的标记数据通常很昂贵且难以获得,尤其是对于希望训练参数较多的模型。而相对的我们却可以很容易地获取大量的无标记数据,其数量可以是标记数据的数千倍。例如,在社交网络上进行异常检测时,恶意帐户的标注需要依赖于专家知识,数量较小,而整个网络的规模却可以达到十亿规模。

为了解决标注数据较少,尽可能利用其无标注数据,一个常规的做法是自监督的预训练(self-supervised pre-training)。其目标是设计合理的自监督任务,从而使模型能从无标注数据里学得数据的信息,作为初始化迁移到下游任务中。由于目标任务中很多的知识已经在预训练中学到,因此通过预训练,我们只需要非常少量的标注数据,就能得到较好的泛化性能。

论文链接:https://arxiv.org/abs/2006.15437

2,图神经网络时代的深度聚类

技术图片

聚类是机器学习/数据挖掘的一个基础性问题。从传统聚类到深度聚类以及现在图神经网络赋能的聚类, 各种各样的聚类算层出不穷,也在很多领域得到了广泛的应用。考虑到图神经网络对结构信息的捕获能力,在涉及到群体结构的聚类任务上,本篇文章所介绍的聚类算法应该会取得更大的提升。

论文链接:https://arxiv.org/abs/1906.06532

以上信息来源于网络,由“京东智联云开发者”公众号编辑整理,不代表京东智联云立场

欢迎点击京东智联云,了解开发者社区

更多精彩技术实践与独家干货解析

欢迎关注【京东智联云开发者】公众号

技术图片

纤亿通-积极响应国家5g应用“扬帆”行动计划!

        在工信部等十部门印发《5G应用“扬帆”行动计划(2021-2023年)》中有提到,提升5G应用支撑能力,其中包括:5G网络基础能力、5G应用生态融通能力、5G应用安全提升能力等。(一)5G网络基... 查看详情

天河二号超级计算机属于啥型计算机

...定制版Linux),其它超算采用比较多的是RHEL和centos。其实国家超算广州中心、国家超算天津中心,国家超算长沙这3个地方部署的都是银河麒麟操作系统。超级计算机都是采用的多核加分布式方式,可以理解成Linux集群,超级计算... 查看详情

牛逼了!国内top3的超算中心,免费领2000核时计算资源

...;超级计算机一直是各国竞相角逐的科技制高点,也是国家综合科技实力的体现,尤其是近几年,中国和美国在超算领域的竞争已经进入“白热化”。2020年,我国超级计算机在《全球超级计算机500强榜单》中首次... 查看详情

华为云云原生首次在太空验证,提升“天算星座“卫星计算精度

...电大学深圳研究生院与天仪研究院共同发起,以服务国家重大战略需求和国际科技前沿探索为目标,通过对卫星智能化、服务化、开放化设计,构建产学研用一体化的空天计算在轨试验开放开源平台,为推动我国6... 查看详情

哈工大深圳2022年计算机专硕招生人数

...近三年,中心承担纵向科研项目总经费6000余万元,其中国家级项目17项,省市级项目39项;承担横向科研项目47项,总经费5000余万元;牵头制定国家标准3项,申请发明专利30余项,获得专利授权17项,软件著作权11项;发表论文300... 查看详情

牛逼了!国内top3的超算中心,免费领2000核时计算资源

...;超级计算机一直是各国竞相角逐的科技制高点,也是国家综合科技实力的体现,尤其是近几年,中国和美国在超算领域的竞争已经进入“白热化”。2020年,我国超级计算机在《全球超级计算机500强榜单》中首次... 查看详情

智算中心掀落地热潮,加速ai普惠化

11日,国家信息中心与浪潮信息联合发布的《智能计算中心创新发展指南》显示,目前全国有超过30个城市正在建设或提出建设智算中心,“十四五”期间,对智算中心的投资可带动人工智能核心产业增长约2.9-3.4... 查看详情

引领创新技术发展,百度荣获两项数据中心国家级荣誉

2022年2月7日,百度云计算(阳泉)中心入选《国家新型数据中心典型案例》名单。这是百度继入选《2021年度国家绿色数据中心》的又一喜讯。两项国家级荣誉的取得,标志着百度云计算(阳泉)中心作为... 查看详情

linuxraid磁盘阵列各类型优势汇总

...doop建议使用这个技术。各个技术的优势raid0:条带,性能提升数倍,不提供冗余能力(容错能力)。空间利用率:100%,至少2块盘raid1:镜像,性能提升(写下降、读提升),提供冗余能力。空间利用率为50%。至少2块盘raid5:性... 查看详情

raid

...速度数据可用性RAID1镜像mirror校验码RAID5RAID6RAID0条带性能提升,没有冗余能力空间利用率:n至少两块磁盘RAID1镜像性能表现:写性能下降,读性能提升冗余能力:有空间利用率:1/2至少两块磁盘RAID10优于RAID01性能表机:读写提升... 查看详情

计算机秋招必备!深圳互联网大厂企业整理清单!

...简称“深”,别称鹏城,是广东省副省级市,国家计划单列市,超大城市,国务院批复确定的中国经济特区、全国性经济中心城市和国际化城市。全市下辖9个区,总面积1997.47平方千米 查看详情

错过等一年丨2022全球边缘计算大会深圳站参会指南来啦!

...《计划》),《计划》中明确提出到2025年要建设1-2个国家级创新平台,加强核心技术研发,主攻超高速光纤传输、下一代光网络技术、下一代互联网技术和无线通信技术等核心领域。深圳将着力在光传输网络、射频天... 查看详情

思想素养——治理效能的提高

提高社会文明程度、提升国家治理效能,是“十四五”时期经济社会发展要努力实现的两大主要目标。中国特色社会主义制度具有强大生命力和显著优势,是当代中国发展进步的根本保证,为治理能力现代化、建成法治国家、法... 查看详情

腾讯联合国家天文台启动探星计划,优图ai可提升120倍数据处理效率

7月9日,2021世界人工智能大会腾讯论坛在上海举办,腾讯云副总裁、腾讯优图实验室总经理吴运声发表了“人工智能的可持续发展之道”主题演讲,宣布全新推出腾讯云TIONE、TIMatrix、TIDataTruth三大AI底层平台,可... 查看详情

《扶持中小微企业发展政策指南》:中国制造2025

...〔2015〕28号)发布部门国务院战略任务和重点(1)提高国家制造业创新能力加强关键核心技术研发。强化企业技术创新主体地位,支持企业提升创新能力,推进国家技术创新示范企业和企业技术中心建设,充分吸纳企业参与国... 查看详情

中国高校最强超算!上算引力波,下算光量子

...自凹非寺量子位报道|公众号QbitAI国内哪所高校拥有最强超算?上海交通大学最新启用的科学计算中心夺得这个第一。有多强呢?双精度算力峰值超过6PFlops(6千万亿次/秒)。就是放到全世界顶尖高校中去比也能排... 查看详情

国家基因组科学数据中心工作好吗

岗位职责:建设生命与健康多组学数据库系统,负责开展:生物数据整合、挖掘、解析等生信分析工作;生物信息数据审核、质控、注释等数据审编(curation)工作;建立遗传数据资源的分级获取、安全可控的数据管理系统。 ... 查看详情

aurora极光a21超算将会使用sprcpu和pontevecchiogpu

Aurora极光A21超算Aurora是Intel和Cray为能源部下面的阿公国家实验室建造的e级别的超算集群。预计2021年建成,2022年交付。A21后面的21就代表2021年。之前预计是使用IntelPhi处理器实现,但是因为2019年Intel放弃Phi处理器的进一步的开发... 查看详情