提供免费计算资源,开发平台aistudio零门槛实现ai能力

机器之心V 机器之心V     2022-11-23     528

关键词:

2018 年 7 月 4 日-5 日,百度在国家会议中心举办第二届 AI 开发者大会。在今年的开发者大会上,百度发布了 PaddlePaddle3.0,既升级了核心框架,又提供了 EasyDL 快速应用平台、AutoDL 网络结构自动化设计,以及 AI Studio 在线实训平台。本文从功能简介,实战建模及 AI 能力应用等角度介绍了 AI Studio。

AI Studio 是百度推出的一站式开发平台:一个囊括了 AI 教程、代码环境、算法算力、数据集,并提供免费的在线云计算的一体化编程环境。用户不必纠结于复杂的环境配置和繁琐的扩展包搜寻,只要打开浏览器输入 aistudio.baidu.com,就可以在 AI Studio 开展深度学习项之旅。

据介绍,运用 AI Studio 开发者可以实现自定义的 AI 建模能力而无需考虑硬件成本、运维成本、人力成本。相比于在其他云平台上花钱买计算资源和存储空间跑模型来说,AI Studio 提供全套免费服务(计算资源免费,空间资源免费,项目托管免费,视频教程也免费)。

1.    功能简介

第一次进入主页,首先的感觉是这是个类似 Kaggle 的数据竞赛平台,但是仔细看来,AI Studio 强化了工程项目的概念,一大亮点就是 AI 学习项目这个版块,里面包括大量真实场景的工程项目(图像识别,情感分析,个性化推荐等);另一个重要组成就是比赛了,众所周知构建良性循环的产、学、研社区是行业发展的重要组成部分,不过目前 AI Studio 组织的比赛还刚起步,希望后续比赛多多,大家在这里都能学到知识,交到朋友,最重要的是,可以在学习的同时给自己赚点零用钱花花。

Figure 1 AI Studio 特性

AI Studio 主要功能有项目类的项目大厅,创建项目,样例项目,共享项目等四大部分,有数据科学比赛,有各种经典数据集和自定义数据集,有详尽的机器学习和深度学习的教程及视频公开课等。下面就简单的来介绍一下:

Figure 2 AI Studio 主要功能

1.1. 菜单栏

1.1.1.项目大厅

作为 AI Studio 的主页,集成百度积累的经典 AI 学习项目,自我的项目管理及共享项目列表。整个平台都是以项目为核心的,也凸显了 AI Studio 的定位,就是以技术及资源输出帮助个人开发者,中小企业快速拥有 AI 能力以更好的服务自身业务。

1.1.2.数据集

数据集包括一些经典的公开数据集, 像 MNIST,IMDB,CIFAR10,Penn Treebank,MovieLens 等;也包括一些开放的百度数据(中文短文本语料,信息抽取数据)。不过相比 Kaggle 近万份数据集来说,仍然有很大的发展空间,但是个人感觉 AI Studio 的数据集还是要比 Tianchi 的数据集规整很多的。当然,用户也可以上传自定义数据进行模型开发。

1.1.3.比赛

这个模块应该是所有玩数据的人最感兴趣的了吧。我之前在 Kaggle 参加过一些项目,总的来说,Kaggle 在比赛这块做的真的很好,赛制清晰,社区完善,每次参加比赛都能有很大的提高。相较 Kaggle,AI Studio 的比赛数量还不多,不过以上提到的功能都有,另外就是 AI Studio 提供云端训练平台,这样大家的武器库相对平衡,能够更公平的进行竞赛。

Figure 3 AI Studio 比赛页面

1.2. 创建项目

AI Studio 以项目为单元进行开发。创建项目,添加数据集,运行开发环境(notebook kernel),就可以开始构建自己的模型进行开发生产了。目前,环境仅支持 Python2.7(期待更多的环境,Python3,R 等),算法框架包括 PaddlePaddle 和 sklearn 等。

Figure 4 AI Studio 创建项目页面

1.3. 教程&资讯

关于教程,PaddlePaddle 关于机器学习的教程应该是中文里最好的教程之一,不仅有机器学习、深度学习的视频公开课和教程文档(获取),而且包含了大量的各个方向的深度学习实例,比如图像分类,词向量,个性化推荐,情感分析,语义角色标注以及机器翻译等,不仅从原理层面进行深入浅出的讲解,更提供模型代码逐行进行实操,可以说为 Everyone can AI 提供了强大的后盾。

1.3.1.样例工程

样例工程即是提供的机器学习经典应用场景及历届比赛的 notebook,我们可以把各个项目 fork 到自己的项目下进行开发学习。对于急于构建 AI 能力的中小企业,这个模块是最大福音了,很久之前看过 Tensorflow 的文档,只有几个典型问题的教程及代码,而这里包括了大量的基于不同场景的 AI 模型可供拿来即用。

1.3.2.共享项目

顾名思义,AI Studio 也提供项目共享功能供大家互相学习。在开源的时代,能够培育成熟活跃的社区是平台发展的必要因素,这也是 Tensorflow 能够在深度学习领域中快速推广的重要原因。

1.3.3.我的项目

这里是开发者自己的项目列表,不再赘述。

2.实战建模

AI Studio 以项目为核心,创建项目的同时可以自定义上传数据,也可以选取平台已有数据集;目前,环境仅支持 Python2.7,算法库包括 sklearn 和 PaddlePaddle。不需要费心在开发环境上,能够安心构造模型,将建模工程云服务化应该是未来趋势(能够方便中小企业快速构建 AI 能力)。在 AI Studio 各项目之间是独立分配资源的,可以同时调试多个项目模型,这点还是非常赞的。

我这里创建了两个共享项目,查看代码直接 fork 项目开箱即用(需百度账号登录:Titanic 项目,个性化推荐项目),代码详见附录及共享项目。第一个项目是最最基础的数据科学的入门问题 titanic 预测是否生还(自主上传数据,调用 sklearn 随机森林模型);第二,利用已有数据(MovieLens)及 PaddlePaddle 构建个性化推荐模型。一个小问题就是创建项目后进入项目页面,进入运行状态还需要点击运行项目,这里感觉有点冗余;运行的项目就是一个简洁的 notebook 开发环境,该有的功能都有,个人感觉速度比 Kaggle 要好很多(不知是不是我的网速渣)。

Figure 5 AI Studio 项目界面

开发环境主体是由 notebook 形式组成,熟悉 jupyter 的同学可以无缝衔接,比 notebook 好的一点就是项目的数据集都会形成列表,简单一键获取数据路径。菜单栏更简洁,基本功能都有,可以保存 notebook,有个有意思的地方是在创建项目的时候环境只能选 Python2.7,但这里 kernel 选择会出现 Python3。

Figure 6 AI Studio 开发页面

3.    群雄逐鹿

作为一站式 AI 建模开发平台 AI Studio,如何在强手如云的 AI 开发平台市场杀出一条血路呢?最重要的途径就是完善比赛社区的理念,通过 PaddlePaddle+AI Studio 的方式抢占数据科学竞赛这个领域,这里就简要比较一下几家数据竞赛平台(AI Studio、Kaggle、天池、DataCastle 等)。以下将从对开发者的能力提升,平台比赛的公平性和比赛收获等三个方面阐述。

3.1. 能力提升

可以说参加数据建模比赛是最好的提升自身能力的方式了,在比赛中,不但能够了解各行各业的业务形式,数据结构,也能真实的验证我们对特征和算法的不同理解,而良好的社区环境和代码共享机制为自身能力的提升提供了温床。在这方面,Kaggle 因为成立最早有很强的人才和代码沉淀,投靠 Google 后,更是愈发的体现了其中的优势。天池和 DataCastle 在社区建设上也投入了大量的精力,但是与 Kaggle 还是有较大的差距,不过在中文社区中应该算是佼佼者。AI Studio 显然有后来者的劣势,不过看过他们的样例项目,还是很佩服他们在教程和文档方面的思考,可以说在 AI 中文教程里 AI Studio 大踏步的跨入了第一梯队。

3.2. 比赛的公平性

这里的公平性体现在两个方面,第一是赛题的数据量要有一定的规模以防止数据量过小导致的模型稳定性问题;第二则是计算资源的公平性,举个栗子,假如阿里组队以 P100 GPU 集群的算力来参赛的话,恐怕其他人的胜算只能寄托于奇迹了,而对于 ImageNet 那样量级的数据,我们只有 PC 机的话恐怕连一次迭代也完成不了,更不要说模型调优了。

在这方面,AI Studio 具有极大的优势,平台不仅免费对参赛选手给予计算资源上的支持,更是提供最新版本的 PaddlePaddle 供选手调用。而天池在初赛阶段是没有集群算力支持的,只有进入复赛的选手才会有机会使用数加平台。Kaggle 和 DataCastle 更是没有平台的支持。相比来说在比赛资源的公平性上 AI Studio 的优势巨大。

3.3. 比赛收获

这里的收获是只除了能力以外的物质方面的获得,比如现金奖励和简历背书。这两点对于初入职场的新人还是非常重要的。客观来讲,国际影响力的话 Kaggle 绝对是 No.1,致力于进入 Google、facebook 的同学最好还是在 Kaggle 上挑选优质的比赛;针对国内的话,AI Studio、天池和 DataCastle 在奖金方面相差不大,由于 AI Studi 推出最晚,所以奖金相对来说高一些。

综合来看,AI Studio 作为数据科学竞赛中的新人,背靠百度资源,凭借更加公平的平台资源输出,奖励制度和完善的教程文档体系将会在未来大规模的抢占数据竞赛市场。对开发者来说,免费使用 GPU 资源,更简单的开发流程已经是很大的诱惑了。

4. 总结

AI Studio 是一个基于 PaddlePaddle 的集成了大量数据集、经典样例项目及比赛项目的云计算建模平台,也是一个机器学习、深度学习的交流社区。AI Studio 最大限度的解放了数据科学家需要环境配置的烦恼,在云端集成计算资源,项目管理,代码管理,比赛等多种功能,形成一站式兼顾学习和工作的建模平台。而且 AI Studio 提供计算资源,空间资源,视频公开课都是免费的。最后,期待一下的更多比赛的推出。

产业 百度 开发者大会 AI Studio 2

免费领取16套深度学习权威实践课,从零基础小白到大牛

...好不容易啃完了视频却发现没源码没法调参跑代码,快来AIStudio课程!免费优质课程,系统化学习,名师指导,提供真实开发案例,在线实训调参,提升学习效果,带你快速入行人工智能!很多学习AI算法的人都很痛苦,尤其是希... 查看详情

百度献礼高校开学季:aistudio教育版上线!

...多硬核?于去年6月推出的AIStudio 是百度推出的一站式开发平台,集合了AI教程、代码环境、算法算力和数据集,并为用户提供在线云计算编程环境,不需要用户下载安装、环境配置和依赖包等繁琐步骤,就可以开展深度学习... 查看详情

百度献礼高校开学季:aistudio教育版上线!

...多硬核?于去年6月推出的AIStudio 是百度推出的一站式开发平台,集合了AI教程、代码环境、算法算力和数据集,并为用户提供在线云计算编程环境,不需要用户下载安装、环境配置和依赖包等繁琐步骤,就可以开展深度学习... 查看详情

虹软arcfacego智慧门禁应用套件,提供免费下载啦

导语:虹软ArcFaceGo智慧门禁应用套件包括门禁软件APK、PC管理客户端和云端服务三部分,最快3分钟即可完成智慧门禁系统的部署,解决中小型企业软件开发能力不足的问题,加快实现产品智能化落地。智慧门禁是人脸技术商业领... 查看详情

个人永久性免费-excel催化剂功能第20波-excel与sqlserver零门槛交互-数据上传篇

...据很少可以很连贯地进行整合分析,一般的业务系统都会提供导出Excel作为标配功能供用户使用系统内生成的数据。此时最大的问题是,Excel很维去成为各个数据源的整合方,其数据存储能力和运算能力一直是众多深度Excel用户们... 查看详情

个人永久性免费-excel催化剂功能第21波-excel与sqlserver零门槛交互-执行sql语句篇

在前两波中,已完成了Excel与Sqlserver的查询和上传功能,但难免许多临时的或更深入地操作数据库需要用Sql语句来操作,对一般用户电脑里,不可能有条件轻易安装一个数据库客户端软件,就算安装了对其中烦多的功能操作也不... 查看详情

“神算子”easydl时序预测模型零门槛

百度飞桨EasyDL零门槛AI开发平台在机器学习方向推出了自动时序预测的功能,极大程度降低了构建模型的难度与门槛。可广泛应用于零售、金融、交通及天气预测等场景。时序预测是根据历史统计数据的时间序列,对未来... 查看详情

“神算子”easydl时序预测模型零门槛

百度飞桨EasyDL零门槛AI开发平台在机器学习方向推出了自动时序预测的功能,极大程度降低了构建模型的难度与门槛。可广泛应用于零售、金融、交通及天气预测等场景。时序预测是根据历史统计数据的时间序列,对未来... 查看详情

阿里云开发零基础免费搭建个人hexo博客

云开发零基础搭建个人Hexo博客摘要云开发平台搭建个人Hexo博客的优势环境准备操作步骤写在最后摘要Hexo是一款基于Node.js的博客框架,可以将Markdown格式的文本渲染为HTML代码。所以,博客基本就是纯静态,维护相对方便。但是... 查看详情

个人永久性免费-excel催化剂功能第19波-excel与sqlserver零门槛交互-查询篇

对频繁使用Excel的高级应用的尝试用户来说,绕不过的一个问题Excel的性能问题,对于几万条数据还说得过去,上了10万行的数据量,随便一个函数公式的运算都是一个不小的负荷,有些上进一点的用户会往Access桌面数据库去进深... 查看详情

华为云算法零门槛:零基础教你ai试伊妆(代码片段)

...构和模型训练方法2、代码解读:拆解妆容迁移代云上、AI开发平台ModelArts实操演练、带你轻松实现一键AI妆容迁移3、学会了这个技能,可以将任何你心仪的妆容一键复制到你的脸上本文会分为以下4个部分进行介绍1.架构讲解2.效... 查看详情

未来照进现实?百度给全球ai开发者的指南针

...超实用工具。深度学习框架飞桨飞桨具备企业版零门槛AI开发平台EasyDL和全功能AI开发平台BML,以及飞桨AIStudio学习与实训社区,不断降低AI的应用门槛。截至2022年12月,飞桨上汇聚了 535万开发者,创建了67万个模... 查看详情

免费gpu:九天•毕昇平台使用教程(代码片段)

...它的pro服务,很容易产生连接不稳定的情况。百度的Aistudio百度的Aistudio每周都能提供几十小时的免费GPU算力,不过缺点是只能采用百度自研的PaddlePaddle框架,终端没有root权限,想装其它框架非常麻烦,而且每... 查看详情

机器学习的入门平台天花板,还可免费实操经典教程,确实也没谁了

...近,我发现有平台干了个更给劲的事。这个平台无偿提供算力不说,还将入门经典「动手学深度学习」放进平台,免费供大家学习和实操,名曰:AmazonSageMakerStudioLab。按介绍说法,该平台基于JupyterLab,... 查看详情

「动手学深度学习」在b站火到没谁,加这个免费实操平台,妥妥天花板!

...近,我发现有平台干了个更给劲的事。这个平台无偿提供算力不说,还将入门经典「动手学深度学习」放进平台,免费供大家学习和实操,名曰:AmazonSageMakerStudioLab。按介绍说法,该平台基于JupyterLab,... 查看详情

「动手学深度学习」在b站火到没谁,加这个免费实操平台,妥妥天花板

...近,我发现有平台干了个更给劲的事。这个平台无偿提供算力不说,还将入门经典「动手学深度学习」放进平台,免费供大家学习和实操,名曰:AmazonSageMakerStudioLab。按介绍说法,该平台基于JupyterLab,... 查看详情

「动手学深度学习」在b站火到没谁,加这个免费实操平台,妥妥天花板

...近,我发现有平台干了个更给劲的事。这个平台无偿提供算力不说,还将入门经典「动手学深度学习」放进平台,免费供大家学习和实操,名曰:AmazonSageMakerStudioLab。按介绍说法,该平台基于JupyterLab,... 查看详情

推荐有什么推荐的免费电子书资源网站?

...;一日不见 | 如隔三秋网址:https://www.d4j.cn/周读:提供免费电子书下载、分享网址:http://ireadweek.com/SoBooks - 优质的kindle电子书资源免费下载网站(原"SoKindle")网址:https://sobooks.cc/IT熊猫-计算机书籍下载网址:https... 查看详情