我的择业思考:在ai最火的时候来到工业界!

Wang_AI Wang_AI     2023-01-24     446

关键词:

Datawhale干货 

作者:蓝捷,上海交通大学,智子跃迁CTO

大家好,我是蓝捷,2018年硕士毕业到现在,我一直在工业线创业,主要做的方向是智能仓储机器人方向。我们公司叫智子跃迁,我现在是技术负责人。其实很多人会问我,为什么在17、18年AI特别火、资本市场看好、相关工作特别多的时候,会选择了在工业界创业做实体机器人?这个看起来很传统、又很难走的方向。

我觉得还是要想一下,你自己能做什么,想做什么,以及做什么你能赚钱。把这三个结合点找到,就会找到你的方向

对我自己来说,我能做什么?我从 2011 年学到2018 年学了很久的机械机器人,不希望把这些东西全部丢掉,然后转做一个写代码的人。我也并不觉得我跟计算机本专业毕业的这些人比,在竞争优势上我会比他们强多少,因为毕竟时间短。第二个我想做的,其实更多的是希望能够为社会做出一些看得见的效率提升,同时我希望在做这个事情中自己能够成长。最后一个就是养活自己的,需要有个比较可观的收入,最好能有一个财富自由的机会。结合这三点话,我把自己的工作定位在了工业界+机器人。

我当时认为除了我们自己想做的事情以外,一定要考虑外部市场,这个我觉得对各位的择业也是一样。

我毕业时外部市场是怎么样的?首先肯定是 AI 特别火。我毕业的时候,最火的这批企业,比如 AI 四小龙,比如说大的互联网企业BAT,然后还有各种的手机公司华为、 oppo vivo、小米,以及无数的自动驾驶公司。然后还有很多小型的家电创业方向公司都在做AI,都在招算法,开的工资也特别高,非常诱人。

因为我自己比较关注机器人领域,我就在想机器人领域能不能有发展?首先考虑的还不能是这个领域本体的方向,而是要看谁在消费机器人领域。机器人最早是在汽车生产线上发展起来的,生产线上可能能看到非常多的这种工业机械臂。现在这种机械臂其实应用的范围主要就是生产现场,物流现场除了汽车生产线以外,还有很多的手机生产线,也上了机械臂。在 17 到 18 年电商发展很快,物流发展也特别快。

当时的消费需求是很旺盛的,但是我去现场生产现场和物流现场看了之后,发现他们的场景比较落后,主要就是靠人。有大量的人在做这么重复无聊的工作,也没什么能力提高,就是出卖劳动力作为一个螺丝钉。我其实去跟那些企业聊过,问这么多人,人力成本是不是每年也挺高的。他们说对,不止成本高,而且每年越来越招不到人,因为年轻人越来越不愿意去干这个事,所以他们换人的意识在提高,这个市场行情向好。

我们再回过头,看一下机器人本身行业的发展。

机械臂就不说了,这本来就已经挺成熟,已经大规模应用了。那时候轮式机器人用的也比较多,大家现在看得比较多的扫地机器人,包括室外的清扫机器人,甚至是无人驾驶的汽车,广义上其实也是一个轮式机器人。还有一些四足和双足的机器人,如果大家有关注机器人的话,可能会看到一个叫Boston Dynamics的公司,做了一个机械狗叫spot,还有一个人型机器人叫阿特拉斯。有时候我们看到网上视频说机器人在翻跟头、野外跑酷,一般就是他们公司做的。今年小米发布会上发布了一款新的机器狗叫铁蛋,其实就有参考Boston Dynamics公司机械狗spot。这个机械狗机器人没有量产,也没有商业化,因为它太贵了,一个大概要卖 7 万到 8 万美金。但是它确实吸引了特别多的资本,让很多资本看到这个新兴的行业。

这块是不是就完美的符合了我自己的想象?然后当时我就去找,发现其实 工业界+机器人+创业 这个方向本来就有,大多是做一些比较传统的方案机器人。那么加了 AI 之后, AI 给机器人带来什么?我觉得 AI 给机器人主要带来了两个方面的提高,第一个就是复杂规划,就是它能够让机器人本身的效率变得更高。第二个话是它的决策和感知功能可以让机器人更柔性,易用性更强。

举个例子,针对于固定尺寸的箱子,一般机器人就可以完成简单的这种搬运和挪动。但是对于复杂场景比如说物流场景,东西特别多、种类特别杂,大小也完全不一样。这个时候能不能有一个方法让机器人有更强的泛化能力去处理问题呢?那么 AI 是不是能在里面起作用?事实上也有很多企业在做这样的事情。当时我就去了这样一个实习。

这个实习内容是机械里的一个3D视觉的项目,在这个项目里要做的工作就是上面右侧的两个图。当然这个图不是我当时的图,那个其实就是在一个料箱里面有混杂的这些东西,然后它的种类会更多。怎么样把这些东西一件一件的识别出来,再一件件的拣出来。这个用传统的视觉方法是很难做的,AI给它带来了一些可能性,我们当时做也觉得信心特别足。然而做完之后,发现实验室做出来的结果和工程落地的结果差别很大。

首先我在实验室做Demo验证时,我们的训练集、测试集,样本都比较小,实验室的环境也比较单一,没什么噪声。我们当时大概调试了一个月不到,觉得 OK 上线了,实验室的稳定率也挺好的。

后面的现场实际工程发现,有大量的Corner Case ,这些都是之前的训练模型里面体现不出来的。这些Corner Case还包括了大量的噪声,现场环境乱七八糟的,有光照、有污染、有震动,这些东西都会对实际操作产生比较大的影响。还有,我发现当我想要去处理这些问题,用基于规则的一些算法来规避掉Corner Case时,会极大地拉长现场部署时间,成本也很高。因为在现场部署时,花的人力成本是一个高级算法工程师的成本。

终于吭哧吭哧把这个项目做完了,可以验收了,现场的负责人跟我说,你已经做好了这个东西,能不能再帮我改改代码直接上线另外一个东西?我要你两三天就做出来,因为你之前跟我说你的东西泛化能力很强,做完这个马上就能做下一个。我当时愣住了,就觉得这个场景一变,代码的复用率并没有那么高,泛化能力并没有那么强,最终造成的结果就是客户的复购意愿低下。比如说这东西看起来好像可以用,你在真的到实体场景去跟客户面谈的时候,他其实偶尔行不通的。

从那个时候我就开始想,数据驱动的 AI 和以前传统的规则驱动的算法比,到底哪个在工业界更有优势?说实话,我现在这个问题也还在思考。但其实工业界的客户给了我的一个解答,就是低成本解决实际问题才是导向。不管里面用的是啥,把问题解决了,我就满意了。

所以当时我就做了一个很深刻的检讨,机器人+工业界+创业+ AI  的这条路是不是行得通?AI 是不是真的有市场。

后来我看到了一家做 机器人+工业界+创业 的公司,做一种实现拆零分拣环节自动化的机器人,就叫产品A吧。在这之前,拆零分拣播种有两种途径,一种是人工,还有一种自动播种的机械臂工作站。产品A和机械臂要达到相同的效率,成本大概是一样的,各自的特点如图。

我当时问了自己一个问题,说如果我是客户,我会选 A 产品——我们公司做的播种墙,还是选机械臂?我当时觉得自己会选我们的播种墙。所以我当时就决定去我们公司创业,而且把 AI 暂时从我们这边去掉。事实证明我的选择是对的,因为在 19 年把我们公司的产品第一次推向市场,在展会上亮相的时候,我还能看得到有很多公司将机械臂工作站作为方案在展会上亮相,但到了今年第三年了,这些公司都不再做这个方案了,因为他们知道打不过我们,这个方案在商业上不可行。

后面我就在思考:为什么学术前沿的技术会不等于商业?

我们要做什么事情,才能够把一个好的技术算法在工业界推广?我觉得其实是学术界和工业界,考评的指标不太一样。我们简单来看一下这张图。

工业界在意什么呢?客户能够感知到红色的这五部分;后面的橙色的部分,其实是我们厂方能感知到的东西,最后结合红色橙色这八个东西,还要去控制成本。

其实对学术界,以及很多的创业公司来说,更集中于做研发相关的工作,也就是从零开始。他关注的特点是稳定性、高效性和泛用性。觉得这东西只要能做出来就可以了,可能说从 0 到了 0.5 都有点夸张。这部分工作类似于要从山脚到山顶,在中间找到了一条路,就可以发论文了。但是工业界要做的事情,不只是要找到这条路,还要在这条路上去找有没有其他的路,然后在这条路上继续优化,甚至还要在上面盖上水泥路,这才算是一个工业意义上的做完,工业会大量做后面的事情。

这个过程可能花 5 到 10 年,是非常非常长的。如果你真的能把后面这些东西做好,沉淀下来卖的东西会变成什么?就是整个的标准化,公司内部的标准化、流程质量标准化。标准化以后你才能提供给客户一个低价保质保量的产品。然后,如果你的公司真的做到足够好,在行业内做得最强,那么你就可以把你的标准推向你的行业,你的行业标准就是你公司的标准。这其实是很多大企业在做的事情,但这是我们的一个终极目标,就是希望我们把我们的产品做成行业标准。

其实对工业界来说,它真正需要的东西也是标准化。因为没有标准化的东西,对工业来说是价值不大的,因为做的都是单点项目,在工业上铺不开。

我们现在很多工业界的 AI 公司,可能出于融资的考量,在做的事情就是不断做0到1的工作。看招聘网站上的那些 JD,你就会发现给算法岗这种 0 到 1 的岗位加特别多的钱。所以很多的从业者的做法就是,在A企业干完一个0到1的工作,跳到B企业去干0到1,再到C企业去干0到1,一直在干这部分,干的好工资有增长,但是整个行业可能没有变化。这里是需要大量从业的工程师,沉下心来,做一些可以为行业制定标准的事情。

对于企业来说,这样也很难长久发展,我这边讲一个反面教材。这个是一个 AI+零售 的一个企业,他们当时做的一个场景,其实也比较简单,本来用人工的一个识别分类工作,现在希望通过计算机视觉去做,这个事情小,但每年都要花掉相关公司几个亿的成本去做,所以替换的利润空间是很大的。产品的标签大概有两三千种,数量不是很大,场景是室内,也不是特别恶劣。当时我的一个同学进这家公司时,这个事情已经做了大半年了,但是识别正确率停留在85%就是上不去,也不知道为什么。

然后我这个同学进去之后,一开始以为是算法的问题,然后去算法部门看一下,他们算法团队很豪华,都是那种顶尖高校毕业、学术能力强、工程能力也特别强的,出来一个算法,马上就能把它落地实现并且调参。发现其实已经使用了当时最好的模型,然后大概能把这个 85% 的识别率提高到86%、87%,效果也不是很显著。然后马上想到是不是数据没做好,就重新回去看数据。数据标注团队做得也挺好,是按他给的标签去标注的,标注的准确率也不错,应该是不会影响最终的识别率的。

最后,他实在不信邪,说你把那个两千多个标签都给我拿过来,我一个一个去查。查的时候果然发现问题了,是一开始标签就给错了。那标签有什么问题呢?第一,它的颗粒度不够,比如说一瓶可口可乐,很多人可能标的就是“小瓶可口可乐“,”大瓶可口可乐“。但其实我们都知道,小瓶的可口可乐就有 330 毫升的、360毫升的、 380 毫升的,这些东西都不一样。但在标注的时候,都是按同一个标签“小瓶可口乐”去标的,这其实会产生很大的问题。第二个问题是,标注人员也不严谨,同一个标签可能是几个人一起操作的。在标的时候,比如说同一个标签“ 330 毫升可口可乐”,有的人会写成 “330 毫升可乐”,有的人写成 “330 毫升小瓶可口可乐”,有的人写成“可口可乐 330 毫升”,这个都会对最终的结果造成影响。

最后解决了这些问题,用最简单的模型准确率就已经到 90% 了,说明这个并不是技术不行,而是这个流程从一开始就出现了很大的问题,这是个管理问题。

还有另一件事,就是他们拿最好的模型上线之后还要维护,但跑这个模型对性能要求有点高,他们当时在维持这个模型运行过程中也花了很多冤枉钱。我问他当时为什么你不去做一些工程优化,优化以后,维护成本不是能降很多吗?他说他们公司老板不愿意去做这个事情,还是觉得要做一些新的东西,从 0 到 1 做最好。

所以,我感觉算法工程师在公司里干完领导布置的工作外,其实还有很大的空间去帮整个上下游,包括从销售到标注,到软件开发,到算法以后的交付做标化沉淀。算法工程师是这个公司里面可能唯一一批懂得AI怎么用的人,其实是要去帮助其他人用好、用对AI,去帮助企业沉淀这件事情的。也就是说把前面的东西都标准化、流程化,比如说售前方案、数据标准化,开发过程标准化以及交付流程的标准化,否则这些事情全部都会落到算法工程师的头上。你就会看到很多算法部门的人在现场调代码,非常累也非常没有价值,这些东西理应沉淀下来以后,更低成本地做。

在我看来的话,其实工业场景有非常多可以用到 AI 的地方。当然工业场景的数据获得会比互联网代价高很多。因为互联网可能你一次点击,就能获得一批高质量的数据。但在工业现场,你可能得装一批传感器,而且要防止设备造成扰动,还要做数据清洗,这些工作都会抬高数据获得成本。但是在获得数据,有很多工作可以做。

在生产端,你比如说做质量的实时检测、生产排期,然后以及生产设备的故障预测;然后研发端的话,像刚才说的那个设计参数的选择,知识管理以及一些工业用的 AI 工具的开发;供应链方面的话,比如说仓储优化,库存优化,供应商交期规划;维护方面其实也可以做到很多产品故障预测,挖掘客户需求等。

我们公司现在硬件到今年第三年,标准化已经做的差不多了,所以也在计划说我们是不是开始要去做更多的AI工业应用。比如说我们在现场收集到一些数据,是不是可以根据这些数据更好地去优化我们自己的产品,以及更好地维护我们现场设备。因为现在现场的设备都是坏了才去修。其实我们更想知道是能不能通过数据,预测到故障就去直接提前去维修。所以如果各位有志于进入工业界,可以考虑在一个工业的细分领域把你们的从业时间拉长一些。在充分理解这个行业,知道这个行业需要什么之后,可以知道能去做哪些改变。

我这边说的其实也只是一小部分,然后希望能对各位有一些启发。

觉得还不错就给我一个小小的鼓励吧!

380万播放量,也许是全网最火的机器学习视频

不写代码也能搞机器学习?!这是亚马逊云科技在最近亚马逊云科技re:Invent大会上公布的新工具,用于实现无代码可视化机器学习。亚马逊云科技re:Invent大会可谓是云计算行业的“春晚”,IT技术领域风向标级活... 查看详情

yolo_online将深度学习最火的目标检测做成在线服务实战经验分享

YOLO_Online将深度学习最火的目标检测做成在线服务第一次接触YOLO这个目标检测项目的时候,我就在想,怎么样能够封装一下让普通人也能够体验深度学习最火的目标检测项目,不需要关注技术细节,不需要装很多软件。只需要网... 查看详情

cs现在最火的脚本

参考技术AFPS设置==100/200/300。CS脚本是CS(全称:Counter-Strike)的config,就是游戏配置文件,可以修改很多游戏参数,比如按键,操作,画面等等。 查看详情

380万播放量,也许是全网最火的机器学习视频

“秋名山上行人稀,常有车手较高低。如今无人车当道,全是AI老司机。”且问AI老司机表现如何?可灵活转弯,控速自如:可行云流水,沿最优路线过弯:更可多次打圈,绕多少下也不在话下:... 查看详情

380万播放量,也许是全网最火的机器学习视频

“秋名山上行人稀,常有车手较高低。如今无人车当道,全是AI老司机。”且问AI老司机表现如何?可灵活转弯,控速自如:可行云流水,沿最优路线过弯:更可多次打圈,绕多少下也不在话下:... 查看详情

为什么区块链中最火的是游戏与×××?

在全球链圈和币圈面临阶段性调整时,区块链游戏和×××却逆流而上,蓬勃发展。  根据国外Dapprader数据,现有的717个Dapp中,有超过50%是属于游戏类应用。在105个×××类Dapp中,大多也带有游戏属性。Dapprader排名前10的DApp中,... 查看详情

storm:最火的流式处理框架

伴随着信息科技日新月异的发展,信息呈现出爆发式的膨胀,人们获取信息的途径也更加多样、更加便捷,同时对于信息的时效性要求也越来越高。举个搜索场景中的例子,当一个卖家发布了一条宝贝信息时,他希望的当然是这... 查看详情

storm:最火的流式处理框架

伴随着信息科技日新月异的发展,信息呈现出爆发式的膨胀,人们获取信息的途径也更加多样、更加便捷,同时对于信息的时效性要求也越来越高。举个搜索场景中的例子,当一个卖家发布了一条宝贝信息时,他希望的当然是这... 查看详情

详解kafka:大数据开发最火的核心技术

详解Kafka:大数据开发最火的核心技术 架构师技术联盟2019-06-1009:23:51本文共3268个字,预计阅读需要9分钟。广告大数据时代来临,如果你还不知道Kafka那你就真的out了(快速掌握Kafka请参考文章:如何全方位掌握Kafka核心技术)!... 查看详情

stackoverflow最火的一段代码竟然有bug...(代码片段)

某天,我忙中偷闲去StackOverflow上赚声望值。于是,我看到了下面这个问题:怎样将字节数输出成人类可读的格式?也就是说,怎样将123,456,789字节输出成123.5MB?隐含的条件是,结果字符串应当在1~999.9的范围内,后面跟一个适当... 查看详情

storm:最火的流式处理框架

本文出处:www.cnblogs.com/langtianya/p/5199529.html伴随着信息科技日新月异的发展,信息呈现出爆发式的膨胀,人们获取信息的途径也更加多样、更加便捷,同时对于信息的时效性要求也越来越高。举个搜索场景中的例子,当一个卖家... 查看详情

2016年最火的15款html5游戏引擎

...各种基于2D或者3D的场景。作为一名开发者,分析了当下最火爆,最热门的HTML5游戏引擎供大家参考,希望大家也能找到属于自己的那款游戏开发引擎。我在github上面收集了四十多款的HTML5开源游 查看详情

普通程序员如何入门ai

毫无疑问,人工智能是目前整个互联网领域最火的行业,随着AlphaGo战胜世界围棋冠军,以及各种无人驾驶、智能家居项目的布道,人们已经意识到了AI就是下一个风口。当然,程序员是我见过对于新技术最敏感的一个人群,举一... 查看详情

国内最火的htmlcssjavascript开源项目top榜,你知多少?

对于开发者而言,想要着手前端开发,HTML、CSS和JavaScript是三项必备的基础技能。而如何事半功倍地掌握好这些知识?通过了解当下火热的开源项目不乏为最佳学习姿势。本文盘点国内评分最高且收藏量超过100的前端技术开源项... 查看详情

备战一年半,我们让最火的开源网关上了云(代码片段)

【CSDN编者按】本文源于对API7Cloud团队负责人,ApacheAPISIXPMCmember张超的采访。这是关于API7Cloud诞生的故事,一路走来,工程师们如何不畏惧困难,用热爱能化解?接下来,我们将通过本文一探究竟。原文链... 查看详情

stackoverflow最火的一段代码竟然有bug...(代码片段)

某天,我忙中偷闲去StackOverflow上赚声望值。于是,我看到了下面这个问题:怎样将字节数输出成人类可读的格式?也就是说,怎样将123,456,789字节输出成123.5MB?隐含的条件是,结果字符串应当在1~999.9... 查看详情

全网最火的工作流框架flowable完整教程--基本操作(代码片段)

Flowable基本操作1.创建ProcessEngine  创建一个基本的maven工程,可以是Eclipse也可以是其他IDEA。然后添加两个依赖Flowable流程引擎。使我们可以创建一个ProcessEngine流程引擎对象,并访问FlowableAPI。一个是MySQL的数据库驱动在p... 查看详情

目前最火的公司作息表workingtime

数据文章来源于Github仓库WorkingTime,如有侵权,联系删除;想了解更多有趣的信息可关注UrHome公众号WorkerLivesMatter!WorkingTime是由中国民间程序员发起的一个项目,针对目前包括互联网企业在内的各个企业加班... 查看详情