读研秘技二:时商与基础误区

everfight everfight     2023-05-01     528

关键词:

一般来说,研究生和本科生阶段是有本质区别的。当然,一年期的那种除外。但对于多数本科生来说,会有定式思维,以为按本科生的学习模式就能顺利完成研究生的学业。其实这里存在一个学习方式的误区,即基础误区。

没经过科研训练的本科生,会想当然地以为必须先把基础知识掌握和巩固好,才好开始切入课题的研究,否则没有把握找到突破口。于是习惯性选择的提升自我能力的方式,是把相关专业的基础书认真看反复看,最好把每本书章节后面的习题也都刷一遍。

这有其好的一面,基础稳固了,在思维逻辑、知识体系上会很严密。然而,对研究生来说,从时商的角度来考虑, 这并不一定是优化且合理的方式。

因为,基础是打不完的。以我相对熟悉的人工智能方向为例,如果要先打基础,学生应该要选择一些经典的教科书来学习,比如早期大家都看的、Duda等的《模式分类》(Pattern Classification) [1],曾经被视为红宝书的、很多人喜欢做书后习题的Bishop的《 模式识别与机器学习》(Pattern Recognition and Machine Learning)[2],再比如在亚马逊平台机器学习销售量第一的、三位斯坦福教授合作写的、统计味十足因而对机器学习有不同视角的《统计学习基础》(第二版)(The Elements of Statistical Learning, 2nd )[3],还有近年来国内绝对畅销的、知识点更全但更精炼的周志华老师的《机器学习》(因封面和样例常用西瓜,俗称西瓜书)[4]。而最近这几年特别受大家追捧的、提出生成对抗网的Ian Goodfellow与2019年图灵奖得主Yoshua Benjio等合写的《深度学习》[5]也似乎也是通向人工智能道路上的“圣经”之一。

如果觉得自己统计和数学基础好,还可以看看Devroye等写的、通篇从泛化界的角度来理解人工智能核心技术的《模式识别的概率理论》(A Probabilistic Theory of Pattern Recognition)[6]。或者读读从博弈论角度切入、不那么强调数据分布假设来诠释人工智能的,Nicolo等写的《预测,学习和博弈》(Prediction, Learning and Games)[7]。而要想了解小样本下的推理机制,也可能还得读读Daphone Koller用她不太纯正的数学表达、还略有些啰嗦写出来的上千页的《概率图模型》(Probabilistic Graphical Model)[8]。

另外,2019年5月初,徐匡迪院士在上海的院士沙龙活动中指出,人工智能不能离开数学[9]。所以,数学方面的一些经典教材也值得读一下。比如现代人工智能中常将数据看成是处在非欧几何空间(注:不精确来说,就是长宽高相互不垂直的弯曲空间),那么总得读两至三本微分几何方面的书吧。如数学大师陈省身与陈维桓合写的《微分几何讲义》[10]、J. R. 曼克勒斯写的《流形上的分析》(Analysis on Manifolds)[11]、或者陈维桓写的进阶版的、多数人可能只能看懂目录的 《微分流形初步》[12]。而算法优化也是推动人工智能前进的必要手段,那斯坦福大学大神Stephen Boyd教授写的《凸优化》(Convex Optimization)[13]也得要熟悉。还有很多值得读的书,就不再赘述了。其它学科和方向我想也差不多,经典的必然随手能列一大箩筐。

但是,如果算下研究生的在校学习时间(硕士三年/博士三年/硕博连读五年),有可能读完这些书时,多数学生快临近毕业了,还是对书本身的内容一知半解,更不用说能形成对前沿的把握了。如果本科基础不好的话,有可能书读不到半程,对科研的兴趣就已经被浇灭了。

那怎么读更适合研究生尤其是三年期甚至更短学制的研究生的定位呢?不妨换个角度,重新定义下基础。个人以为, 基础应该先优先定位在对具体研究方向的前沿把握上,而非对相对笼统的整个领域研究方向的宽泛了解。尤其是在现今研究方向越来越细分、专门化的前提下,并非全部书籍中的知识在研究生期间都会用到。

概言之,是宜以点带面,而不要以面带点。从研究生培养的角度来看,可能这样在时商上更为有效,不会浪费时间,也有利于在研究生期间学有所成。

如何找点呢?最简单的办法是从近期发表的、相关专业的学术期刊或会议论文着手。比如人工智能领域中著名期刊IEEE Transactions on Pattern Analysis and Machine Intelligence和IEEE Transactions on Neural Networks and Learning Systems,以及一些顶会如NeurIPS、 ICML、IJCAI、AAAI等。通常来说,这些期刊和会议上的文章在平均意义上是上档次、有强的创新的,能帮助大家更好了解最前沿的科研水平达到了什么程度。 值得注意的是,现在人工智能处在第三波热潮中,即使顶级会议,论文还是太多,如AAAI2019一次的投稿量都接近上万篇,一篇一篇翻也许很难找到真正想要看的材料。所以,明确选题很关键。

假定选题已经选好,那么可以通过关键词和搜索引擎从好的期刊和会议上寻找相关的论文,尤其是引用次数高的或新鲜出炉的论文更要多加关注。与书籍相比,论文的页数少得多。一篇期刊论文一般在15页以下,会议则更少,6至10页不等。而且好的文章都是浓缩的精华,句句珠玑。

从阅读摘要开始进行初筛,到觉得有内容的进行泛读和进一步的精读,一篇或多篇密切相关的文章读下来,比看书显然更省时间,且能快速了解这一领域的前沿,包括该领域同行在这一方向上已经达到的水平、在此方向上公用的评测手段,以及存在的不足。细读论文,还能知道同行在提出创新工作时是如何针对现在不足来提出改进方法的,如何行文来有理有据的支持其观点或方法的有效性的。有的时候,作者也会分享代码以增加引用率。通过运行这些代码和调试代码中的参数,读者能很快了解文章方法的优势和不足。除此以外,也比较容易针对性的以点带面,即浏览作者撰写的综述部分和提供的参考文献,从文献中形成树状搜索来获得这一领域所需的背景知识、基础、不同视角的观点方法等, 如果在阅读中,发现自己在公式和理论理解上存在障碍或偏差时,再按图索骥的去更基础的教科书或工具书上找答案。通过这种学习模式,最终形成对该研究方向的总体印象,一个点扩张成一个面甚至是一个能支撑这个点的金字塔知识结构,这个塔的底是扎实且具有一定针对性的。我记得我当年考硕士研究生的时候,也采用了这一策略。因为大学毕业后就工作了,有五年时间完全没碰过专业书,以至于数学基本都忘光了,所以为了能通过考研,只好把树状搜索的深度做深一点,当时把初等代数的内容都重新复习了一遍。

回到正题,这样形成的“基础”不仅能让学生对其研究方向有好的前瞻性,也能对方向的诸多问题快速形成深刻认识,在相对短时间内找到突破口。

另外,除了研究方向的针对性强以外,与从书籍来打扎实的基础相比,也许还有一个额外的好处,就是不太容易被教科书中的条条框框束缚。有句俗话说得好,知识越多,思考越难。人类的创新往往都是从犯错开始的,甚至可以等同于是一种犯错。如果过于遵守或相信教科书中的规范准则,其实就容易限制住自己的想象力或想象空间了。所以,我们需要或多或少地避开基础误区。

那如何能形成好的想象力呢?下回分解!

张军平

2019年10月10日写于火车上

参考文献:

  1. Richard O. Duda, Peter E. Hart, David G. Stork. Pattern Classification. Wiley-Interscience, 2000.

  2. Christopher Bishop. Pattern Recognition and Machine Learning. Springer, 2007.

  3. Trevor Hastie, Robert Tibshirani,Jerome Friedman. The Elements of Statistical Learning: Data mining, Inference and Prediction, 2nd edition, Springer, 2009.

  4. 周志华. 机器学习. 清华大学出版社,2016.

  5. Ian Goodfellow, Yoshua Benjio, Aaron Courville. Deep Learning. The MIT Press, 2016

  6. Luc Devroye, Laszlo Gy?rfi, Gabor Lugosi. A Probabilistic Theory of Pattern Recognition. Springer, 1997

  7. Nicolo Cesa-Bianchi, Gabor Lugosi. Prediction, Learning and Games, Cambridge University Press, 2006.

  8. Daphne Koller, Nir Friedman. Probabilistic Graphical Models: Principal and Techniques, The MIT Press, 2009.

  9. 徐匡迪. 中国有多少数学家投入到人工智能的基础算法研究中?上海院士沙龙,2019年5月1日

  10. 陈省身,陈维桓. 微分几何讲义, 北京大学出版社,2001.

  11. James R. Munkres. Analysis on Manifolds, Westview Press, 1997.

  12. 陈维桓. 微分流形初步,高等教育出版社,2001.

  13. Stephen Boyd, Lieven Vandenberghe. Convex Optimization. Cambridge University Press, 2004.

延续阅读:

  1. 读研秘技:你能更优秀(一):时商,从爱多士说起

张军平,复旦大学计算机科学技术学院,教授、博士生导师,中国自动化学会混合智能专委会副主任。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。至今发表论文近100篇,其中IEEE Transactions系列20篇,包括IEEE TPAMI, TNNLS, ToC, TITS, TAC等。学术谷歌引用近3400次,ESI高被引一篇,H指数29.

相关专题:研究生招生与培养
转载本文请联系原作者获取授权,同时请注明本文来自张军平科学网博客。
链接地址:http://blog.sciencenet.cn/blog-3389532-1201475.html

零基础怎么自学java?自学java有什么误区?

...来越多。实际上在学习Java编程之前需要先学习一些编程基础。新手往往无非进行系统的学习,主要原因是自己搜集信息较为零散,学习过程中无专业的老师引导,自己会走进一些学习的误区。那么,新手零基础怎... 查看详情

sh秘技(代码片段)

查看详情

避开这十个坑|自学编程很轻松

...放弃学习。误区三、看到错误心就发慌。误区四、不注重基础。误区五,收藏学习资料和视频而不去学习。误区六、不做实战练习。误区七、输入不输出。误区八、太注重语言本身,不断尝试新语言,喜新厌旧。误区... 查看详情

从零基础到拿到网易java实习offer,我做对了哪些事

 作为一个非科班小白,我在读研期间基本是自学Java,从一开始几乎零基础,只有一点点数据结构和Java方面的基础,到最终获得网易游戏的Java实习offer,我大概用了半年左右的时间。本文将会讲到我在这半年里做对了哪些事... 查看详情

知道用杀毒软件的十大误区吗

...杀毒软件。但是,对病毒和杀毒软件的认识许多人还存在误区。杀毒软件不是万能的,但也绝不是废物。 使用杀毒软件的十大误区误区一:好的杀毒软件可以查杀所有的病毒 误区二:杀毒软件是专门查杀病毒的,木马专... 查看详情

经验分享:自学编程常见的8种误区,初学者快来避坑

...总结一下这几点想法,和大家共勉。误区1:忽略基础,盲目莽进基础知识和基础路线真的非常重要,就以Java领域举例ÿ 查看详情

js秘技——偷梁换柱

让一个对象中的方法都以为自己是另一个对象的方法,可以在调用方法的时候this指向的不是自己这里的这个Tool是给别的对象用的,但是直接用方法那么每次执行的时候需要把别的对象当作参数传进去,就变成普通函... 查看详情

matlab数值计算差商与插值

均差定义若已知函数f(x)f(x)在点x0,x1,...xnx_0,x_1,...x_n处的值f(x0),f(x1),...f(xn).f(x_0),f(x_1),...f(x_n).如果i≠j,i≠j,则一阶均差f[xj,xj+1]=f(xj+1)−f(xj)xj+1−xj(j=0,1,...n−1)f[x_j,x_j+1]=\\fracf(x_j+1)- 查看详情

性能测试注意事项和误区

性能测试注意事项和误区(干货)​​https://zhuanlan.zhihu.com/p/47747734​​ 踏进性能测试的路,踩遍各种性能的坑(性能问题定位分析) Java性能优化指南及唯品会的实战​​https://mp.weixin.qq.com/s/HzTN55r4yCdav6YmF_-Qww​​ 性能... 查看详情

提高自己blog访问量的十七招秘技

...log的访问量呢?下面就教大家十七招提高blog访问量的秘技!虽然说的是如何提高blog的访问量,但是对于个人网页也是通用的哦!好好学习一下:-)  1、尽早申请blog,早申请一天就多一天被点击。比如LoveBNU的blog&#x... 查看详情

真●禁秘技●奥义●终端美化(代码片段)

1概述作为一个程序员,可以没钱,没车,没房,没老婆,没女朋友。但是,一定要有一个漂亮骚气的终端。没错,大骚特骚。说什么大实话。先来看看原生的终端:真漂亮啊。再看看美化过的:这才叫终端嘛。美化过的就是不... 查看详情

关于软件知识存在认识上和方法上的误区

...分。  一个有生命的软件首先必须有一个灵活可扩展的基础架构,其次才是完整的功能。  目前很多人对软件的思想还是焦点落在后者:完整的功能,觉得一个软件功能越完整越好,其实关键还是架构的灵活性,就是前者,... 查看详情

边缘计算的三大误区

...次连接到Internet上,公司也在通过边缘计算改变我们对云基础设施的看法,从而挑战传统架构。事实上,Gartner预计超过40%的企业IT组织将采用边缘计算策略,比去年增加了1%。  在当今世界,边缘计算继续引领行业讨论,由... 查看详情

萌新入职注意事项-没wifi也要看的秘技

萌新入职注意事项-没WIFI也要看的秘技:  新人刚入职的时候是有一个关卡的,必须要迈过这一关,将老大给的东西看出速度,看出深度。什么是看出速度?就是能在短时间内看出一些门道。就算刘翔教你跑步,你也不能... 查看详情

转载使用缓存的9大误区(下)

本文在《使用缓存的9大误区(上)》的基础上继续讨论了使用缓存的几个误区,包括:缓存大量的数据集合,而读取其中一部分;缓存大量具有图结构的对象导致内存浪费;缓存应用程序的配置信息;使用很多不同的键指向相... 查看详情

当今三大技术误区

理清理念,是进步的前提,弄清方向,是走向成功的基础。0.什么是人工智能:“人工”即人为的,人造的。“智能”即智慧+能力的意思,“智”即智慧,思考的意思,“思考”是解决问题的途径,现实中没有任何限制规则,这... 查看详情

「python实用秘技03」导出项目的极简环境依赖(代码片段)

...m/CNFeffery/PythonPracticalSkills❞这是我的系列文章「Python实用秘技」的第3期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个3分钟即可学会的简单小技巧。作为系列第3期,我们即将学习的... 查看详情

研究生学习和工作总结(2021.11.01-2021.11.07)-我在b站读研

...工作繁忙,本期分享延迟了几天,这期的主题是我在b站读研。研究生转眼间到了11月,本月应该有课呀为什么迟迟不见动静?同学们按耐不住已经在群里面问老师了。其实我也很期待想见识一下老师的水平…本周刷了吴恩达机器... 查看详情