如果一些从业人员在机器学习领域的专业化方面很有天赋,这对他们来说是非常有利的。例如,具备计算机视觉领域的通才知识是值得赞赏的,但具备关键技术(如姿态估计)方面的专业知识和技能将更能吸引在该领域寻找从业人员的公司和组织。
下面以姿态估计主题为例,指导如何阅读与主题相关的研究论文。
1、 收集针对主题的资源集。资源形式可包括:研究论文、Medium文章、博文、视频、GitHub库等。
谷歌搜索“姿态估计”,将显示包含主题相关信息的一流资源。第一步的目标是整理所有相关资源,如YouTube视频、实施文档以及研究论文。在这一阶段,收集自己认为重要的资源,没有数量限制,但是请确保为有用的论文、视频和文章创建一个“候选名单”。
2、 深入挖掘自己认为与主题相关的资源。记录对于每个候选资源的理解,这一点至关重要。吴恩达建议根据自己对资源的理解程度绘制一个表格,如下所示。
Richmond Alake创建的资源理解等级表
添加到列表中的每篇文章至少要浏览10-20%内容,以确保在已标识的资源中了解到足够多的介绍性内容,并能准确地评估其相关性。
对于已标识更具相关性的论文/资源,建议更深一步理解。最后得到一些自己完全理解的合适资源。
你可能会问自己:“阅读多少论文/资源才够?”
笔者也不知道答案,但是吴恩达知道。
据吴恩达说,理解5-20篇论文即可展现出对主题的基本理解,也许足以推动技术的实施。
阅读50-100篇论文可以很好的理解该领域。
在浏览资源并提取重要信息后,表格可能变成这样:
Richmond Alake创建的资源理解等级表(更新后)
3、 这是笔者观察到的一个快速技巧,在理解研究论文时很有用。该步骤是进行结构性注释,用自己的话总结论文中的关键发现、结果和技术。
下列步骤将集中于如何阅读一篇研究论文。
阅读一篇研究论文
只通读一遍论文内容不能实现理解的目的。吴恩达认为,一次性从头到尾逐字阅读一篇论文并非形成理解的最佳方式。
要想很好的理解内容,至少要将论文通读三遍。
4、 第一遍,阅读文中以下部分:题目、摘要和图片。
5、 第二遍,先阅读以下部分:引言、结论、图片(再次阅览),然后浏览论文剩余部分。
论文的引言和结论部分包含了对文章总体内容清晰简明的介绍和对发现的总结。这几节通常只提供包括关键信息,而无补充信息。作为读者,这是有益的,因为能抓到阅读论文其他部分所需的关键信息。
6、 第三遍,阅读全文,但是跳过所有陌生复杂的数学计算或技术公式。还可跳过不理解或不熟悉的术语和技术。
7、 对某个领域进行深入研究的论文可以多阅读几遍。这些额外遍数将主要专注在对文中数学、技术以及陌生术语的理解。
对于那些通常出于信息和工程目的阅读研究论文的人,深入研究可能是非常耗时的,特别是在还有20篇论文要阅读的时候。
笔者通过介绍LeNet卷积神经网络的原始论文来展开本文的介绍过程,并总结了笔记中的关键内容,然后将其转换为一系列Medium文章。
问自己一些问题
吴恩达提出一套在阅读论文时询问自己的问题。这些问题通常会令读者明白论文中的关键信息。笔者通常使用如下问题,以防止自己偏离理解重要信息的目标。
问题如下:
1、描述论文作者旨在实现,或已经实现的成果。
2、如果论文介绍了一个新方法/技术,它的关键要素是什么?
3、文中哪些内容对你有用?
4、你还想了解什么?