点赞再看,养成习惯,微信公众号搜索【JackCui-AI】关注这个爱发技术干货的程序员。本文 GitHub https://github.com/Jack-Cherish/PythonPark 已收录,有一线大厂面试完整考点、资料以及我的系列文章。
一、前言
各位十一过得如何?
假期,我回了趟老家,文章停更了几天。
写文章以来,被问到最多的问题就是「算法的学习路线」。
今天,它来了。
我会带着大家看看,我们需要学些啥,利用这个假期,我甚至还收集整理了配套视频和资料,暖男石锤啊,这期文章有用的话,别忘三连哦!
二、学习路线
主要分为 4 个部分:数学基础、编程能力、算法基础、实战。
1、数学基础
在机器学习算法中,涉及到最为重要的数学基本知识有两个:线性代数和概率论。
这两也是大学的必修课了,如果知识早已还给老师,也没关系,哪里不会学补哪里。
线性代数研究的是线性空间的性质,数据通常会被表示为欧式空间中的点,而这些点经过一系列变换后会映射到另一个空间,在新的空间中隐藏在数据中的规律才得以显现。
所以线性代数作为研究空间的一门科学,是入门机器学习的最要基础之一。
视频:推荐 MIT 的老教授 Gilbert Strang 的线性代数上课视频。
没学过线代的同学会发现这门课程,讲得清晰而且直观,深入线代的精髓,完全不是那种理论堆砌的讲法,而且老教授幽默风趣,很有人格魅力。
英文不好,也不用担心,字幕是中文的。
教材:推荐《线性代数及其应用》,作者是 David C. Lay 。
喜欢看书的朋友,这本书一定不能错过。
这本书详细地介绍了线性代数在几何学、计算机图形学、经济学、概率论、信号与系统、微分方程等领域的应用,给人以直观的认识。
概率论是研究不确定性的一门科学,生活处处是概率。机器学习算法需要对现实情况建模,自然是少不了将概率论作为工具。
这门课入门并不难,大家可以挑一本评分还可以的书开始学习。
这里推荐陈希儒的《概率论与数理统计》,讲得很详细,如同听一个老者回忆自己的概率与统计心得,相信读者也会有所收获。
如果时间充裕,推荐先学好数学基础。如果时间不够,那就跳过数学基础部分,学算法的时候,哪里不会补哪里。
2、编程能力
编程语言,需要至少掌握两门, Python 和 C++。
工作中,Python 主要用于处理数据、算法调研、模型训练的工作,而 C++ 则是负责工程落地。
算法工程师,需要针对落地场景,对算法的可靠性和实时性等方面进行优化,C++ 工程能力必不可少。
Python 是一门非常友好的编程语言,不但易于入门而且功能强大,在进行机器学习算法开发的过程中会大量使用 Python。
视频:我上学看的第一个视频,就是小甲鱼 Python 课程,风趣幽默,涉及Python 语法基础、网络爬虫、Pygame 飞机大战等内容,内容很丰富。
实战是最好的老师,学习 Python 的时候,可以找一个自己喜欢的方向,去实战。
边实战,边学习。比如写爬虫、做小游戏、玩各种有趣的算法等。
这里面,爬虫是最简单的,很容易有成就感,让你坚持学习下去,下载小说、下载漫画、下载音乐、下载电影、抢票等等小程序。
这个推荐我的一个 Github star 量 11.4k+、fork 4.5k+的爬虫项目。
每个实战,都有对应的文章教程,代码开源。
项目地址:https://github.com/Jack-Cherish/python-spider
教材:推荐《流畅的Python》,书看完有些难度,但是哪来当个手册用,很方便,哪些语法忘记了,翻阅一番,必能有所收获。
C++ 是一种面向对象的程序设计语言,无论你是做算法,还是做开发,亦或者是做测开。C++ 都应该掌握,它是一个基础的编程语言。学会了这门编程语言,再学其它,就会更得心应手。
视频:这部分推荐慕课网的免费教程,很好的入门视频,老师讲得绘声绘色、形象生动、通熟易懂。
一共分为 7 章,每章视频的时间是 2-3 个小时,半个月可以轻松刷完,学习顺序是:
- C++远征之起航篇
- C++远征之离港篇
- C++远征之封装篇(上)
- C++远征之封装篇(下)
- C++远征之继承篇
- C++远征之多态篇
- C++远征之模板篇
教材:推荐被誉为“圣经”的《C++ Primer》,经典巨著,非常棒的书。
编程语言基础学完了,接下来就是数据结构与算法。
数据结构与算法是程序员的内功,每一个工程师的必修课。
数据结构的学法,我推荐是直接看书,一边学习一边刷题,同时进行,这样学的速度快。
就如同书名一样,这是一本像小说一样有趣的算法入门书,非常易懂,强烈推荐。
可以与这本书一同学习的,就是《剑指Offer》,里面讲解了 66 道+ 常见数据结构题,解析思路,简单易懂。
两门书一起看,轻松入门数据结构与算法。
不过《剑指Offer》讲解的代码都是 C/C++,没有 Python 版本,想看 Python 版本的,可以看我整理的教程,C++ 和 Python 都有实现和讲解,题目已按照类型划分好。
项目地址:https://github.com/Jack-Cherish/LeetCode
两本书都看完,题也刷完了,那就算是入门了。
想进阶,进一步学习,直接上 LeetCode。
力扣可以从 HOT 100 或 精选算法 200 题刷起,题目相对于《剑指Offer》要增加一些难度,但每道题目都有对应的解题思路和答案。
坚持刷完 200 道,大多的面试轻松搞定,完全够用。
当然要面试谷歌级别的大佬,Hard 题是不能放过的。
刷题地址:https://leetcode-cn.com/
Tip:刷一遍题,回头看还会忘,不要怀疑自己,要反复刷,反复练习。
3、算法基础
恭喜大家,在做了前面这么多基础工作之后,终于可以开始入门机器学习算法了。
机器学习:
视频:推荐吴恩达老师的机器学习视频,吴恩达是整个领域的巨头之一,学术地位很高。同时,他出的视频也对新手非常友好,入门的不二之选。
教材:还是那句话,光看不练是不行的。《机器学习实战》,理论结合实战,适合新手。
《机器学习实战》使用 Python2 实现,有些细节讲的不够细致,对此我进行了完善,使用 Python3 复现了一遍,并结合 sklearn 以及更多的好玩例子,进行讲解。
全网阅读量 500w+:
对应的 Github 开源代码 Star 3.3k+,fork 3.1k+。
在线阅读地址:
https://cuijiahua.com/blog/ml/
我也将这个系列打包成了本地 pdf,喜欢离线看,也可以直接下载。
深度学习:
深度学习是现在的算法工程师绕不开的一个子领域,是机器学习的子集。
视频:还是推荐吴恩达老师的深度学习视频,也是对新手非常友好。
教材:说实话,深度学习,我并没有看过书,都是视频+ Github 开源项目学习的,不过被誉为深度学习领域圣经的“花书”,可以备一本。
深度学习框架:
深度学习框架有很多,Tensorflow、Pytorch、Paddle、MXNet、Caffe等。
我在工作过程中,用的最多的是 Pytorch,其次是 Tensorflow。
新手上手,推荐先学 Pytorch,可以直接看 Yunjey Choi 大佬的 Github 教程,简单入门:
项目地址:
https://github.com/yunjey/pytorch-tutorial
Pytorch 深度学习框架学习,也可以看我写的 Pytorch 深度学习实战系列教程,有垃圾分类、图像分割等结合实战的小项目。
Github 开源代码 Star 400+,fork 250+。
项目地址:
https://github.com/Jack-Cherish/Deep-Learning
我也将这个系列打包成了本地 pdf,喜欢离线看,也可以直接下载。
4、实战
实战实战,文章反复提到了这么多次,仅仅这些还是远远不够的。
因为更多时候,你是跟着视频 or 文章的思路去实战,这缺少了独立思考的过程。
学了这么多,你并没有独立完成过一个项目,数据怎么处理,怎么分析问题,用什么算法解决问题,也没有独立思考过。
算法工程师的岗位竞争也比较激烈的,为了在茫茫人海中脱颖而出,我们需要以团队或个人的形式,独立完成一些项目,只有这样,你才能更具竞争力。
对于学生党,做项目,最简单直接的方法就是参加竞赛。
推荐两个参加竞赛的地方,一个是国外的 Kaggle,另一个是国内的阿里云天池。
两个竞赛的奖金也都很丰富,根据自己的喜好,参赛即可。
Kaggle:https://www.kaggle.com/
阿里天池:https://tianchi.aliyun.com/competition/gameList/activeList
既能打比赛,又能赢奖金,何乐而不为呢?
三、资料打包
本文提到的资料,我都打包了,可以直接全部打包带走。
这里都是我精心准备点的资料,但是都是外链,CSDN官方提醒这种分享方式也不太合适。
所以大家,需要的话,可以在公众号后台回复【算法学习路线】获取下载地址。
PS:有能力支持正版的,资料觉得不错,可以去购买支持一波正版。
四、絮叨
这篇文章整理的也是我的学习路线。
要说需要学多久,那就看个人的学习动力了。
如果你想去一家不错的公司,但是目前硬实力不过关,我觉得还是有必要去努力一下的,技术能力的高低决定你能走多远,平台的高低,决定你能飞多高。
如果可以通过自己的努力,进入自己心仪的公司,一定不要松懈怠慢,职场成长和学习新技术一样,不进则退。
你往往会发现,身边实力越强的人越努力,最高级的自律就是享受孤独。
创作不易,本期硬核,各位的三连就是 Jack Cui 创作的最大动力,我们下次见!
文章持续更新,可以微信公众号搜索【JackCui-AI】第一时间阅读,本文 GitHub https://github.com/Jack-Cherish/PythonPark 已经收录,有大厂面试完整考点,欢迎Star。