在人工智能与机器学习领域深耕四年后,我积累了许多宝贵的经验,也接触到了大量的学习资源。今天,我想把这些资源分享给大家,希望能帮助那些渴望在 AI 领域有所建树的朋友少走弯路。

我将这些资源分为以下几类:编程与软件工程、数学与统计学、机器学习、深度学习与大语言模型、人工智能工程。
编程与软件工程:AI 大厦的基石
想进入 AI 领域,编程能力与软件工程技能是必备基础。就连 OpenAI 首席技术官 Greg Brockman 也认同这一点,在 AI 领域,除少数特例外,最具影响力的人往往是软件与机器学习都精通的专家。而且,掌握机器学习其实比精通软件工程快得多,所以优秀软件工程师在 AI 领域往往潜力非凡。
在编程语言的选择上,由于 AI 领域较新,其主流语言尚未定型,但 Python 凭借易用性和完善生态仍是首选。当前 AI 岗位多由机器学习领域衍生,Python 是该领域通用语言,短期内这一情况不会改变。不过,最热门的 AI 工程师岗位更接近软件工程而非机器学习工程,因此可能需要掌握 Java/GO/Rust 等后端语言。建议大家从 Python 入门,因为这样更易掌握核心工程原理,但未来可能需要根据实际情况转向其他语言。
尽管市面上关于 Python 的课程和书籍众多,但持续实践才是最佳导师。资源仅能带你入门,真正掌握 Python(或任何语言)必须通过创造与实践。以下是我推荐的一些 Python 与软件工程基础学习资源:
- 《学习 Python — Full Course for Beginners》:这是我的启蒙课,仅 4 小时,半天即可学完,非常适合初学者快速入门。
- 《面向所有人的 Python 专项课程(Python for Everybody Specialization)》:全网最受推崇的体系课程,内容系统全面,想系统学习 Python 的朋友选它准没错。当然,其他正规入门课也可以,关键是要找到适合自己学习节奏的课程。
- Hacker Rank & Leetcode:这两个平台是 Python 面试刷题的好去处。通过大量的练习题,可以帮助你熟悉常见的编程问题和解题思路,提升编程能力和面试技巧。
- NeetCode:它通过实战练习的方式,帮助你学习数据结构、算法与系统设计,涵盖基础到高阶内容,是绝佳的面试备战平台。在这里,你可以将所学的理论知识应用到实际项目中,积累实践经验。
- 《哈佛 CS50 计算机导论(Harvard CS50 Introduction to Computer Science)》:这门课在科技圈无人不晓,堪称最佳计算机科学与软件工程入门课程。强烈推荐给所有初学者,它能帮助你建立起扎实的计算机科学基础,为后续的学习打下坚实的基础。
数学与统计学:理解 AI 模型的钥匙
虽然多数 AI 工作只需部署基础模型,但想成为顶尖从业者,至少要懂模型底层原理。掌握一定的数学与统计学知识,能让你更好地理解和运用 AI 技术。以下这些资源足以满足数学需求,无需另寻他处:
- 《数据科学实用统计学(Practical Statistics for Data Science)》:如果只能选一本统计书,那非它莫属。这本书专为 AI/ML 从业者编写,书中包含了大量的 Python 实战案例,通过实际案例的讲解,能让你轻松理解统计学在数据科学中的应用。
- 《机器学习数学基础(Mathematics for Machine Learning)》:它详细讲解了机器学习与 AI 背后的数学原理,涵盖微积分、线性代数等内容。这本书内容较深,建议重点选读,可将其作为工具书使用,在遇到相关数学问题时随时查阅。
- 《机器学习与数据科学数学基础专项课(Mathematics for Machine Learning and Data Science Specialization)》:这是 DeepLearning.AI 新出品的课程,而 DeepLearning.AI 正是著名机器学习 / 深度学习专项课制作方。该课程专为 AI/ML 设计,是非常好的数学入门课,包含微积分、线性代数、统计概率等核心内容,通过系统的学习,能让你快速掌握机器学习所需的数学基础知识。
机器学习:AI 世界的广阔天地
当前主流 AI 其实指的是生成式 AI(GenAI),属于机器学习分支。GenAI 指生成文本 / 图像 / 音频 / 代码的算法。但 AI 概念早在上世纪 50 年代神经网络诞生时就已存在,甚至可追溯至二战时期艾伦・图灵在计算机与思维机器研究中提出的 “图灵测试”。这说明 AI 远比当今大众的认知更加广阔,要想成为优秀的 AI 从业者,机器学习与传统 AI 的扎实基础不可或缺。
以下资源覆盖了机器学习的核心知识,如果需要时间序列预测 / 强化学习 / 优化算法 / 计算机视觉等进阶内容,后续我可以另行推荐:
- 《Scikit-Learn、Keras 与 TensorFlow 机器学习实战(Hands-On ML with Scikit-Learn, Keras, and TensorFlow)》:如果只能推荐一本书,那必定是这本。它内容惊艳,覆盖全面,末尾还谈到了大语言模型、强化学习与计算机视觉等前沿内容。通过学习这本书,你可以全面掌握机器学习的实战技能。
- 《机器学习专项课(Machine Learning Specialization)》:这是 2020 年我的机器学习启蒙课,堪称史上最佳的机器学习课程。当初我是用 Octave 学习的,现在它已升级为 Python 教学,并新增了推荐系统 / 强化学习等前沿内容。该课程系统全面,从基础概念到实际应用,一步步引导你深入学习机器学习。
- 《百页机器学习宝典(The Hundred-Page ML Book)》:这本书堪称百页浓缩的机器学习精华,是一本轻量级工具书,能帮助你快速查阅核心概念,对基础概念的讲解尤为出色。在你需要快速回顾或查找某个机器学习概念时,它会是你的好帮手。
- 《统计学习导论(The Elements of Statistical Learning)》:这是一本掌握机器学习(本质即统计学习)根基的绝佳教材,真正传授了学科精髓。通过学习这本书,你可以深入理解机器学习的理论基础,为实际应用提供坚实的理论支持。
深度学习与大语言模型:AI 发展的前沿阵地
深度学习是 AI 大类中的子集,属于机器学习分支。当前所有生成式 AI 算法皆源于此,在这里,你会深入理解大语言模型、扩散模型、Transformer 等基础架构的运作原理。以下是一些相关的优质学习资源:
- PyTorch 官方教程(PyTorch Tutorials):深度学习框架必选其一,目前的行业双雄为 PyTorch 与 TensorFlow。建议主攻 PyTorch,因为近年它的势头更劲。2021 年约 77% 研究论文采用这一框架,HuggingFace 平台 92% 模型为其专属。通过学习 PyTorch 官方教程,你可以系统地掌握 PyTorch 框架的使用方法,为深度学习实践打下基础。
- 《深度学习专项课(Deep Learning Specialization)》:这是机器学习专项课的进阶篇,是学习卷积神经网络 / 循环神经网络的优质课程,还包含大语言模型导论,可谓深度学习最佳入门课程之一。通过学习这门课程,你可以深入了解深度学习的核心技术和应用。
- Andrej Karpathy 的(特斯拉前 AI 总监)《大语言模型入门》:这是一个 1 小时的科普视频,讲解 LLM 原理与应用。强烈推荐给所有人,包括非技术背景者,因为它内容宏观易懂,能让你快速对大语言模型有一个基本的认识。
- 《神经网络:从零进阶(Neural Networks: Zero to Hero,作者也是 Andrej Karpathy)》:该课程从零开始教你搭建神经网络,起步节奏平缓,但最终视频将带你亲手构建 GPT 模型,是 AI 从业者的必修课。通过跟随课程一步步实践,你可以深入理解神经网络的原理和构建方法。
- 《动手学大语言模型:语言理解与生成(Hands-On Large Language Models: Language Understanding and Generation)》:由于 LLM 教材稀缺(近年才成主流),但这本书广受好评。它的合著者 Jay Alammar 曾撰写过 Transformer 最佳科普博文,还获得了吴恩达的背书。学习这本书,能让你深入了解大语言模型的语言理解与生成机制。
人工智能工程:将 AI 模型转化为价值
当你全面掌握了 AI(特别是 LLM 与 GenAI)的理论与实践版图后,真正的价值在于将 AI 模型转化为产品。因此,你需要学习算法产品化部署技能,让技术为企业与客户创造价值。多数 AI 岗位其实是 “AI 工程师”,其工作性质更接近传统软件工程而非机器学习工程。核心工作是运用 Llama/GPT-4/Claude 等基础 GenAI 模型开发产品,极少涉及模型开发,主要是因为训练成本过高,且现有的基础模型已足够强大!以下是一些人工智能工程方面的学习资源:
- 《实用 MLOps 指南(Practical MLOps)》:这是模型部署领域唯一的必备书,我主要将其用作工具书。书中内容覆盖容器化 / 脚本编写 / 云系统 / 模型监控等全流程,通过学习这本书,你可以全面掌握模型部署的各个环节和实际操作方法。
- 《人工智能工程实践(AI Engineering)》:这是一本当红教材,作者 Chip Huyen 是生产环境 ML/AI 系统权威专家,也是斯坦福课程主讲人,品质有保证。该书从实践的角度出发,介绍了如何在实际生产环境中应用 AI 技术,帮助你将所学的理论知识转化为实际的工程能力。
学习资源浩如烟海,关键要化繁为简,即刻行动。核心知识体系大同小异,选任何资源都不会错。谨以 AI 领域顶尖研究者 Andrej Karpathy 的推文祝你征程顺利:成为领域专家的秘诀,一是纵向深挖,通过具体项目实践 “按需学习”(拒绝填鸭式横向学习);二是知识反刍,用自己的语言总结 / 传授所学;三是自我超越,只与昨天的自己比较,永远不跟他人攀比。希望大家在 AI 学习的道路上,不断探索,不断进步,最终实现自己的目标。