3. 深度学习基础

3. 深度学习基础

从本章开始，我们将探索深度学习的奥秘。作为机器学习的一类，深度学习通常基于神经网络模型逐级表示越来越抽象的概念或模式。我们先从线性回归和 softmax 回归这两种单层神经网络入手，简要介绍机器学习中的基本概念。然后，我们由单层神经网络延伸到多层神经网络，并通过多层感知机引入深度学习模型。在观察和了解了模型的过拟合现象后，我们将介绍深度学习中应对过拟合的常用方法：权重衰减和丢弃法。接着，为了进一步理解深度学习模型训练的本质，我们将详细解释正向传播和反向传播。掌握这两个概念后，我们能更好地认识深度学习中的数值稳定性和初始化的一些问题。最后，我们通过一个深度学习应用案例对本章内容学以致用。

在本章的前几节，我们先介绍单层神经网络：线性回归和softmax回归。

3.1. 线性回归
3.2. 线性回归的从零开始实现
3.3. 线性回归的简洁实现
3.4. softmax回归
3.5. 图像分类数据集（Fashion-MNIST）
3.6. softmax回归的从零开始实现
3.7. softmax回归的简洁实现
3.8. 多层感知机
3.9. 多层感知机的从零开始实现
3.10. 多层感知机的简洁实现
3.11. 模型选择、欠拟合和过拟合
3.12. 权重衰减
3.13. 丢弃法
3.14. 正向传播、反向传播和计算图
3.15. 数值稳定性和模型初始化
3.16. 实战Kaggle比赛：房价预测