常见深度学习算法

MLP
CNN
RNN
LSTM
Transformer

CNN

让我们通过一些基本的公式来更深入地理解卷积神经网络（CNN）的工作原理。

卷积操作是CNN的核心，其公式可以表示为：
$输出 (i, j) = \sum_{m} \sum_{n} 输入 (i + m, j + n) \times 卷积核 (m, n)$
其中， $输入$ 是输入图像或特征图， $卷积核$ 是学习到的滤波器， $m, n$ 是卷积核的尺寸

ReLU（Rectified Linear Unit）是一种常用的激活函数，其公式简单：
$ReLU (x) = max (0, x)$
这意味着如果输入$x $是正数，就直接输出，如果是负数，则输出0。

池化通常有两种类型：最大池化和平均池化。

最大池化：输出区域内最大值。
$输出 (i, j) = max_{m, n \in 窗口} 输入 (i + m, j + n)$
平均池化：输出区域内的平均值。
$输出 (i, j) = \frac{1}{M \times N} \sum_{m, n} 输入 (i + m, j + n)$
其中， $M \times N$ 是池化窗口的大小。

在全连接层，每个输入节点都连接到每个输出节点，其公式可以表示为：
${输出}_{i} = \sum_{j} ({权重}_{i j} \times {输入}_{j}) + {偏置}_{i}$

在分类任务中，通常在最后一个全连接层后使用softmax函数来计算概率分布：
$softmax (x_{i}) = \frac{e^{x_{i}}}{\sum_{j} e^{x_{j}}}$
这里，$x_i $是第$ i $个类别的输出分数，softmax函数确保所有类别的输出概率总和为1。

损失函数：如交叉熵损失，用于分类问题。
$交叉熵损失 = - \sum_{i} {真实标签}_{i} \log ({预测概率}_{i})$
优化算法：如SGD，更新参数以最小化损失。
$参数更新 : 参数 = 参数 - 学习率 \times 梯度$
通过这些公式，CNN学习从输入数据中提取有用的特征，并使用这些特征进行有效的分类或其他任务。