技术分享之机器学习梯度下降综述

张晓龙 / 2020-10-10

本文是团队内部本人的一个技术分享：机器学习中梯度下降算法综述

背景介绍

在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一。梯度下降法（英语：Gradient descent）是一个一阶最优化算法，通常也称为最速下降法。要使用梯度下降法找到一个函数的局部极小值，必须向函数上当前点对应梯度（或者是近似梯度）的_反方向_的规定步长距离点进行迭代搜索。如果相反地向梯度_正方向_迭代进行搜索，则会接近函数的局部极大值点；这个过程则被称为梯度上升法。

围绕梯度下降法目前有很多的论文发出来，提出了各种的优化，比如动量法、adagrad、adam等等，这些就是我技术分享要讲的。

我的PPT分享

ppt内容

1.梯度下降、及算法家族

2.随机梯度下降、问题和挑战

3.随机梯度下降的优化算法

4.并行和分布式架构

5.随机梯度下降的其他优化方法

分享目的：不同算法的原理和效果展示，帮助在实际问题中更合理的选用梯度下降算法

梯度下降

无约束优化问题时,一阶最优化算法，通常也称为最速下降法

目标函数J(θ)的局部最小值，向函数上当前点对应梯度（或者是近似梯度）的反方向（-∇θJ(θ) ）的规定步长距离点进行迭代搜索

梯度下降法家族

Batch gradient descent