负梯度方向-函数值下降最快的方向


将$ f(x_k+\delta)$泰勒级数展开:
$$
\begin{matrix}
f(x_k+\delta)\approx f(x_k)+f^1(x_k) \cdot\delta+1/2f^2(x_k) \cdot\delta^2+…+(1/n!) \cdot f^n(x_k) \cdot\delta^n\
\end{matrix} \tag{1}
$$
因为式(1)中后几项的值相比前几项来说比较小,比如看前三项,将前三项写为矢量形式:

$$
\begin{matrix}
f(x_k+\delta)\approx f(x_k)+ \nabla^Tf(x_k) \cdot\delta+1/2\cdot\delta^T\nabla^2f(x_k) \cdot\delta\
\end{matrix} \tag{2}
$$
看式(2)的前两项,可得:

当 $\delta = \nabla^Tf(x_k)$,也就是对于向量来说,两者方向相同时,$\nabla^Tf(x_k) \cdot\delta$取得最大值。

所以,$\delta$ 选择梯度方向,函数值最快上升;$\delta$ 选择负梯度方向,函数值最快下降。