Что означает градиент. МА

Из школьного курса математики известно, что вектор на плоскости представляет собой направленный отрезок. Его начало и конец имеют по две координаты. Координаты вектора рассчитываются путем вычитания из координат конца координат начала.

Понятие вектора может быть распространено и на n-мерное пространство (вместо двух координат будетnкоординат).

Градиентом gradzфункцииz=f(х 1 , х 2 , …х n) называется вектор частных производных функции в точке, т.е. вектор с координатами.

Можно доказать, что градиент функции характеризует направление наискорейшего роста уровня функции в точке.

Например, для функции z= 2х 1 + х 2 (см. рисунок 5.8) градиент в любой точке будет иметь координаты (2; 1). Построить его на плоскости можно различными способами, взяв в качестве начала вектора любую точку. Например, можно соединить точку (0; 0) с точкой (2; 1), или точку (1; 0) с точкой (3; 1), или точку (0; 3) с точкой (2; 4), или т.п. (см. рисунок 5.8). Все построенные таким образом вектора будут иметь координаты (2 – 0; 1 – 0) = = (3 – 1; 1 – 0) = (2 – 0; 4 – 3) = (2; 1).

Из рисунка 5.8 хорошо видно, что уровень функции растет в направлении градиента, поскольку построенные линии уровня соответствуют значениям уровня 4 > 3 > 2.

Рисунок 5.8 - Градиент функции z= 2х 1 + х 2

Рассмотрим другой пример – функцию z= 1/(х 1 х 2). Градиент этой функции уже не будет всегда одинаковым в разных точках, поскольку его координаты определяются формулами (-1/(х 1 2 х 2); -1/(х 1 х 2 2)).

На рисунке 5.9 представлены линии уровня функцииz= 1/(х 1 х 2) для уровней 2 и 10 (прямая 1/(х 1 х 2) = 2 обозначена пунктиром, а прямая 1/(х 1 х 2) = 10 – сплошной линией).

Рисунок 5.9 - Градиенты функции z= 1/(х 1 х 2) в различных точках

Возьмем, например, точку (0,5; 1) и вычислим градиент в этой точке: (-1/(0,5 2 *1); -1/(0,5*1 2)) = (-4; -2). Заметим, что точка (0,5; 1) лежит на линии уровня 1/(х 1 х 2) = 2, ибоz=f(0,5; 1) = 1/(0,5*1) = 2. Чтобы изобразить вектор (-4; -2) на рисунке 5.9, соединим точку (0,5; 1) с точкой (-3,5; -1), ибо (-3,5 – 0,5; -1 - 1) = (-4; -2).

Возьмем другую точку на той же самой линии уровня, например, точку (1; 0,5) (z=f(1; 0,5) = 1/(0,5*1) = 2). Вычислим градиент в этой точке (-1/(1 2 *0,5); -1/(1*0,5 2)) = (-2; -4). Чтобы изобразить его на рисунке 5.9, соединим точку (1; 0,5) с точкой (-1; -3,5), ибо (-1 - 1; -3,5 - 0,5) = (-2; -4).

Возьмем еще одну точку на той же самой линии уровня, но только теперь в неположительной координатной четверти. Например, точку (-0,5; -1) (z=f(-0,5; -1) = 1/((-1)*(-0,5)) = 2). Градиент в этой точке будет равен (-1/((-0,5) 2 *(-1)); -1/((-0,5)*(-1) 2)) = (4; 2). Изобразим его на рисунке 5.9, соединив точку (-0,5; -1) с точкой (3,5; 1), ибо (3,5 – (-0,5); 1 – (-1)) = (4; 2).

Следует обратить внимание, что во всех трех рассмотренных случаях градиент показывает направление роста уровня функции (в сторону линии уровня 1/(х 1 х 2) = 10 > 2).

Можно доказать, что градиент всегда перпендикулярен линии уровня (поверхности уровня), проходящей через данную точку.

Экстремумы функции многих переменных

Определим понятие экстремума для функции многих переменных.

Функция многих переменных f(X) имеет в точке Х (0) максимум (минимум), если найдется такая окрестность этой точки, что для всех точек Х из этой окрестности выполняются неравенстваf(X)f(X (0)) ().

Если эти неравенства выполняются, как строгие, то экстремум называется сильным , а если нет, тослабым .

Заметим, что определенный таким образом экстремум носит локальный характер, так как эти неравенства выполняются лишь для некоторой окрестности точки экстремума.

Необходимым условием локального экстремума дифференцируемой функции z=f(х 1 , . . ., х n) в точке является равенство нулю всех частных производных первого порядка в этой точке:
.

Точки, в которых выполняются эти равенства, называются стационарными .

По-другому необходимое условие экстремума можно сформулировать так: в точке экстремума градиент равен нулю. Можно доказать и более общее утверждение - в точке экстремума обращаются в ноль производные функции по всем направлениям.

Стационарные точки должны быть подвергнуты дополнительным исследованиям - выполняются ли достаточные условия существования локального экстремума. Для этого определяют знак дифференциала второго порядка. Если при любых , не равных одновременно нулю, он всегда отрицателен (положителен), то функция имеет максимум (минимум). Если может обращаться в ноль не только при нулевых приращениях, то вопрос об экстремуме остается открытым. Если может принимать как положительные, так и отрицательные значения, то экстремума в стационарной точке нет.

В общем случае определение знака дифференциала представляет собой достаточно сложную проблему, которую здесь рассматривать не будем. Для функции двух переменных можно доказать, что если в стационарной точке
, то экстремум присутствует. При этом знак второго дифференциала совпадает со знаком
, т.е. если
, то это максимум, а если
, то это минимум. Если
, то экстремума в этой точке нет, а если
, то вопрос об экстремуме остается открытым.

Пример 1 . Найти экстремумы функции
.

Найдем частные производные методом логарифмического дифференцирования.

ln z = ln 2 + ln (x + y) + ln (1 + xy) – ln (1 + x 2) – ln (1 + y 2)

Аналогично
.

Найдем стационарные точки из системы уравнений:

Таким образом, найдены четыре стационарные точки (1; 1), (1; -1), (-1; 1) и (-1; -1).

Найдем частные производные второго порядка:

ln (z x `) = ln 2 + ln (1 - x 2) -2ln (1 + x 2)

Аналогично
;
.

Так как
, знак выражения
зависит только от
. Отметим, что в обеих этих производных знаменатель всегда положителен, поэтому можно рассматривать только знак числителя,или даже знак выражений х(х 2 – 3)иy(y 2 – 3). Определим его в каждой критической точке и проверим выполнение достаточного условия экстремума.

Для точки (1; 1) получим 1*(1 2 – 3) = -2 < 0. Т.к. произведение двух отрицательных чисел
> 0, а
< 0, в точке (1; 1) можно найти максимум. Он равен
= 2*(1 + 1)*(1 +1*1)/((1 +1 2)*(1 +1 2)) = = 8/4 = 2.

Для точки (1; -1) получим 1*(1 2 – 3) = -2 < 0 и (-1)*((-1) 2 – 3) = 2 > 0. Т.к. произведение этих чисел
< 0, в этой точке экстремума нет. Аналогично можно показать, что нет экстремума в точке (-1; 1).

Для точки (-1; -1) получим (-1)*((-1) 2 – 3) = 2 > 0. Т.к. произведение двух положительных чисел
> 0, а
> 0, в точке (-1; -1) можно найти минимум. Он равен 2*((-1) + (-1))*(1 +(-1)*(-1))/((1 +(-1) 2)*(1 +(-1) 2)) = -8/4 = = -2.

Найти глобальный максимум или минимум (наибольшее или наименьшее значение функции) несколько сложнее, чем локальный экстремум, так как эти значения могут достигаться не только в стационарных точках, но и на границе области определения. Исследовать поведение функции на границе этой области не всегда легко.

Теоретический минимум

Переход от анализа функций одной переменной к анализу функций многих переменных - по крайней мере двух - приводит к значительному
усложнению теории. Помимо прочего теряется наглядность: если функция в общем случае задаёт кривую на плоскости, функция
- поверхность в пространстве, то функции большего числа аргументов уже не допускают подобной геометрической интерпретации.
С другой стороны теоретическое описание функций трёх и большего числа переменных уже принципиально не отличается от описания функций
двух переменных. Поэтому удобно вводить новые понятия именно на основе функций двух переменных, ещё позволяющих наглядно пояснять смысл
нововведений. Так поступим и при определении производной по направлению.

Напомним, что производная функции имеет простой геометрический смысл. Величина в точке равна угловому
коэффициенту касательной к графику этой функции в данной точке. Чем больше этот угловой коэффициент, тем больше угол, который составляет
касательная к графику с осью абсцисс. Чем больше этот угол, тем быстрее меняется функция в малой окрестности рассматриваемой точки. Таким образом,
производная позволяет определять скорость изменения функции.

Теперь обратимся к функции двух переменных. Она, как уже говорилось, определяет поверхность. Выберем точку этой поверхности и зададимся
вопросом о скорости изменения функции в этой точке. Здесь должно быть понятно, что вопрос сформулирован слишком грубо. Когда такой вопрос
ставился в отношении функции одной переменной, то там никаких проблем не было: аргумент мог изменяться только вдоль оси абсцисс. Если же у
функции хотя бы два аргумента, то её изменение определяется уже поведением двух аргументов. В связи с этим в вопрос о скорости изменения
функции следует ввести дополнение, задав направление, в котором будут изменяться её аргументы.

Начнём с частных случаев, а для примера возьмём известную из аналитической геометрии поверхность, которая задаётся уравнением

Поверхность представляет собой т.н. гиперболический параболоид (см. рис. 1).

Исследуем поведение функции в точке и её малой окрестности. Например, рассмотрим изменение этой функции
вдоль оси абсцисс. С геометрической точки зрения мы проводим плоскость ; с точки зрения формальной мы фиксируем один аргумент и
фактически переходим к функции одной переменной. А как исследовать функцию одной переменной известно - для этого существует понятие
производной. В терминологии анализа функций нескольких переменных производная функции по одной переменной при фиксированных остальных -
частная производная. Таким образом, в нашем примере скорость изменения функции в точке в направлении оси абсцисс
позволяет определить частная производная . Более того, мы можем расширить возможности этого инструмента.


Чтобы пояснить это, рассмотрим сечение параболоида плоскостью (см. рис. 2 - там сечение ограничивает вид поверхности сверху).
Это обычная парабола . Эта функция убывает при отрицательных значениях и возрастает при положительных значениях -
если рассматривается изменение функции вдоль оси абсцисс. Но мы можем рассмотреть и изменение функции в направлении, противоположном
направлению оси абсцисс - и тогда всё будет наоборот! При функция будет убывать, а при - возрастать. А частная производная
в данном случае даёт только правильную количественную характеристику скорости изменения функции, но неправильно определяет
характер монотонности. Это говорит о том, что всё-таки одной частной производной в данном случае недостаточно. Тем более что мы ведь
рассмотрели только удобный частный случай. Есть и второй удобный частный случай: рассмотреть изменение функции в направлении оси ординат -
там главную роль будет играть частная производная . Но как исследовать скорость изменения функции в произвольном направлении,
составляющем с осью абсцисс угол ?

Вот для этого и вводится понятие производной по направлению. Строгое определение таково:

Несложно понять его структуру: она полностью аналогична структуре производной функции одной переменной. Действительно, по своей сути
производная - отношение приращения функции к вызвавшему его приращению аргумента. В случае функции одной переменной рассматривается
одна-единственная возможность изменения аргумента - в направлении оси абсцисс. В анализе функций одной переменной это естественное
направление. Когда аргументов становится больше, например, два, то нужно задать изменение аргумента в произвольном направлении.
Именно так и устроены аргументы у первого слагаемого в числителе дроби. Там написано положение точки, смещённой от точки
по прямой, составляющей с осью абсцисс угол . Таким образом, в числителе дроби под пределом написано приращение функции при
смещении в направлении, составляющем с осью абсцисс угол , в знаменателе находится параметр, описывающий величину смещения
аргументов в этом направлении.

Как обычно, по определению считать производную неудобно, поэтому доказывается следующая простая формула:
.
Обратите внимание: если вычисляем производную в направлении оси абсцисс, то , и получается частная производная по переменной .
Если же мы хотим вычислять производную в противоположном направлении, то , и частная производная приобретает знак минус.
При дифференцировании вдоль оси ординат производная по этому направлению совпадает с частной производной по переменной (угол ).

Теперь можно и обобщить на случай трёх аргументов (а там уже будет ясно обобщение на любое число переменных). В трёхмерном случае направление
определяется направляющими косинусами - косинусами углов, которые направление составляет с осями координат.
.

Заметим, что введение направляющего вектора даёт возможность записать производную по направлению в виде
скалярного произведения:
,
где .
Этот вектор называется градиентом функции . Свойства градиента подробнее рассматриваются в векторном анализе. Здесь остановимся
только на его геометрическом смысле, столь важном, например, в физических приложениях. Смысл производной по направлению совпадает
со смыслом производной функции одного аргумента. Величина производной характеризует скорость изменения функции в данной точке
в данном направлении. В каком-то направлении функция может изменяться быстрее, в каком-то медленнее. В направлении самого быстрого
изменения функции производная будет самая большая по модулю. С другой стороны производная по направлению - скалярное произведение
градиента функции и направляющего вектора данного направления:
.
Наибольшего значения это произведение достигает, когда косинус в правой части становится равным единице. А это возможно при
совпадении направления вектора и градиента функции. Следовательно, направление градиента функции и направлении, Таким образом,. переноса тепла. Так как градиент направлен в сторону скорейшего возрастания функции, то градиент, взятый со знаком минус, показывает
направление скорейшего убывания функции. Следовательно, в законе Фурье заложено распространение тепла в направлении скорейшего
убывания температуры.

Градиент (вектор) Градиент (от лат. gradiens, род. падеж gradientis -шагающий), вектор , показывающий направление наискорейшего изменения некоторой величины, значение которой меняется от одной точки пространства к другой (см. Поля теория ). Если величина выражается функцией u (х , у , z ), то составляющие Г. равны ═Г. обозначается знаком grad u . Г. в некоторой точке направлен по нормали к поверхности уровня в этой точке, длина Г. равна Понятием Г. широко пользуются в физике, метеорологии, океанологии и др., чтобы охарактеризовать скорость изменения в пространстве какой-либо величины при перемещении на единицу длины в направлении Г.: например, Г. давления, Г. температуры, Г. влажности, Г. скорости ветра, Г. солёности, Г. плотности морской воды. Г. электрического потенциала называется напряжённостью электрического поля.

Большая советская энциклопедия. - М.: Советская энциклопедия . 1969-1978 .

Смотреть что такое "Градиент (вектор)" в других словарях:

    Вектор Словарь русских синонимов. градиент сущ., кол во синонимов: 2 вектор (5) … Словарь синонимов

    Вектор градиент, вектор градиента … Орфографический словарь-справочник

    градиент - Изменение значения некоторой величины на единицу расстояния в заданном направлении. Топографический градиент — это изменение высоты местности на измеренном по горизонтали расстоянии. }