‹-- Назад
Выпуклые множества и функции
Выше мы дали определение выпуклого множества: напомним, что множество
-- выпуклое, если вместе с любыми двумя точками
множеству
принадлежат все точки
отрезка, соединяющего в пространстве
точку
с точкой
. Заметим, что отрезок, состоящий из точек
, можно параметризовать следующим образом:
Тогда при
будет получаться точка
, при
-- точка
, а при
-- промежуточные точки отрезка, так что обозначения точек отрезка как
будут согласованы с обозначениями его концов.
На следующем рисунке изображены два множества на плоскости
: одно выпуклое, а другое нет.

Выпуклыми в пространстве
Заметим также, что, согласно определению, выпуклы также все одноточечные множества
и пустое множество
.
Доказательство. Пусть точки
и
принадлежат
; тогда обе они принадлежат каждому из множеств
. Значит, если
-- произвольная точка отрезка, соединяющего
и
, то она принадлежит
, поскольку
выпукло. Но так как
для всех
, то
, что и требовалось доказать.
Из этой теоремы следует, например, что прямая в
-мерном пространстве (её можно задать как векторным уравнением:
, где
-- фиксированные векторы, а
-- параметр, так и в виде пересечения гиперплоскостей
) является выпуклым множеством. Действительно, каждая гиперплоскость
-- выпуклое множество.
Проколотая окрестность любой точки
, то есть множество
(
), не является выпуклым. Чтобы показать это, достаточно выбрать любой ненулевой вектор
длины меньше
и рассмотреть точки проколотой окрестности
и
, расположенные симметрично относительно точки
. Тогда середина отрезка, соединяющего
с
, то есть точка
, совпадает с
и, следовательно, не лежит в проколотой окрестности точки
.
Если
, то есть речь идёт о подмножествах прямой
, то выпуклые множества можно описать полностью: это а) пустое множество; б) все одноточечные множества; в) все интервалы вида
(где
может равняться
, а
может равняться
); г) все полуинтервалы вида
(где
может равняться
) и
(где
может равняться
); наконец, д) все отрезки вида
. Никаких других выпуклых множеств на прямой нет.
Напомним изученное в первом семестре определение выпуклой функции одного вещественного переменного.
и вогнутой (или выпуклой кверху), если выполняется неравенство
(То есть функция
В левой части этого неравенства стоит значение функции
в производной точке

Если
Дадим теперь определение выпуклой функции многих переменных.

Функция
Таким образом, функция
вогнута в том и только том случае, когда функция
выпукла.
Выпуклость функции
в
означает, что для любого отрезка
с концами
и
параметризация этого отрезка в виде
задаёт композицию
, являющуюся выпуклой функцией параметра
. Ввиду выпуклости области
, любые точки
и
отрезка
лежат в
, и их снова можно взять в качестве концов отрезка. Поэтому для выпуклости функции
в области
необходимо и достаточно, чтобы неравенство
Если при этом при всех
и
выполняется строгое неравенство
Наконец, функция
называется строго вогнутой, если функция
строго выпукла; это означает выполнение строгого неравенства
Геометрически (в случае
) строгая выпуклость означает, что для любой хорды графика
точки дуги графика с теми же концами, что у хорды, лежащие в вертикальном сечении, проходящем через эту хорду, располагаются ниже точек хорды. Строгая вогутость означает, что в любом вертикальном сечении график проходит выше любого отрезка, соединяющего две точки графика.

Заметим, что понятия выпуклой и вогнутой функций (а также строго выпуклой и строго вогнутой функций) в области
Дадим теперь такое алгебраическое определение.
Заметим, что выражение
можно записать в виде
, где
-- это матрица-строка, равная транспонированному столбцу
. Вообще, верхний левый индекс
мы будем применять для обозначения транспонированной матрицы.
У симметричной матрицы равны друг другу элементы, расположенные симметрично друг другу относительно главной диагонали матрицы.
Если же симметричная матрица
-- положительно определённая, то заданная ею квадратичная форма
является строго выпуклой.
Доказательство. Пусть
и
-- две произвольные точки
и
, где
, -- точка отрезка, соединяющего
с
.
Предположим, что матрица
неотрицательно определена. Элементарные преобразования позволяют записать
в виде
Поскольку матрица
Доказательство строгой выпуклости в случае положительно определённой матрицы проводится с помощью очевидных изменений приведённого доказательства.
Другой пример выпуклой функции даёт линейная функция:
Поскольку функция
, очевидно, также линейна, линейная функция
является одновременно и вогнутой (но не строго вогнутой).
Если о некоторых функциях известно, что они выпуклы в области
, то из них можно сконструировать другие выпуклые функции, используя следующие свойства выпуклых функций.
Доказательство. Пусть
и
, где
. Тогда
что и означает выпуклость функции
Поскольку, как мы доказали выше, квадратичная функция
с неотрицательно определённой матрицей
и линейная функция
выпуклы, то и их сумма, согласно доказанному свойству, -- выпуклая функция. В качестве упражнения докажите, однако, ещё одно утверждение, не вытекающее из теоремы 7.17:
Указание: по сути дела, нужно повторить доказательство теоремы 7.16, с очевидными изменениями.
Доказательство. Пусть снова
и
, где
. Тогда
| (7.11*) | |
| (7.12) |
что и означает выпуклость функции
Доказательство. Пусть снова
и
, где
. Тогда, ввиду того что
, получаем:
Последнее неравенство следует из того, что
Следующие три утверждения остаются читателю для самостоятельного доказательства в качестве упражнения.
Если функции
и
выпуклы в области
, то функция
также выпукла в
.
Если функция
выпукла в области
, а функция одного переменного
выпукла на интервале
, содержащем множество значений функции
при всех
, и
возрастает всюду на интервале
или убывает всюду на
, то композиция
выпукла в
. (Например, если функция
выпукла в
, то функция
также будет выпуклой в
.)
Выпуклые функции интересны такой своей особенностью: они не могут иметь нескольких локальных минимумов с разными значениями.
Сначала дадим такое определение.
Точка
называется точкой локального минимума функции
, если существует такая окрестность
,
, что
при всех
. Если при этом
при всех
, не совпадающих с
, то точка
называется точкой строгого локального минимума. И в том и в другом случае значение
называется локальным минимумом функции
.
Точка
называется точкой локального максимума функции
, если существует такая окрестность
,
, что
при всех
. Если при этом
при всех
, не совпадающих с
, то точка
называется точкой строгого локального максимума. И в том и в другом случае значение
называется локальным максимумом функции
.
любая точка локального максимума функции
Доказательство. Очевидно, что достаточно доказать лишь первое утверждение: второе следует из него сменой знака функции.
Пусть
-- точка локального минимума, а в некоторой другой точке
функция имеет меньшее значение:
. Тогда в точках отрезка, соединяющего
с
, то есть точках
, при всех
значения функции будут меньше, чем в точке
:
Практическая ценность этого утверждения в том, что при поиске наименьшего значения выпуклой функции в области
достаточно найти любую точку локального минимума; во всех остальных точках локального минимуцма (если они существуют) значение функции будет точно такое же. Для невыпуклых функций это, конечно, не так, как видно на следующем рисунке:

Имеет место также следующая
Доказательство. Пусть в двух разных точках
и
функция
принимает одно и то же значение
Поскольку функция строго выпукла, то в точках
, не совпадающих с
и с
, должно выполняться неравенство