Финансы. Бизнес. Недвижимость. Услуги. Страхование. Вопросы

Финансы. Бизнес. Недвижимость. Услуги. Страхование. Вопросы

» » Критерий сэвиджа пример решения. Порядок применения критерия сэвиджа. Принятие управленческих решений в условиях риска и неопределенности

Критерий сэвиджа пример решения. Порядок применения критерия сэвиджа. Принятие управленческих решений в условиях риска и неопределенности

Наиболее просто решается задача о выборе решения в условиях неопределенности, когда нам хотя и неизвестны условия выполнения операции (состояние природы) но известны их вероятности:

В этом случае в качестве показателя эффективности, который мы стремимся обратить в максимум, естественно взять среднее значение, или математическое ожидание выигрыша, с учетом вероятностей всех возможных условий.

Обозначим это среднее значение для стратегии игрока через

или, короче,

Очевидно, есть не что иное, как взвешенное среднее выигрышей строки, взятых с кесами . В качестве оптимальной стратегии естественно выбрать ту из стратегий для которой величина обращается в максимум.

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Пример 1. Планируется операция в заранее неизвестных метеорологических условиях; варианты этих условий: Согласно материалам метеосводок за много лет частоты (вероятности) этих вариантов равны соответственно:

Возможные варианты организации операции в различных метеоусловиях приносят различную выгоду. Значения «дохода» для каждого решения в разные условиях приведены в табл. 13.1

Таблица 13.1

В последней строке даны вероятности условий. Средние выигрыши приведены в последнем столбце. Из него видно, что оптимальной стратегией игрока является его стратегия дающая средний выигрыш (отмечен звездочкой).

При выборе оптимальной стратегии в неизвестных условиях с известными вероятностями можно пользоваться не только средним выигрышем

но и средним риском

который, разумеется, нужно обратить не в максимум, а в минимум.

Покажем, что стратегия, максимизирующая средний выигрыш совпадает со стратегией, минимизирующей средний риск Вычислим оба эти показателя и сложим их:

(13.2)

Эта сумма (среднее взвешенное значение максимумов столбцов) для данной матрицы есть величина постоянная; Обозначим ее С:

откуда средний риск равен

Очевидно, эта величина обращается в минимум тогда же, когда а, - в максимум, следовательно, стратегия, выбранная из условий минимального среднего риска, совпадает со стратегией, выбранной из условий максимального среднего выигрыша.

Заметим, что в случае, когда известны вероятности состояний природы при решении игры с природой всегда можно обойтись одними чистыми стратегиями, не применяя смешанных. Действительно, если мы будем применять какую-то смешанную стратегию

т. е. стратегию с вероятностью стратегию с вероятностью и т. д., то наш средний выигрыш, осредненный и по условиям (состояниям природы) и по нашим стратегиям, будет:

Это - взвешенное среднее выигрышей соответствующих нашим чистым стратегиям.

Но ясно, что любое среднее не может превосходить максимальной из осредняемых величин:

Поэтому применение смешанной стратегии с любыми вероятностями не может быть выгоднее для игрока, чем применение чистой стратегии .

Вероятности условий (состояний природы) могут быть определены из статистических данных, связанных с многократным выполнением подобных операций или просто с проведением наблюдений над состояниями природы. Например, если железной дороге за данный промежуток времени предстоит выполнить не вполне известный объем перевозок, то данные о распределении условий могут быть взяты из опыта прошлых лет. Если, как в предыдущем примере, успех операции зависит от метеоусловий, данные о них могут быть взяты из статистики метеосводок.

Однако часто встречаются случаи, когда, приступая к выполнению операции, мы не имеем представления о вероятностях состояний природы; все наши сведения сводятся к перечню вариантов состояний, а оценить их вероятности мы не можем. Так, например, вряд ли нам удастся разумно оценить вероятность того, что в течение ближайших k лет будет предложено и реализовано важное техническое изобретение.

Разумеется, в подобных случаях вероятности условий (состояний природы) могут быть оценены субъективно: некоторые из них представляются нам более, а другие - менее правдоподобными. Для того чтобы наши субъективные представления о большей или меньшей «правдоподобности» той или другой гипотезы превратить в численные оценки, могут применяться различные технические приемы. Так, если мы не можем предпочесть ни одной гипотезы, если они все для нас равноправны, то естественно назначить их вероятности равными друг другу:

Это - так называемый «принцип недостаточного основания» Лапласа. Другой часто встречающийся случай - когда мы имеем представление о том, какие условия более вероятны, а какие - менее, т. е. можем расположить имеющиеся гипотезы в порядке убывания их правдоподобности: всего правдоподобнее первая гипотеза (ПО, затем вторая ) менее всего правдоподобна гипотеза (). Однако, насколько одна из них вероятнее другой - мы не знаем. В этом случае можно, например, назначить вероятности гипотез пропорциональными членам убывающей арифметической прогрессии:

или, учитывая, что

Иногда удается, исходя из опыта и здравого смысла, оценить и более тонкие различия между степенями правдоподобия гипотез.

Подобные методы субъективной оценки «вероятности-правдоподобности» разных гипотез о состоянии природы могут иногда помочь при выборе решения. Однако нельзя забывать, что «оптимальное решени выбранное на основе субъективных вероятностей, неизбежно окажется тоже субъективным. Степень субъективности решения можно уменьшить, если вместо вероятностей назначенных произвольно одним лицом, ввести средние из таких вероятностей, назначенных, независимо друг от друга, группой квалифицированных лиц («экспертов»). Метод опроса экспертов вообще широко применяется в современной науке, когда речь идет об оценке неопределенной ситуации (например, в футурологии). Опыт применения подобных методов учит, что зачастую оценки экспертов (принятые независимо одним от другого) оказываются далеко не столь разноречивыми, как это можно было предположить заранее, и вывести из них некоторые предпосылки для принятия разумного решения вполне возможно.

Выше мы осветили вопрос о выборе решения на основе объективно вычисленных или субъективно назначенных вероятностей состояний природы. Этот подход в теории решений - не единственный. Кроме него существуют еще несколько «критериев» или подходов к выбору оптимального решения в условиях неопределенности. Остановимся на некоторых из них.

1. Максиминный критерий Вальда

Согласно этому критерию в качестве оптимальной выбирается та стратегия игрока А, при которой минимальный выигрыш максимален, т. е. стратегия, гарантирующая при любых условиях выигрыш, не меньший, чем максимин:

(13.4)

Если руководствоваться этим критерием, надо всегда ориентироваться на худшие условия и выбирать ту стратегию, Для которой в худших условиях выигрыш максимален. Пользуясь таким критерием в играх с природой, мы как бы ставим взамен этой безличной и незаинтересованной инстанции активного и злонамеренного противника. Очевидно, такой подход может быть продиктован только крайним пессимизмом в оценке обстановки - «всегда надо рассчитывать на худшее!» - но как один из возможных подходов заслуживает рассмотрения.

2. Критерий минимаксного риска Сэвиджа

Сущность этого критерия в том, чтобы любыми путями избежать большого риска при принятии решения.

Критерий Сэвиджа, так же как и критерий Вальда - это критерий крайнего пессимизма, но только пессимизм здесь понимается по-другому: худшим объявляется не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, чего можно было бы достичь в данных условиях (максимальный риск).

3. Критерий пессимизма-оптимизма Гурвица

Этот критерий рекомендует в условиях неопределенности при выборе решения не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее!) ни крайним, легкомысленным оптимизмом (все обойдется наилучшим образом!) Критерий Гурвица имеет вид:

где - коэффициент, выбираемый между нулем и единицей.

Проанализируем структуру выражения (13.6). При критерий Гурвица превращается в пессимистический критерий Вальда, а при - в критерий «крайнего оптимизма», рекомендующий выбирать ту стратегию, для которой в наилучших условиях выигрыш максимален. При получается нечто среднее между крайним пессимизмом и крайним оптимизмом (коэффициент и выражает как бы «меру пессимизма» исследователя). Этот коэффициент выбирается из субъективных соображений - чем опаснее ситуация, чем больше мы хотим в ней «подстраховаться», тем ближе к единице выбирается и.

При желании можно построить критерий, аналогичный критерию оптимизма-пессимизма Гурвица исходя не из выигрыша, а из риска, как в критерии Сэвиджа, но мы на этом не будем останавливаться.

Несмотря на то, что выбор критерия, как и выбор параметра в критерии Гурвица, являются субъективным, все же может оказаться полезным просмотреть ситуацию с точки зрения этих критериев. Если рекомендации, вытекающие из различных критериев, совпадают - тем лучше, можно смело выбирать рекомендуемое ими решение. Если же, как это часто бывает, рекомендации противоречат друг другу - всегда имеет смысл задуматься над этим и принять окончательное решение с учетом его сильных и слабых сторон. Анализ матрицы игры с природой под углом зрения разных критериев часто дает лучшее представление о ситуации, о достоинствах и недостатках каждого решения, чем непосредственное рассмотрение матрицы, особенно, когда ее размеры велики.

Пример 2. Рассматривается игра с природой 4X3 с четырьмя стратегиями игрока: и тремя вариантами условий (состояний природы): Матрица выигрышей дана в табл. 13.2.

Таблица 13.2

Найти оптимальное решение (стратегию), пользуясь критериями Вальда, Сэвиджа и критерием Гурвица при

Решение. 1. Критерий Вальда.

В каждой строке матрицы берем наименьший выигрыш (табл. 13.3).

Из величин максимальная (отмечена звездочкой) равна 0,25, следовательно, по критерию Вальда оптимальной является стратегия

2. Критерий Сэвиджа.

Строим матрицу рисков и помещаем в правом добавочном столбце максимальный риск в каждой строке (табл. 13.4).

Минимальным из значений является 0,60 (отмечено звездочкой); следовательно, по критерию Сэвиджа, оптимальной является любая из стратегий

Таблица 13.3

3. Критерий Гурвица

Записываем в правых трех столбцах матрицы (табл. 13 5) «пессимистическую» оценку выигрыша «оптимистическую» а); и их среднее взвешенное по формуле (13.6):

Максимальное значение (отмечено звездочкой) соответствует стратегии Следовательно, по критерию Гурвица с легким перевесом в сторону пессимизма оптимальной стратегией является Таким образом, все три критерия согласно говорят в пользу стратегии которую мы имеем все основания выбрать.(минимум берется по всем Найти этот минимакс (или максимин в критерии Вальда) можно обычными методами линейного программирования. Могут быть случаи, когда применение смешанных стратегий при пользовании критериями Вальда, Сэвиджа, Гурвица даст преимущество по сравнению с тем решением, где применяются одни чистые стратегии, однако мы будем рассматривать эти критерии только для чистых стратегий.

Одна из причин этого - в том, что мы хотим избежать сложных вычислений, когда их результат может быть сведен на нет недостатком сведений о ситуации (незнание вероятностей условий). Другая, более важная причина - в том, что основное содержание теории статистических решений (мы коснемся его в следующем параграфе) - это планирование получения и использования дополнительной информации о состоянии природы, которую можно добыть путем эксперимента. Исследования показывают, что в типичных случаях, когда речь идет о получении сколько-нибудь значительного количества дополнительной информации, критерии, не пользующиеся вероятностями состояний (Вальда и др.), становятся практически равносильными критерию, основанному на вероятностях состояний. Но мы знаем, что при пользовании таким критерием применение смешанных стратегий не имеет смысла; стало быть, если мы можем получить сколько-нибудь много дополнительной информации, применение смешанных стратегий теряет смысл (каким бы из критериев выбора решения мы ни пользовались). Если же мы не можем, производя эксперименты, добывать новую информацию, то различные критерии могут давать противоречащие друг другу рекомендации, как мы видели в примере 3.


Критерий Сэвиджа был предложен Леонард Джимми Сэвиджем в 1954 году.

Суть этого критерия заключается в нахождении минимального риска. При выборе решения по этому критерию сначала матрице функции полезности (эффективности) сопоставляется матрица сожалений

элементы которой отражают убытки от ошибочного действия, т.е. выгоду, упущенную в результате принятия i-го решения в j-м состоянии. Затем по матрице D выбирается решение по пессимистическому критерию Вальда, дающее наименьшее значение максимального сожаления.

Условиями неопределённости считается ситуация, когда последствия принимаемых решений неизвестны, и можно лишь приблизительно их оценить. Для принятия решения используются различные критерии, задача которых - найти наилучшее решение максимизирующее возможную прибыль и минимизирующее возможный убыток.

Критерий заключается в следующем:

  1. Строится матрица стратегий (платёжная матрица). Столбцы соответствуют возможным исходам. Строки соответствуют выбираемым стратегиям. В ячейки записывается ожидаемый результат при данном исходе и при данной выбранной стратегии.
  2. Строится матрица сожаления (матрица рисков). В ячейках матрицы величина сожаления - разница между максимальным результатом при данном исходе (максимальном числе в данном столбце) и результатом при выбранной стратегии. Сожаление показывает величину, теряемую при принятии неверного решения.
  3. Минимаксное решение соответствует стратегии, при которой максимальное сожаление минимально. Для этого для каждой стратегии (в каждой строке) ищут максимальную величину сожаления. И выбирают то решение (строку), максимальное сожаление которого минимально.

Для нашего примера отыскиваем матрицу D, вычитая (-121) из первого столбца матрицы полезности, 62 из второго и т.д.

Наибольшее значение среди минимальных элементов строк здесь равно max [-405.75, -270.5, -135.25, -143.25] = -135.25 млн.руб. и, покупая 40 станков, мы уверены, что в худшем случае убытки не превысят 135.25 млн.руб.

Таким образом, различные критерии приводят к различным выводам:

1) по критерию Лапласа приобретать 40 станков,

2) по критерию Вальда - 20 станков,

3) по критерию Гурвица - 20 при пессимистическом настроении и 50 в состоянии полного оптимизма,

4) по критерию Сэвиджа - 40 станков.

Возможность выбора критерия дает свободу лицам, принимающим экономические решения, при условии, что они располагают достаточными средствами для постановки подобной задачи. Всякий критерий должен согласовываться с намерениями решающего задачу и соответствовать его характеру, знаниям и убеждениям.

Существует обширная литература по теории игр и статистических решений.



37. Методы принятия инвестиционно-финансовых решений в условиях определенно­сти.

Это самый простой случай: известно количество возможных ситуаций (вариантов) и их исходы. Нужно выбрать один из возможных вариантов. Степень сложности процедуры выбора в данном случае определяется лишь количеством альтернативных вариантов. Рассмотрим две возможные ситуации:

а) Имеется два возможных варианта. В данном случае аналитик должен выбрать (или рекомендовать к выбору) один из двух возможных вариантов. Последовательность действий следующая:

Определяется критерий, по которому будет делаться выбор;

Методом «прямого счета» исчисляются значения критерия для сравниваемых вариантов;

Возможны различные методы решения этой задачи. Как правило, они подразделяются на две группы:

Методы, основанные на дисконтированных оценках;

Методы, основанные на учетных оценках.

Первая группа методов основывается на следующей идее. Денежные доходы, поступающие на предприятие в различные моменты времени, не должны суммироваться непосредственно; можно суммировать лишь элементы приведенного потока. Если обозначить F1,F2,....,Fn коэффициент дисконтирования прогнозируемый денежный поток по годам, то i-й элемент приведенного денежного потока Рi рассчитывается по формуле:

P i = F i / (1+ r) i

где r- коэфициент дисконтирования.

Назначение коэффициента дисконтирования состоит во временной упорядоченности будущих денежных поступлений (доходов) и приведении их к текущему моменту времени. Экономический смысл этого представления в следующем: значимость прогнозируемой величины денежных поступлений через i лет (Fi) с позиции текущего момента будет меньше или равна Pi. Это означает так же, что для инвестора сумма Pi в данный момент времени и сумма Fi через i лет одинаковы по своей ценности. Используя эту формулу, можно приводить в сопоставимый вид оценку будущих доходов, ожидаемых к поступлению в течении ряда лет. В этом случае коэффициент дисконтирования численно равен процентной ставке, устанавливаемой инвестором, т.е. тому относительному размеру дохода, который инвестор хочет или может получить на инвестируемый им капитал.



Итак последовательность действий аналитика такова (расчеты выполняются для каждого альтернативного варианта):

Рассчитывается величина требуемых инвестиций (экспертная оценка), IC;

Устанавливается значение коэффициента дисконтирования, r;

Определяются элементы приведенного потока, Pi;

Рассчитывается чистый приведенный эффект (NPV) по формуле: NPV=E*Pi-IC

Сравниваются значения NPV;

Предпочтение отдается тому варианту, который имеет больший NPV (отрицательное значение NPV свидетельствует об экономической нецелесообразности данного варианта).

Вторая группа методов продолжает использование в расчетах прогнозных значений F. Один из самых простых методов этой группы - расчет срока окупаемости инвестиции.Последовательность действий аналитика в этом случае такова:

Расчитывается величина требуемых инвестиций, IC;

Оценивается прибыль (денежные поступления) по годам, Fi;

Выбирается тот вариант, кумулятивная прибыль по которому за меньшее число лет окупит сделанные инвестиции.

б) Число альтернативных вариантов больше двух. Процедурная сторона анализа существенно усложняется из-за множественности вариантов, техника «прямого счета» в этом случае практически не применима. Наиболее удобный вычислительный аппарат - методы оптимального программирования (в данном случае этот термин означает «планирование»). Этих методов много (линейное, нелинейное, динамическое и пр.), но на практике в экономических исследованиях относительную известность получило лишь линейное программирование. В частности рассмотрим транспортную задачу как пример выбора оптимального варианта из набора альтернативных. Суть задачи состоит в следующем.

Имеется n пунктов производства некоторой продукции (а1,а2,...,аn) и k пунктов ее потребления (b1,b2,....,bk), где ai - объем выпуска продукции i - го пункта производства, bj - объем потребления j - го пункта потребления. Рассматривается наиболее простая, так называемая “закрытая задача ”, когда суммарные объемы производства и потребления равны. Пусть cij - затраты на перевозку единицы продукции. Требуется найти наиболее рациональную схему прикрепления поставщиков к потребителям, минимизирующую суммарные затраты по транспортировке продукции. Очевидно, что число альтернативных вариантов здесь может быть очень большим, что исключает применение метода “ прямого счета ”. Итак необходимо решить следующую задачу:

ΣΣCg Xg→ min

Σ Xg = bj Σ Xg = bj Xg→ 0

Известны различные способы решения этой задачи -распределительный метод потенциалов и др. Как правило для расчетов применяется ЭВМ.

При проведении анализа в условиях определенности могут успешно применяться методы машинной имитации, предполагающие множественные расчеты на ЭВМ. В этом случае строится имитационная модель объекта или процесса (компьютерная программа), содержащая b-е число факторов и переменных, значения которых в разных комбинациях подвергается варьированию. Таким образом машинная имитация - это эксперимент, но не в реальных, а в искусственных условиях. По результатам этого эксперимента отбирается один или несколько вариантов, являющихся базовыми для принятия окончательного решения на основе дополнительных формальных и неформальных критериев.

Краткая теория

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под природой будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений.

Управление любым объектом осуществляется путем принятия последовательности управленческих решений. Для принятия решения необходима информация (совокупность сведений о состоянии объекта управления и условиях его работы). В тех случаях когда отсутствует достаточно полная информация, возникает неопределенность в принятии решения. Причины этого могут быть различны: требующаяся для полного обоснования решения информация принципиально не может быть получена (неустранимая неопределенность); информация не может быть получена своевременно, к моменту принятия решения; затраты, связанные с получением информации, слишком высоки. По мере совершенствования средств сбора, передачи и обработки информации неопределенность управленческих решении будет уменьшаться. К этому нужно стремиться. Существование неустранимой неопределенности связано со случайным характером многих явлений. Например, в торговле, случайный характер изменения спроса делает невозможным его точное прогнозирование, a, следовательно, и формирование идеально точного заказа на поставку товара. Принятие решения в этом случае связано с риском. Приемка партии товара на основании выборочного контроля также связана с риском принятия решения в условиях неопределенности. Неопределенность может быть снята путем полного контроля всей партии, однако это может оказаться слишком дорогостоящим мероприятием. В сельском хозяйстве, например, с целью получения урожая человек предпринимает ряд действии (пашет землю, вносит удобрения, борется с сорняками и т. п.). Окончательный результат (урожай) зависит от действий не только человека, но и природы (дождь, засуха, вечер и т. п.). Из приведенных примеров видно, что полностью исключить неопределенность в управлении экономической системой нельзя, хотя, повторим, к этому нужно стремиться. В каждом конкретном случае следует принимать во внимание степень риска при принятии управленческих решений, по возможности максимально учитывать имеющуюся информацию с целью уменьшения неблагоприятных последствий, которые могут возникнуть из-за ошибочных решений.

Две стороны, участвующие в игре, будем называть игрок I и игрок II. Каждый из игроков располагает конечным набором действий (чистых стратегий), которые он может применять в процессе игры. Игра имеет повторяющийся, циклический характер. о каждом цикле игроки выбирают одну из своих стратегии, что однозначно определяет платеж . Интересы игроков противоположны. Игрок I старается вести игру так, чтобы платежи были как можно большими. Для игрока II желательны как можно меньшие значения платежей (с учетом знака). Причем в каждом цикле выигрыш одного из игроков в точности совпадает с проигрышем другого. Игры такого типа называются играми с нулевой суммой.

Решить игру - значит определить оптимальное поведение игроков. Решение игр является предметом теории игр. Оптимальное поведение игрока инвариантно относительно изменения всех элементов платежной матрицы на некоторую величину.

В общем случае определение оптимального поведения игроков связано с решением двойственной пары задач линейного программирования. В отдельных случаях могут быть использованы более простые методы. Часто платежную матрицу удается упростить путем удаления из нее строк и столбцов, соответствующих доминируемым стратегиям игроков, доминируемой называется стратегия, все платежи которой не лучше соответствующих платежей некоторой другой стратегии и хотя бы один из платежей хуже соответствующего платежа этой другой стратегии, называемой доминирующей.

В обычной стратегической игре принимают участие «разумные и антагонистические» противники (противоборствующие стороны). В таких играх каждая из сторон предпринимает именно те действия, которые наиболее выгодны ей и менее выгодны противнику. Однако очень часто неопределенность, сопровождающая некоторую операцию, не связана с сознательным противодействием противника, а зависит от некой, не известной игроку I объективной действительности (природы). Такого рода ситуации принято называть играми с природой. Игрок II - природа - в теории статистических игр не является разумным игроком, так как рассматривается как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Возможные состояния природы (ее стратегии) реализуются случайным образом. В исследовании операций оперирующую сторону (игрока I) часто называют статистиком, а сами операции - играми статистика с природой или статистическими играми.

Рассмотрим игровую постановку задачи принятия решения в условиях неопределенности. Пусть оперирующей стороне необходимо выполнить операцию в недостаточно известной обстановке относительно состояний которой можно сделать предположений. Эти предположения будем рассматривать как стратегии природы. Оперирующая сторона в своем распоряжении имеет возможных стратегий - . Выигрыши игрока I при каждой паре стратегий и - предполагаются известными и заданы платежной матрицей .

Задача заключается в определении такой стратегии (чистой или смешанной), которая лри ее применении обеспечила бы оперирующей стороне наибольший выигрыш.

Выше уже говорилось, что хозяйственная деятельность человека может рассматриваться как игра с природой. Основной особенностью природы как игрока является ее не заинтересованность в выигрыше.

Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и заведомо невыгодных стратегий лица, играющего с природой. Что касается стратегий природы, то ни одну из них отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока I. Ввиду того что природа не противодействует игроку I, может показаться, что игра с природой проще стратегической игры. На самом деле это не так. Противоположность интересов игроков в стратегической игре в некотором смысле как бы снимает неопределенность, чего нельзя сказать о статистической игре. Оперирующей стороне в игре с природой легче в том отношении, что она скорее.всего выиграет больше, чем в игре против сознательного противника. Однако ей труднее принять обоснованное решение, так как в игре с природой неопределенность ситуации сказывается в гораздо более сильной степени.

После упрощения платежной матрицы игры с природой целесообразно не только оценить выигрыш при той или иной игровой ситуации, но и определить разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях. Эта разность в теории игр называется риском.

Природа меняет состояние стихийно, совершенно не заботясь о результате игры. В антагонистической игре мы предполагали, что игроки пользуются оптимальными (в определенном выше смысле) смешанными стратегиями. Можно предположить, что природа применяет наверняка не оптимальную стратегию. Тогда какую? Если бы существовал ответ на этот вопрос, то принятие решения лицом, принимающим решения (ЛПР) сводилось бы к детерминированной задаче.

Если вероятности состояний природы известны, то пользуются критерием Байеса, в соответствии с которым оптимальной считается чистая стратегия , при которой максимизируется средний выигрыш:

Критерий Байеса предполагает, что нам хотя и неизвестны условиях выполнения операций (состояния природы) , но известны их вероятности .

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Если игроку представляются в равной мере правдоподобными все состояния природы, то иногда полагают и, учитывая, «принцип недостаточного основания» Лапласа, оптимальной считают чистую стратегию , обеспечивающую:

Если же смешанная стратегия природы неизвестна, то в зависимости от гипотезы о поведении природы можно предложить ряд подходов для обоснования выбора решения ЛПР. Свою оценку характера поведения природы будем характеризовать числом , которое можно связывать со степенью активного «противодействия» природы как игрока Значение соответствует наиболее пессимистичному отношению ЛПР в смысле «содействия» природы в достижении им наилучших хозяйственных результатов. Значение соответствует наибольшему оптимизму ЛПР. Как известно, в хозяйственной деятельности указанные крайности опасны. Скорее всего, целесообразно исходить из некоторого промежуточного значения . В этом случае используется критерий Гурвица, согласно которому наилучшим решением ЛПР является чистая стратегия , соответствующая условию:

Критерий Гурвица (критерий «оптимизма-пессимизма») позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся в поле между значениями по критериям «максимакса» и «максимина» (поле между этими значениями связано посредством выпуклой линейной функции).

В случае крайнего пессимизма ЛПР указанный критерий называется критерием Вальда. Согласно этому критерию, наилучшей считается максиминная стратегия. Это критерий крайнего пессимизма. По этому критерию ЛПР выбирает ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш:

Такой выбор соответствует наиболее робкому поведению ЛПР, когда он предполагает наиболее, неблагоприятное поведение природы, боится больших потерь. Можно предположить, что он не получит больших выигрышей. Согласно критерию Сэвиджа, следует выбирать чистую стратегию соответствующую условию:

где риск .

Критерий Сэвиджа (критерий потерь от «минимакса») предполагает, что из всех возможных вариантов «матрицы решений» выбирается та альтернатива, которая минимизирует размеры максимальных потерь по каждому из возможных решений. При использовании этого критерия «матрица решения» преобразуется в «матрицу риска», в которой вместо значений эффективности проставляются размеры потерь при различных вариантах развития событий.

Недостатком критериев Вальда, Сэвиджа и Гурвица является субъективная оценка поведения природы. Хотя указанные критерии и дают некоторую логическую схему принятия решений, резонно все же задать вопрос: «А почему сразу не выбрать субъективное решение, вместо того чтобы иметь дело с разными критериями?» Несомненно, определение решения по различным критериям помогает ЛПР оценить принимаемое решение с различных позиций и избежать грубых ошибок в хозяйственной деятельности.

Пример решения задачи

Условие задачи

После нескольких лет эксплуатации оборудование может оказаться в одном из трех состояний:

  1. требуется профилактический ремонт;
  2. требуется замена отдельных деталей и узлов;
  3. требуется капитальный ремонт.

В зависимости от ситуации руководство предприятия может принять следующие решения:

Требуется найти оптимальное решение данной проблемы по критерию минимизации затрат с учетом следующих предположений:

a 4 6 9 b 5 3 7 c 20 15 6 q 0.4 0.45 0.15

Решение задачи

Игра парная, статистическая. В игре участвуют 2 игрока: руководство предприятия и природа.

Под природой в данном случае понимаем совокупность внешних факторов, которые определяют состояние оборудования.

Стратегия руководства:

Отремонтировать оборудование своими силами

Вызвать бригаду специалистов

Заменить оборудование новым

Стратегия природы - 3 возможных состояния оборудования.

Требуется профилактический ремонт;

Следует заменить отдельные детали и узлы;

Требуется капитальный ремонт.

Расчет платежной матрицы и матрицы рисков

Поскольку элементы матрицы - затраты, то будем считать их выигрышными но со знаком минус. Платежная матрица:

-4 -6 -9 -9 -5 -3 -7 -7 -20 -15 -6 -20 0.4 0.45 0.15

Составляем матрицу рисков:

-4-(-20)=16 -6-(-15)=9 -9-(-9)=0 16 -5-(-20)=15 -3-(-15)=12 -7-(-9)=2 15 -20-(-20)=0 -15-(-15)=0 -6-(-9)=3 3

Критерий Байеса

Определяем средние выигрыши:

По критерию Байеса оптимальной является стратегия - вызвать бригаду специалистов

Критерий Лапласа

Определим средние выигрыши:

По критерию Вальда оптимальной является стратегия - вызвать бригаду специалистов

Критерий Сэвиджа

По критерию Сэвиджа оптимальной является стратегия - заменить оборудование новым

Критерий Гурвица

По критерию Гурвица оптимальной является стратегия - вызвать бригаду специалистов

Ответ

По всем критериям, за исключением критерия Сэвиджа, оптимальной является стратегия «Вызвать бригаду специалистов». По критерию Сэвиджа, который минимизирует риски, оптимальной является стратегия «Заменить оборудование новым».

В ситуации неопределенности невозможно определить вероятности наступления тех или иных последствий принимаемых решений. Поэтому критерий математического ожидания, который широко используется в ситуации риска, и для которого обязательно нужны упомянутые вероятности, здесь неприменим. Вместо него используются иные критерии.

Для выбора оптимальной стратегии в ситуации неопределенности существует два основных критерия: максимин и минимакс. Максимин называют еще критерием пессимиста или критерием Вальда , а минимакс - критерием Сэвиджа.

Критерий Вальда (Уолда) – максиминный. Этот критерий опирается на принцип наибольшей осторожности – критерий крайнего пессимизма, который основывается на выборе "из худшего – лучшее". По сути, это критерий минимакса – основной в теории игр. Согласно этому критерию природа (среда) ведет себя как разумный агрессивный противник, делающий все, чтобы помешать нам достичь успеха. Оптимальной считается та стратегия, которая гарантирует выигрыш наибольший (max) из всех наихудших (min) возможных исходов действия по каждой стратегии – уровень безопасности:

Выбранная таким образом оптимальная по критерию Вальда стратегия называется максиминной, а величина W – максимином.

Критерий Сэвиджа минимаксного риска . Критерий предполагает предварительное составление так называемой матрицы "рисков" (потерь, сожалений). В теории статистических решений риском rij при пользовании стратегией Qi в условиях Gj называется разность между выигрышем, который мог бы быть получен, если бы были известны условия Gj, и выигрышем, который будет получен, не зная их и выбирая стратегию Qi:

Минимакс ориентирован не столько на минимизацию потерь, сколько на минимизацию сожалений по поводу упущенной прибыли. Он допускает разумный риск ради получения дополнительной прибыли. Пользоваться этим критерием для выбора стратегии поведения в ситуации неопределенности можно лишь тогда, когда есть уверенность в том, что случайный убыток не приведет фирму к полному краху



Критерий произведений

Высокодоходные акции редко бывают достаточно надежными, а самые надежные высокодоходными. Поэтому при покупке акций всегда приходится выбирать между их доходностью и их надежностью и как-то увязывать их между собой. Такая проблема всегда встает при любом инвестиционном проекте. Если известны вероятности сохранения или потери инвестиций, то эта проблема решается с помощью критерия математического ожидания. Если их нет, приходится обращаться к другими критериям. Одним из таких критериев является критерий произведений. Он позволяет выбрать такой проект, который бы был наиболее доходным и в то же время наименее рискованным. Критерий произведений рассчитывается по формуле:

Критерий произведений способен работать на минимуме информации.

Пример решения задачи

Предположим, что в условиях колебания спроса G j = {3000, 6000, 9000,12000} у торгового предприятия существуют три стратегии сбыта какого-либо товара: Q п (1) = 6000 шт; Q п (2) = 9000 шт; Q п (3) = 12000 шт. по цене реализации C р = 70 руб. при цене покупки C п = 30 руб. и средних издержках И = 10руб./шт.

В соответствии с ресурсными возможностями торгового предприятия рассчитаем варианты среднегодовой прибыли по формуле (1), а результаты сведем в таблице 3.

Таблица 3 - Матрица выигрышей (прибылей) коммерческих стратегий при неопределенной рыночной конъюнктуре

1. Критерий Вальда. Для определения оптимальной стратегии по критерию наибольшей осторожности дополним табл. 3 столбцом 6 справа, укажем для каждой строки минимум прибыли и выберем ту стратегию, при которой минимум строки максимален (см. табл. 4).

Таблица 4 - Сводная матрица прибылей

2. Критерий Гурвица. Пусть показатель пессимизма λ определен λ = 0,4.

Для вычисления значений стратегий по критерию взвешенной (разумной) осторожности в дополнительном столбце 7 табл. 4 найдем максимальные значения для каждой строки. Тогда:

Максимальное значение соответствует двум стратегиям закупки Q п (1) и Q п (2) .

3. Критерий Лапласа. Исходя из принципа равновероятности состояний природы найдем средние значения "выигрышей"– прибылей для каждой стратегии:

По критерию усреднения выигрышей Лапласа наилучшей является стратегия закупки Q п (2)

4. Критерий Байеса-Лапласа. Для определения оптимальной стратегии по критерию средневзвешенной оценки выигрышей необходимо знать распределение вероятностей спроса. Пусть из прошлого опыта или экспертным путем такие вероятности определены (нижняя строка в табл. 4).

Тогда оценки по критерию для каждой стратегии составят:

Максимальное значение соответствует стратегии Q п (2) .

Таблица 5 - Матрица рисков коммерческих стратегий

5. Критерий Сэвиджа. Перейдем от матрицы выигрышей к матрице рисков (табл. 5). Для этого предварительно укажем в дополнительной строке таблицы максимально возможные выигрыши по каждому состоянию природы (предпоследняя строка) и затем рассчитаем соответствующие риски r i j = max П i j – П i j

для заполнения матрицы рисков (табл. 5). Исходя из принципа наибольшей осторожности, находим максимальные значения рисков по строкам и из них выбираем стратегии Q п (1) и Q п (2) с минимальным значением максимально возможного риска. Перенесем полученные значения в табл. 4 для подведения итогов выбора.

Итак, конкурирующими оказались стратегии Q п (1) и Q п (2) (выбор стратегии Q п (3) по критерию Гурвица вызван, скорее всего, излишним оптимизмом при выборе показателя λ). Стратегия Q п (1) выбрана по критериям Вальда, Лапласа и Сэвиджа, стратегия Q п (2) – по критериям Лапласа, Байеса-Лапласа и Сэвиджа.

Предпочтение той или иной стратегии выбирается лучшей по большинству критериев. Но в нашем случае две стратегии Q п (1) и Q п (2) равнозначны в этом смысле.

Задача по вариантами:

Таблица 6 - Матрица прибылей коммерческих стратегий при неопределенной рыночной конъюнктуре

Вариант 1

Вариант 2

Вариант 3

Вариант 4

Вариант 5

Вариант 6

Вариант 7

Вариант 8

Вариант 9

1. Для каждого состояния природы j (столбца матрицы) определим максимальное значение выигрыша y j :

y j = max(x ij )

2. Для каждой клетки исходной матрицы X найдем разность между максимальным выигрышем r j для данного состояния природы и исходом в рассматриваемой ячейке x ij :

r ij = y j - x ij

Из полученных значений составим новую матрицу R - "матрицу сожалений" или, как ее еще можно назвать, матрицу недополученных выигрышей.

3. Для каждой альтернативы в новой матрице R найдем наибольший возможный недополученный выигрыш ("максимальное сожаление"). Это и будет являться оценкой данной альтернативы по критерию Сэвиджа S i :

S i = max(r ij ), j=1..M

4. Оптимальной может быть признана альтернатива с минимальным (!) наибольшим недополученным выигрышем:

Х* = Х k , S k = min(S i ), i=1..N

Пример применения критерия Сэвиджа

Применим изложенный выше алгоритм действий для принятия решения в условиях задачи из табл. 3.

1. Найдем наибольшую возможную величину прибыли для каждого сценария развития региона:

y 1 = max (x 11 , x 21) = max(45, 20) = 45

y 2 = max (x 12 , x 22) = max(25, 60) = 60

y 3 = max (x 13 , x 23) = max(50, 25) = 50

2. Рассчитаем значения "сожалений" для каждого проекта при каждом сценарии (т.е. найдем недополученную прибыль по сравнению с максимально возможной при данном сценарии развития). Составим из полученных значений "матрицу сожалений" (табл. 4).

для проекта Х 1 :

r 11 = y 1 - x 11 = 45 - 45 = 0

r 12 = y 2 - x 12 = 60 - 25 = 35

r 13 = y 3 - x 13 = 50 - 50 = 0

для проекта Х 2 :

r 21 = y 1 - x 21 = 45 - 20 = 25

r 22 = y 2 - x 22 = 60 - 60 = 0

r 23 = y 3 - x 23 = 50 - 25 = 25

Таблица 4

Матрица сожалений R (для примера).

4. В полученной матрице по каждой строке найдем наибольшую величину "сожаления" для каждого проекта (последний столбец в табл. 4). Это значение соответствует оценке данной альтернативы по критерию Сэвиджа.

S 1 = max(0, 35, 0) = 35

S 2 = max(25, 0, 25) = 25

5. Сравним полученные величины и найдем проект с минимальным (!) значением критерия . Он и будет оптимальным:

35 > 25 => S 1 > S 2 => X* = X 2

ЛПР, руководствующийся при принятии решений критерием Сэвиджа, выберет проект Х 2 .

Еще раз подчеркнем, что в отличие от остальных критериев, наилучшей альтернативой является та, для которой значение критерия Сэвиджа минимально , поскольку критерий отражает наибольший из возможных недополученных выигрышей для данной альтернативы. Разумеется, чем меньше можно недополучить, тем лучше.

Обычный (или простой) критерий Гурвица учитывает только крайние исходы x i max и x i min каждой альтернативы:

x i max = max(x ij ), x i min = min(x ij ), j = 1..M

Он позволяет учесть субъективное отношение применяющего данный критерий ЛПР за счет придания этим исходам разных "весов". Для этого в расчет критерия введен "коэффициент оптимизма" λ, 0 ≤ λ ≤ 1 . Формула для расчета критерия Гурвица для i -й альтернативы с коэффициентом оптимизма λ выглядит следующим образом:

H i (λ ) = λ x i max + (1 - λ ) x i min

Если исходы представляют возможные выигрыши, то оптимальной признается альтернатива с максимальным значением критерия Гурвица:

Х* = Х k , H k (λ ) = max(H i (λ )), i = 1..N

Как видно из формулы, правильный выбор коэффициента оптимизма λ оказывает существенное влияние на результат применения критерия. Остановимся подробнее на логике подбора λ .

Если ЛПР настроен пессимистически, то для него важнее меньше потерять при плохом развитии событий, пусть даже это означает не такой большой выигрыш при удачном состоянии. Значит, удельный вес наихудшего исхода x i min в оценке альтернативы должен быть выше, чем для x i mах . Это обеспечивается, когда λ находится в пределах от 0 до 0.5 , исключая последнее значение.

При λ=0 критерий Гурвица "вырождается" в критерий Вальда и подходит только для очень пессимистично настроенных ЛПР.

Оптимистичный ЛПР, напротив, ориентируется на лучшие исходы, так как для него важнее больше выиграть, а не меньше проиграть. Больший удельный вес в оценке наилучшего исхода достигается при λ больше 0.5 и до 1 включительно. При λ=1 критерий Гурвица становится критерием "максимакса", который учитывает исключительно наибольший исход каждой альтернативы.

Если у ЛПР нет ярко выраженного уклона ни в сторону пессимизма, ни оптимизма, коэффициент λ принимается равным 0.5 .

Пример применения критерия Гурвица

В условиях задачи из табл. 3 рассмотрим принятие решения по критерию Гурвица для ЛПР, настроенного оптимистически (λ = 0.8 ), и ЛПР-пессимиста (λ = 0.3 ). Порядок действий таков:

1. Найдем максимальные x i max и минимальные x i min исходы для каждого проекта:

x 1 max = max(45, 25, 50) = 50 x 1 min = min(45, 25, 50) = 25

x 2 max = max(20, 60, 25) = 60 x 2 min = min(20, 60, 25) = 20

2. Рассчитаем величину критерия Гурвица при заданных значениях коэффициента оптимизма:

ЛПР-оптимист (λ=0.8 ):

H 1 (0.8 ) = λ x 1 max + (1 - λ ) x 1 min = 0.8×50 + (1 - 0.8 )×25 = 45

H 2 (0.8 ) = λ x 2 max + (1 - λ ) x 2 min = 0.8×60 + (1 - 0.8 )×20 = 52

ЛПР-пессимист (λ=0.3 ):

H 1 (0.3 ) = λ x 1 max + (1- λ ) x 1 min = 0.3×50 + (1 - 0.3 )×25 = 32.5

H 2 (0.3 ) = λ x 2 max + (1- λ ) x 2 min = 0.3×60 + (1 - 0.3 )×20 = 32

3. Сравним полученные величины. Оптимальными для каждого ЛПР будут альтернативы с максимальным значением критерия Гурвица:

ЛПР-оптимист (λ = 0.8 ):

45 < 52 => H 1 (0.8) < H 2 (0.8) => X* = X 2

ЛПР-пессимист (λ = 0.3 ):

32.5 < 32 => H 1 (0.3) > H 2 (0.3) => X* = X 1

Как мы видим, выбор оптимальной альтернативы в одних и тех же условиях существенным образом зависит от отношения ЛПР к риску. Если для пессимиста оба проекта примерно равноценны, то оптимист, который надеется на лучшее, выберет второй проект. Его высокая наилучшая прибыль (60 ) при больших значениях коэффициента λ значительно повышает ценность данного проекта по критерию Гурвица.

Недостатком обычного критерия Гурвица является его "нечувствительность" к распределению исходов между крайними значениями. Это может приводить к неправильным решениям. Например, альтернатива А{100; 150; 200; 1000} по критерию Гурвица с "оптимистичным" коэффициентом λ = 0.7 лучше альтернативы В{100; 750; 850; 950} , так как:

H А (0.7) = 0.7×1000 + (1 - 0.7)×100 = 730

H В (0.7) = 0.7×950 + (1 - 0.7)× 100 = 695

Однако, если посмотреть внимательнее на возможности, которые предоставляет В , то становится заметно, что она выгоднее. Ее "внутренние" исходы (750 и 850 ) существенно лучше, чем у А (150 и 200) , а максимальный выигрыш лишь немногим хуже (950 против 1000 ). В реальной жизни логичнее было бы выбрать В .

Принцип построения обобщенного критерия Гурвица похож на предыдущий. Всем принимаемым в расчет исходам присваивается некоторый "удельный вес". Значение критерия для альтернативы рассчитывается как взвешенная сумма ее исходов. Однако чтобы избежать недостатков "предшественника", обобщенный критерий учитывает все исходы каждой альтернативы.

Тогда, формула для расчета обобщенного критерия для i -й альтернативы может быть записана следующим образом:

λ q - коэффициент для q -го значения i -й альтернативы,

0≤λ q ≤1, λ 1 + ... + λ q + ... + λ М = 1

Получается, что для использования обобщенного критерия Гурвица необходимо назначить М (!) коэффициентов λ q . Конечно, можно было бы это сделать произвольно. Но при большом количестве состояний М это становится весьма трудоемко, так как необходимо, чтобы коэффициенты удовлетворяли как минимум двум условиям:

1) сумма всех весовых коэффициентов должна быть равна единице:

2) величины коэффициентов должны отражать отношение ЛПР к неопределенности:

а) для оптимистичного ЛПР лучшие исходы должны иметь больший "вес", причем, чем лучше исход, тем больше "вес";

б) для пессимистичного ЛПР - все наоборот - больший "вес" у худших исходов, и чем хуже исход - тем больше "вес":

Чтобы не назначать коэффициенты произвольно по отдельности были предложены формализованные методы их расчета, один и которых мы и рассмотрим ниже.