Математика/4.Прикладная
математика
Рыщанова С.М.
Костанайский
государственный университет им. А. Байтурсынова, Казахстан
Некоторые приложения функции полезности Неймана - Моргенштерна
Полезность - это некоторое число, приписываемое
лицом, принимающим решение, каждому возможному исходу. Функция полезности
Неймана - Моргенштерна для ЛПР показывает полезность, которую он приписывает
каждому возможному исходу. У каждого ЛПР(лицо, принимающее решение) своя функция
полезности,
которая показывает его предпочтение к тем или иным исходам в зависимости от его
отношения к риску. Ожидаемая полезность события равна сумме произведений
вероятностей исходов на значения полезностей этих исходов.
Если ЛПР - субъективист, то он будет руководствоваться
индивидуально определенным БДЭ(Безусловный денежный эквивалент). Поясним смысл
этой величины. Рассмотрим ситуацию, когда игрок с вероятностью 0,8 выигрывает
40 дол. и с вероятностью 0,2 проигрывает 20 дол. Попробуем выяснить, за какую
сумму ЛПР уступит свое право участвовать в игре. Объективист пользуется
правилом:
БДЭ = ОДО = 0,8 • 40+0,2(-20) = 28 дол.
Поэтому свое право на игру он уступит не менее чем за
28 дол. Субъективист, как правило, готов уступить свое право на игру за меньшую
сумму, поскольку для него БДЭ < ОДО. Величина БДЭ может изменяться со временем в зависимости от
обусловленных указанными причинами обстоятельств. Например, в случае
катастрофической нехватки финансовых средств (наличных денег) право на игру
можно уступить и за более низкий эквивалент.
Исследуем
реалистичность критерия выбора решения, основанного на расчете ОДО. Рассмотрим
две альтернативы:
1) выигрыш 1 000 000 дол. с вероятностью 1;
2) игра (лотерея): выигрыш 2 100 000 дол. с
вероятностью 0,5 и проигрыш 50 000 дол. с вероятностью 0,5. В этом случае ОДО = 0,5 • 2 100 000 - 0,5 • 50 000 = 1 025
000 дол.
Относительно получаемого среднего выигрыша указанные
альтернативы практически эквивалентны, и если игрок безразличен к риску, он выберет вторую альтернативу. Если он к риску
не безразличен, а подавляющее число людей именно таковыми являются , выбор будет зависеть главным образом от финансово состояния
игрока. Игроки, имеющие скромный денежный доход, предпочтут не рисковать и выберут гарантированный
выигрыш. Для ЛПР обладающего достаточно крупным капиталом, проигрыш в 50 000
дол. невелик, и он предпочтет рискнуть. Рисковать будут также игроки, патологически
склонные к финансовым авантюрам.
Чем больше вероятность крупного выигрыша,
тем больше игра «стоит», т.е. тем большая плата потребуется за приобретение
права в ней участвовать.
Если предположить, что люди предпочитают большее
количество некоторого блага меньшему, то все это в совокупности определяет
рациональное поведение ЛПР.
При названных предположениях американскими учеными Дж.
Нейманом и О. Моргенштерном было показано, что ЛПР при принятии решения будет стремиться к
максимизации ожидаемой полезности. Другими словами, из всех возможных решений он выберет
то, которое обеспечивает наибольшую ожидаемую полезность.
Например, горно-обогатительный комбинат решает вопрос о бурении скважины.
Известно, что если комбинат будет бурить, то с вероятностью 0,6 руды найдено
не будет; с вероятностью ОД (денежная оценка) запасы месторождения составят 50
000 т; с вероятностью 0,15 - 100 000 т; с вероятностью 0,1 - 500 000 т; с
вероятностью 0,05 - 1 000 000 т. Если
медь не будет найдена, то комбинат потеряет 50 000 дол.; если мощность месторождения составит 50 000
т, то потери снизятся до 20 000 дол.; мощность месторождения в 100 000 т
принесет прибыль 30 000 дол.; 500 000 т - 430 000 дол.; 1 000 000 т - 930 000
дол.
Дерево решений данной задачи представлено на рис. 1.
Нетрудно рассчитать ожидаемое значение выигрыша: ОДО= 0,6(-50000) + 0,1(-20000)
+ 0,15 * 30000 + 0,1 * 430 000 + 0,05
930 000 =62 000 дол.
Если ЛПР, представляющий комбинат, безразличен к риску
и принимает решение о проведении буровых работ на основании рассчитанного
ОДО, то он воспринимает ожидаемую полезность как пропорциональную ОДО,
полагая U = 62. Учитывая, что U - индивидуальное число, характеризующее ЛПР, нули,
отвечающие расчету ОДО, можно отбросить. В этом случае функция полезности U (v), где v - прибыль, получаемая при
различных исходах, является прямой с положительным наклоном. Ниже будет
показано, что U можно задавать с точностью до
некоторого монотонного преобразования.

Дерево решений для задачи (прибыль
указана в долларах)
Для принятия решения в случае небезразличия ЛПР к риску
необходимо уметь оценивать значения полезности каждого из допустимых исходов.
Дж. Нейман и О. Моргенщтерн предложили процедуру построения индивидуальной
функции полезности, которая (процедура) заключается в следующем: ЛПР отвечает
на ряд вопросов; обнаруживая при этом свой индивидуальные предпочтения, учитывающие
его отношение к риску. Значения полезностей могут быть найдены за два шага.
Шаг 1. Присваиваются произвольные
значения полезностей выигрышам для худшего и лучшего исходов, причем первой величине
(худший исход) ставится в соответствие меньшее число. Например, для приведенной
выше задачи U(-50 000 дол.) = 0, а U(930 000 дол.) = 50. Тогда
полезности промежуточных выигрышей будут находиться в интервале от 0 до 50.
Полезность исхода даже для одного индивида определяется не однозначно, а с
точностью до монотонного преобразования. Пусть, например, имеем x1, x2,…, xn -полезности, приписываемые п ожидаемым значениям выигрышей. Тогда α +β x1, α +β x2,…, α +β xn (где β > 0) также будут полезностями. Если в задаче 1 при расчете полезности отбросить
последние нули, это будет эквивалентно линейному преобразованию функции
полезности при α= 0 и β = 0,001.
Шаг 2. Игроку предлагается на выбор: получить некоторую
гарантированную денежную сумму v, находящуюся между лучшим и худшим
значениями S и s, либо принять участие в игре, т.е.
получить с вероятностью р наибольшую
денежную сумму S
и с вероятностью (1 - p) - наименьшую сумму s. При этом вероятность следует
изменять (понижать или повышать) до тех пор, пока ЛПР станет безразличным в
отношении к выбору между получением гарантированной суммы и игрой. Пусть
указанное значение вероятности равно p0. Тогда полезность гарантированной суммы определяется
как среднее значение (математическое ожидание) полезностей наименьшей и
наибольшей сумм, Рассчитаем полезность результатов любого из возможных исходов
для задачи. Пусть для ЛПР безразлично, потерять 20 000 дол. или принять участие
в игре (выигрыш 930 000дол. с вероятностью 0,1 или проигрыш 50 000дол. с
вероятностью 0,9). Согласно формуле
имеем: при этом по определению принято, что U (-50)
= 0, U (930)
- 50, откуда следует, что U (-20)
= 5