Математика/4.Прикладная математика

Рыщанова С.М.

Костанайский государственный университет им. А. Байтурсынова, Казахстан

 Некоторые приложения функции полезности Неймана - Моргенштерна

Полезность - это некоторое число, приписы­ваемое лицом, принимающим решение, каждому возможному исходу. Функция полезности Неймана - Моргенштерна для ЛПР показывает полезность, которую он приписывает каждому возможному исходу. У каждого ЛПР(лицо, принимающее решение) своя функция полезности, которая показывает его предпочтение к тем или иным исходам в зависимости от его отно­шения к риску. Ожидаемая полезность события равна сумме произведений вероятностей исходов на значения полезностей этих исходов.

Если ЛПР - субъективист, то он будет руководствоваться индивидуально определенным БДЭ(Безусловный денежный эквивалент). Поясним смысл этой величины. Рассмотрим ситуацию, когда игрок с вероятностью 0,8 выигрывает 40 дол. и с вероятностью 0,2 проигрывает 20 дол. Попробуем выяснить, за какую сумму ЛПР уступит свое право участвовать в игре. Объективист пользуется правилом:

БДЭ = ОДО = 0,8 • 40+0,2(-20) = 28 дол.

Поэтому свое право на игру он уступит не менее чем за 28 дол. Субъективист, как правило, готов уступить свое право на игру за меньшую сумму, поскольку для него БДЭ < ОДО.  Величина БДЭ может изменяться со временем в зависимости от обусловленных указанными причинами обстоятельств. Например, в случае катастрофической нехватки финансовых средств (наличных денег) право на игру можно уступить и за более низкий эквивалент.

Исследуем реалистичность критерия выбора решения, основанного на расчете ОДО. Рассмотрим две альтернативы:

1) выигрыш 1 000 000 дол. с вероятностью 1;

2) игра (лотерея): выигрыш 2 100 000 дол. с вероятностью 0,5 и проигрыш 50 000 дол. с вероятностью 0,5. В этом случае  ОДО = 0,5 • 2 100 000 - 0,5 • 50 000 = 1 025 000 дол.

Относительно получаемого среднего выигрыша указанные альтернативы практически эквивалентны, и если игрок  безразличен к  риску, он выберет вторую альтернативу. Если он к риску не безразличен, а подавляющее число людей именно таковыми являются , выбор будет зависеть главным образом от финансово состояния игрока. Игроки, имеющие скромный денежный доход, предпочтут  не рисковать и выберут гарантированный выигрыш. Для ЛПР обладающего достаточно крупным капиталом, проигрыш в 50 000 дол. невелик, и он предпочтет рискнуть. Рисковать будут также игроки, патологически склонные к финансовым авантюрам.

     Чем больше вероятность крупного выигрыша, тем больше игра «стоит», т.е. тем большая плата потребуется за приобретение права в ней участвовать.

Если предположить, что люди предпочитают большее количество некоторого блага меньшему, то все это в совокупности определяет рациональное поведение ЛПР.

При названных предположениях американскими учеными Дж. Нейманом и О. Моргенштерном было показано, что ЛПР при принятии решения будет стремиться к максимизации ожидаемой полезности. Другими словами, из всех возможных решений он выберет то, которое обеспечивает наибольшую ожидаемую по­лезность.

Например, горно-обогатительный комбинат решает вопрос о бурении скважины. Известно, что если комбинат будет бурить, то с ве­роятностью 0,6 руды найдено не будет; с вероятностью ОД (денежная оценка) запасы месторождения составят 50 000 т; с вероятностью 0,15 - 100 000 т; с вероятностью 0,1 - 500 000 т; с вероятностью 0,05 - 1 000 000 т.  Если медь не будет найдена, то комбинат потеряет 50 000 дол.;  если мощность месторождения составит 50 000 т, то потери снизятся до 20 000 дол.; мощность месторождения в 100 000 т принесет прибыль 30 000 дол.; 500 000 т - 430 000 дол.; 1 000 000 т - 930 000 дол.

Де­рево решений данной задачи представлено на рис. 1. Нетрудно рассчитать ожидаемое значение выигрыша: ОДО= 0,6(-50000) + 0,1(-20000) + 0,15 * 30000 +  0,1 * 430 000 + 0,05 930 000 =62 000 дол.

Если ЛПР, представляющий комбинат, безразличен к риску и при­нимает решение о проведении буровых работ на основании рассчи­танного ОДО, то он воспринимает ожидаемую полезность как про­порциональную ОДО, полагая  U = 62. Учитывая, что U - индивиду­альное число, характеризующее ЛПР, нули, отвечающие расчету ОДО, можно отбросить. В этом случае функция полезности U (v), где v - прибыль, получаемая при различных исходах, является прямой с положительным наклоном. Ниже будет показано, что U можно зада­вать с точностью до некоторого монотонного преобразования.

зад1

Дерево решений для задачи (прибыль указана в долларах)

Для принятия решения в случае небезразличия ЛПР к риску не­обходимо уметь оценивать значения полезности каждого из допусти­мых исходов. Дж. Нейман и О. Моргенщтерн предложили процедуру построения индивидуальной функции полезности, которая (про­цедура) заключается в следующем: ЛПР отвечает на ряд вопросов; обнаруживая при этом свой индивидуальные предпочтения, учиты­вающие его отношение к риску. Значения полезностей могут быть найдены за два шага.

Шаг 1. Присваиваются произвольные значения полезностей выигрышам для худшего и лучшего исходов, причем первой величине (худший исход) ставится в соответствие меньшее число. Например, для приведенной выше задачи U(-50 000 дол.) = 0, а U(930 000 дол.) = 50. Тогда полезности промежуточных выигры­шей будут находиться в интервале от 0 до 50. Полезность исхода даже для одного индивида определяется не однозначно, а с точно­стью до монотонного преобразования. Пусть, например, имеем x1, x2,…, xn -полезности, приписываемые п ожидаемым значениям вы­игрышей. Тогда α +β x1, α +β x2,…, α +β xn (где β > 0) также будут полезностями. Если в задаче 1 при расчете полезности отбросить последние нули, это будет эквивалентно линейному преобразованию функции полезности при α= 0 и β = 0,001.

Шаг 2. Игроку предлагается на выбор: получить некоторую гарантированную денежную сумму v, находящуюся между лучшим и худшим значениями S и s, либо принять участие в игре, т.е. полу­чить с вероятностью р наибольшую денежную сумму S  и с вероят­ностью (1 - p) - наименьшую сумму s. При этом вероятность следует изменять (понижать или повышать) до тех пор, пока ЛПР станет без­различным в отношении к выбору между получением гарантирован­ной суммы и игрой. Пусть указанное значение вероятности равно p0. Тогда полезность гарантированной суммы определяется как среднее значение (математическое ожидание) полезностей наименьшей и наибольшей сумм, Рассчитаем полезность результатов любого из возможных исхо­дов для задачи. Пусть для ЛПР безразлично, потерять 20 000 дол. или принять участие в игре (выигрыш 930 000дол. с вероятностью 0,1 или проигрыш 50 000дол. с вероятностью 0,9). Согласно форму­ле  имеем: при этом по определению принято, что U (-50) = 0,  U (930) - 50, от­куда следует, что  U (-20) = 5