Математика/4. Прикладная математика

К.ф.-м.н. Зинченко А.Б., Павлов А.Е.

Южный федеральный университет. Россия

NS-ядро кооперативной игры с трансферабельной

полезностью

В кооперативной игре с трансферабельной полезностью (ТП-игре)  , где

, , , ,

предполагается, что сформировалась коалиция всех участников. Решения игры  предлагают способы распределения веса  максимальной коалиции с учетом возможностей других коалиций . Одно из важнейших направлений в теории кооперативных игр связано с содержательной интерпретацией решений, описанием их сходства и отличия, а также рекомендациями по выбору концепции решения для специальных классов игр.

Основным решением-множеством кооперативной игры является С-ядро (core) [1]

,

где  - множество дележей.  При дележах из С-ядра каждая собственная коалиция  получает не меньше, чем может достичь самостоятельно. Среди одноэлементных решений (значений игры) наиболее популярны: N-ядро (nucleolus) [2], обозначаемое через , и значение Шепли (Shapley value) [3], обозначаемое через .

В данной работе вводится новое одноточечное решение ТП-игры, балансирующее две, в некотором смысле, противоположные концепции решения  и . Новое решение, названное NS-ядром и обозначенное через , есть среднее арифметическое N-ядра и значения Шепли

.

N-ядро лексикографически минимизирует вектор упорядоченных по не возрастанию эксцессов коалиций

,

где  - вектор эксцессов  коалиций , , , относительно дележа

,  ,

- множество векторов эксцессов дележей игры . Положительный эксцесс отражает степень неудовлетворенности коалиции  дележом , следовательно, концепция N-ядра определена так, чтобы сделать «самую несчастную коалицию как можно более счастливой». Выигрыши существенных агентов в N-ядре слабо отражают их продуктивность.  

Согласно значению Шепли выигрыш каждого игрока равен его среднему вкладу во все коалиции

,   ,

т.е.  выигрыш игрока зависит только от его продуктивности.

N-ядро является селектором С-ядра сбалансированной ТП-игры (достоинство) и всегда принадлежит множеству дележей игры общего вида (достоинство), но не удовлетворяет аксиоме аддитивности (недостаток) и даже ослабленной аксиоме коалиционной монотонности (недостаток). Последние свойство очень непривлекательно, т.к. при увеличении общей прибыли  только одной коалиции , , личные выигрыши некоторых игроков из  могут стать меньше. Значение Шепли - одно из немногих аддитивных и одновременно коалиционно монотонных одноточечных решений ТП-игры (достоинство). Но оно может не принадлежать не только С-ядру сбалансированной игры, но даже множеству дележей (недостаток). Известно, что не существует коалиционно монотонного значения ТП-игры, которое всегда принадлежит С-ядру сбалансированной игры. Поэтому представляет интерес поведение NS–ядра на всем множестве ТП-игр и на специальных классах.

Оба решения, определяющие NS-ядро, можно интерпретировать как эгалитарные, но N-ядро реализует эгалитаризм для коалиций, а значение Шепли – эгалитаризм для участников игры. Таким образом, новое решение  можно считать компромиссным. Для кооперативной ТП-игры уже предложено несколько решений компромиссного типа.

Консенсус-значение [4] является средним арифметическим значения Шепли и равномерного распределения дополнительного дохода от кооперации

,  , , .

Консенсус-значение балансирует два крайних принципа формирования выигрыша нулевого игрока. Игрок  нулевой в , если , . Выигрыш нулевого игрока  в значении Шепли равен нулю .  При равномерном распределении  все игроки, в том числе и нулевой, получают одинаковую долю  дополнительного дохода от кооперации (уравниловка). В консенсус-значении нулевой игрок может получить положительный выигрыш, но нет уравниловки.

Существует также решение, названное -значением [5]

,  , ,

которое реализует компромисс между верхним вектором

, ,

и нижним вектором

, ,

компромиссно допустимой игры, т.е. игры, удовлетворяющей условию

,  .

Компоненты нижнего вектора – минимально возможные выигрыши агентов для дележей, принадлежащих С-ядру, а компоненты верхнего вектора – максимально возможные в С-ядре выигрыши агентов.

Менее известным, чем упомянутые выше, компромиссным значением игры  является (не имеющее специального названия) решение

,

где  - фиксированный игрок,  - вершина  множества дележей, определенная формулой

- вершина множества двойственных дележей

,

определенная формулой

В  выигрыши всех агентов, кроме -го, равны минимально возможным в множестве дележей величинам, а -й игрок получает остаток распределяемой полезности . В  выигрыши всех агентов, кроме -го, равны максимально возможным в множестве двойственных дележей величинам, а -й игрок получает остаток .

         В таблице 1 сравниваются свойства значения Шепли, N-ядра и NS-ядра. Используются следующие обозначения:

·         (E) эффективность (efficiency),

·         (A) аддитивность (additivity),  

·         (Sym) симметричность (symmetry),

·         (NP) свойство нулевого игрока (null player property),

·         (ISE) инвариантность относительно преобразования стратегической эквивалентности (invariant w.r.t. strategic equivalence),

·         (CM) коалиционная монотонность (coalition monotonicity),

·         (ACM) ослабленная коалиционная монотонность (aggregate coalition monotonicity),

·         (CS) селектор С-ядра (core selector),

·         (IR) индивидуальная рациональность (individual rationality).

                                                                                   Таблица 1

Свойства решений

 

E

A

Sym

NP

ISE

CM

ACM

СS

IR

Значение Шепли

да

да

да

да

да

нет

да

да

нет

-ядро

да

нет

да

да

да

да

нет

нет

да

-ядро

да

нет

да

да

да

нет

нет

нет

нет

 

Основная трудность нахождения NS-ядра связана с вычислением N-ядра, т.к. для ТП-игры общего вида это наиболее трудно вычисляемое решение. Нужно решить серию задач линейного программирования с (�� + 1) переменными и  ограничениями. В наихудшем случае количество таких задач равно . Или решить одну, но очень большую задачу линейного программирования. В обоих случаях возможен сильный «разброс» коэффициентов симплекс таблиц, а также плохая обусловленность систем ограничений.

Для нахождения N-ядра был выбран первый способ. Создана библиотека CooperativeGames.dll, вычисляющая значение Шепли, N-ядро и NS-ядро (C#, Microsoft Visual Studio 2015 с дополнительными пакетами Microsoft Solver Foundation 3.1, MathNet.Numerics). Для решения задач линейного программирования была использована библиотека Microsoft Solver Foundation Express Edition версии 3.1. Разработано два приложения.

Первое (Windows – приложение) имеет удобный интерфейс. С помощью этого приложения были вычислены NS-ядра представителей классов эквивалентности крайних точек многогранника (0,1)-нормализованных 1-выпуклых игр [6] четырех лиц (игры  из таблиц 2 и 3). Экстремальные игры были получены с помощью формул, выведенных в [7]. Известно, что экстремальность игры соответствует, в некотором смысле, экстремальному поведению участников моделируемой ситуации. Кроме того, были вычислены NS-ядра для сумм некоторых экстремальных игр (последние три строки таблиц 2 и 3).

Таблица 2

1-выпуклые игры

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Продолжение таблицы 2

 

 

 

 

 

Значения Шепли, а, следовательно, и NS-ядра игр , ,  принадлежат С-ядру. Значения Шепли и NS-ядра игр  - ,  С-ядру не принадлежат. Однако в игре  значение Шепли не принадлежит С-ядру, а NS-ядро – принадлежит.

Таблица 3

Решения 1-выпуклых игр

(, , , )

 

Второе приложение (консольное) предназначено для тестирования программы на генерируемых данных. Игры генерировались с помощью псевдослучайных чисел, но при условии, чтобы множество дележей было непустым. Тестирования дало впечатляющие результаты (см. таблицу 4), за которые нужно благодарить разработчиков библиотеки Microsoft Solver Foundation Express Edition. В частности, для решения серии задач линейного программирования с 12 переменными и 4096 ограничениями (в исходной задаче) требуется в среднем 9.3 секунды. При вычислении NS-ядра игры 13 лиц и более, возникает ошибка, связанная c ограничением лицензии на библиотеку Microsoft Solver Foundation Express Edition.

Аналогично обобщенному консенсус-значению

, ,

можно ввести обобщенное NS-ядро – выпуклую комбинацию значения Шепли и N-ядра

, .

Значение  можно выбрать так, чтобы обобщенное NS-ядро принадлежало: множеству дележей, если значение Шепли ему не принадлежит; C-ядру сбалансированной игры, если значение Шепли ему не принадлежит.

Таблица 4

Среднее время вычисления NS-ядра

Число

игроков

4

5

6

7

8

9

10

11

12

Время

45 мс

55 мс

91 мс

110 мс

287 мс

708 мс

1.3 с

4.5 с

9.3 с

 

Литература:

1.     Gillies D. B. Solutions to general non-zero-sum games. In A. W. Tucker and R. D. Luce (eds.): Contributions to the Theory of Games IV. Princeton University Press. 1959. P. 47-85.

2.     Schmeidler D. The nucleolus of a characteristic function game //  SIAM J. Appl. Marh. 1969. V.17. P. 1163-l170.

3.     Shapley L.S. A value for n-person games  // Annals of Mathematics Studies. 1953. V. 28. P. 307–317.

4.     Ju Y., Born P., Rays P. The consensus value: a new solution concept for cooperative games // Social Choice and Welfare. 2006. V. 28. . 4. P. 85-703.

5.     Tijs S. Bounds for the core and the τ -value. In: O. Moeschlin and D. Pallaschke (Eds.). Game theory and mathematical economics. 1981, pp. 123–132.

6.     Driesse T.S.H. Properties of 1-convex n-person games // OR Spektrum. 1985. №7. P. 19–26.

7.     Зинченко А.Б. Многогранники специальных классов сбалансированных игр с трансферабельной полезностью // Дискретный анализ и исследование операций. 2016. Т. 23, № 1. C. 80–95.