Магистр Умаров А.А., к.техн.н. Жумашева Т.,
магистрант Агманова З.У.
Международный Казахско-турецкий университет
им. А. Ясави, Казахстан
РАЗРАБОТКА
ИМИТАЦИОННОЙ МОДЕЛИ ИГРЫ
И АНАЛИЗ ЕЕ
РЕШЕНИЙ
Описывается
алгоритм имитационной игры преследования и проводится статистический
эксперимент. На основе эксперимента определяются оценки оптимальности решений
игры. Имитационная модель адекватно отражает процессы преселедования.
Введение. Модели
конфликтных ситуации – игровые модели относятся к кибернетическим моделям. Кибернетика (от
греческого слова “искусство управления”) – наука, занимающаяся процессами
управления в живой и неживой природе, связанными с преобразованием и обработкой
информации [2].
Основной объект исследования кибернетики – Кибернетические системы (КС),
рассматриваемые абстрактно, вне зависимости от их материальной природы. Примеры
кибернетических систем – автоматы, роботы, ЭВМ, человеческий мозг,
биологические популяции и многое другое. Каждая такая система представляет
собой множество взаимосвязанных элементов, способных воспринимать, запоминать и перерабатывать
информацию, а также обмениваться ею.
Сфера применения игровых моделей широка, начиная от простых компьютерных
игр до сложнейших биологических и генетических систем
В военное время, в боевых операциях
прогнозирование стратегий противника дает возможность угадывания его намерении и предупреждение от внезапных неожиданных атак на
уязвимые части, подразделения. В военной энциклопедии [1] приводится такое определение “преследование –
вид боевых действий, имеющих целью уничтожения или пленения противника”.
В мирное время стратегии преследования используются в спортивных играх. В
популярной игре футбол защитник преследует
нападающего, чтобы он не наносил удары в его ворота.
В природе (биологических системах) [2] п р о б л е м а
в ы ж и в а н и я особей напрямую связана с данной задачей. Например, от
качественного принятия решений убегающего зависит жизнь зайца, где роль
преследователя выполняет волк. Эта проблема имеет место во всех уровнях жизни
(молекулярном, клеточном и т. д.). Таким образом, любой живой организм борется за свое существование и продолжение
жизни методом преследования и убегания.
В настоящей
работе описывается модель игры простого преследования с быстродействием для
двух игроков – преследователя (игрока П) и убегающего (игрока У) [3, 6].
Разработка
модели игры. 1. Постановка задачи.
Настоящая
модель игры является: непрерывной (множество
стратегий непрерывно и бесконечно); антагонистической (интересы обоих сторон прямо противоположны); динамической (дифференциальной) игрой.
Движение управляемой системы, то есть
игороков П и У то задаются выражением (2) – (3).
По особым характеристикам данная игра является [4]:
-
игрой с ‘линией жизни’;
-
игрой на быстродействие.
Должны быть заданы:
начальные условия игры:
-
начальные положения
игроков П и У; {P (x0, y0), и E (a0, b0)}
-
начальный момент времени {T0}
граничные
условия игры:
- область
преследования; {S}
-
часть границы области преследования,
(линия жизни) куда
игрок У стремится достичь
до поимки его игроком П {KÎS}
функция платежа:
F* = d =
® extr, (1)
где F* является функцией расстояния и
для каждого игрока имеет свою цель:
- F* ® min для игрока П
- F* ® max для игрока У
Ценой игры n является
в р е м я, то есть игрок П должен поймать игрока У (цель) как
можно быстрее (оптимальное время преследования), а игрок У должен
достичь ЛЖ как можно за короткое время (оптимальное время убегания).
Критерий l – захвата L, который показывает минимальное расстояние между
игроком П и игроком У, и
от этой величины (F*£ L) зависит исход
игры в пользу игрока П. В нашем
случае L = 40.
Отчет очков в игре напрямую
связан с показателем времени.
Ограничения игры:
Время t Î [100, 99, … 0]
Область преследования S
Множество S –плоскость,
т.е. является функцией S (x,y). где
x Î [10,
580],
y Î [10,
400];
“Линия жизни” К
является подмножеством S, то есть KÎS.
Новые местоположения (ходы)
игрока П определяются по формулам:
![]()
(2)
для игрока У:
где
i = 0, 1, … n (3)
Управление игроком
У осуществляет человек, который выбирает один из четырех возможных действии
по направлениям: ¬,,®,¯.
Исход игры может
заканчивается только выигрышем или проигрышем.
В случае поимки игрока У за
конечное время получается проигрыш (поражение) и выводится сообщение Ц е л
ь у н и ч т о ж е н а!!! В противном
случае, когда игроку П удается достичь ЛЖ (убежать) получается выйгрыш и
выводится сообщение Ц е л ь н е о б н а р у ж е н а!!!
Игра оценивается показателем
времени и выводится в виде очков на экране дисплея.
2. Cтатистический эксперимент. Решение игры осуществляется методом
статистических испытаний. Первоначальное исследование модели выполнено в виде
20 испытаний (табл.1)
Таблица 1
|
Номер
эксперимента |
Время |
Очки |
Исход |
В |
|
1 |
51 |
0 |
Цель уничтожена (проигрыш) |
0 |
|
2 |
100 |
10 |
Время истекло (проигрыш) |
0 |
|
3 |
28 |
0 |
Цель уничтожена (проигрыш) |
0 |
|
4 |
19 |
0 |
Цель уничтожена (проигрыш) |
0 |
|
5 |
76 |
25 |
Цель не обнаружена (Выигрыш) |
1 |
|
6 |
65 |
0 |
Цель уничтожена (проигрыш) |
0 |
|
7 |
64 |
30 |
Цель не обнаружена (Выигрыш) |
1 |
|
8 |
21 |
0 |
Цель уничтожена (проигрыш) |
0 |
|
9 |
76 |
25 |
Цель не обнаружена (Выигрыш) |
1 |
|
10 |
87 |
20 |
Цель не обнаружена (Выигрыш) |
1 |
|
11 |
100 |
10 |
Время истекло (проигрыш) |
0 |
|
12 |
29 |
0 |
Поражение (проигрыш) |
0 |
|
13 |
76 |
25 |
Цель не обнаружена (Выигрыш) |
1 |
|
14 |
100 |
10 |
Время истекло (проигрыш) |
0 |
|
15 |
81 |
0 |
Цель уничтожена (проигрыш) |
0 |
|
16 |
64 |
30 |
Цель не обнаружена (Выигрыш) |
1 |
|
17 |
87 |
20 |
Цель не обнаружена (Выигрыш) |
1 |
|
18 |
60 |
0 |
Цель уничтожена (проигрыш) |
0 |
|
19 |
76 |
25 |
Цель не обнаружена (Выигрыш) |
1 |
|
20 |
87 |
20 |
Цель не обнаружена (Выигрыш) |
1 |
Здесь В – булева функция, принимающая значение:
-
0, если исход игры – проигрыш;
-
1, если исход игры – выигрыш;
Ход выполнения эксперимента можно
разделить на этапы:
n Выбор оптимальных стратегий;
n
Определение самой
оптимальной стратегий и ее оценка;
n Определение оптимального времени убегания.
Из таблицы 1 видно, что из 20 испытаний:
-
11 партии игры
закончились поражением для игрока У (П р о и г р ы ш);
-
9 партии игры
закончились в ы и г р ы ш е м для игрока У.
Так как нас интересуют только выигрышные
исходы игры, мы выбираем только 9 результатов (3 стратегий с ценой игры n1=64, n2=76 и n3=87
соответсвенно). Их обозначим через S64, S76 и S87. Они являются оптимальными стратегиями
убегания. На втором этапе исследования проводим порядка 100 испытаний с выбранными тремя стратегиями S64, S76 и S87. В таблице 2
приведена частота выигрышей каждой из
этих стратегий.
Таблица 2.
|
x |
64 |
76 |
87 |
|
N |
28 |
39 |
33 |
Оптимальная стратегия убегания
выбирается исходя из минимизации среднего времени выигрыша игрока У при
выбранном объеме испытаний. Статистическая оценка оптимального
времени стратегии [5, 6] осуществляется с помощью анализа доверительного
интервала математического ожидания. Сначала задаем доверительную вероятность g=0, 95 и в следующем порядке находим:
-
математическое ожидание
(выборочное среднее измерений):
![]()
(4)
-

дисперсию (среднеквадратическую погрешость результата
измерений):
(5)
![]()
- ошибку серий
измерений:
(6)
- доверительный интервал (ошибку серий измерений):
![]()
(7)
где t – коэффициент
Стьюдента, зависящий от числа измерений n, g - вероятность того, что истинное значение измеряемой величины n лежит в доверительном интервале (7).
![]()
Найденные оценки измерений:
![]()
(8)
Отсюда можно утверждать, что средний выигрыш (ожидаемый) равен 76, 27 (математическому ожиданию). И он лежит в интервале (8).
Стратегию S76 (оптимальную
стратегию убегания), которая обеспечивает средний выигрыш, обозначим через v0.
Момент времени, максимально обеспечивающий достижение ЛЖ игроку У (о п т
и м а л ь н о е в р е м я у б е г а н и я), обозначим через Tj.
Проведенные в данном случае двадцать
испытаний недостаточны для полной оценки ситуаций. Качественная оценка достигается при большом числе опытов, поряка
(N>500). Но,
исходя из известного Закона больших чисел можно сделать
следующий вывод:
С заданной вероятностью (g=0, 95) стратегия v0 является оптимальным в игре
преследования для игрока У в том случае, когда игрок П использует
стратегию непрерывного преследования u0. С
той же вероятностью можно утверждать, что оптимальное время убегания Tj лежит в
доверительном интервале (8).
3. Составление программы имитационной игры. Программа
игры была названа Preslej. Ее название берется от слова
«преследование». Сложность алгоритма - средний. Трудности встречаются при реализации игры:
n
при определении
используемых параметров (скорости игроков П и У);
n
при разделении глобальных переменных от локальных;
n
при несоответствии типов
при вводе параметров;
В процессе реализации программы Preslej были сделаны 8 версии (модификации). С каждой новой
версией были внедрены новые возможности, улучшения. Программа Preslej используется в учебном процессе ВУЗа по предмету Математическое
моделирование [6].
Литература
1. Военная энциклопедия СССР – т.2, – М.: Просвещение, 1977
2. Кузин
Л. Т. Основы кибернетики. В двух томах. Математические основы кибернетики – М.:
Энергия, 1973 –474с.
3. Петросян Л. А., Томский Г. В. Интеллектуальные Игры Преследования
–Новосибирск: Наука, 1991-125с.
4. Петросян
Л.А., Зенкевич Н.А., Семина Е.А. Теория игр: учеб. пособие для ун-тов. – М.:
Высш. шк., 1998. – 304 с. ил.
5. Апанасов П. Т. , Орлов М. И. Сборник задач по математической статистике
- Уч. пособие для вузов, М.: Высш. шк., 1987- 303с.
6. Умаров А.А. О создании программы Preslej - Труды Межд. научно- методической конференции
“Инновационное обучение физ., мат., информатике: актуальные вопросы и
перспективы” МКТУ ШИ, 2004, с.415-417.