Статья:

РЕШЕНИЕ МАТРИЧНЫХ ИГР

Конференция: XI Студенческая международная заочная научно-практическая конференция «Молодежный научный форум: естественные и медицинские науки»

Секция: 1. Математические науки

Выходные данные
Кузнецова К.Е. РЕШЕНИЕ МАТРИЧНЫХ ИГР // Молодежный научный форум: Естественные и медицинские науки: электр. сб. ст. по мат. XI междунар. студ. науч.-практ. конф. № 4(11). URL: https://nauchforum.ru/archive/MNF_nature/4(11).pdf (дата обращения: 25.12.2024)
Лауреаты определены. Конференция завершена
Эта статья набрала 0 голосов
Мне нравится
Дипломы
лауреатов
Сертификаты
участников
Дипломы
лауреатов
Сертификаты
участников
на печатьскачать .pdfподелиться

РЕШЕНИЕ МАТРИЧНЫХ ИГР

Кузнецова Ксения Евгеньевна
cтудент, ФГБОУ ВПО Северо-Восточный государственный университет, РФ, г. Магадан
Гиберт Вера Григорьевна
научный руководитель, доц. Северо-Восточного государственного университета, РФ, г. Магадан

В практической деятельности часто приходиться рассматривать явления и ситуации, в которых участвуют две и более стороны, имеющие различные интересы и обладающие возможностями применять для достижения своих целей разнообразные действия. Подобные явления принято называть конфликтами. Конфликтная ситуации, взятая из жизни, довольно сложна. К тому же её изучение затруднительно наличием многих разных обстоятельств, часть из которых не оказывает существенного влияния на развитие конфликта или на его исход. Поэтому, для того что бы анализ конфликтной ситуации оказался возможным, необходимо отвлечение от второстепенных факторов, при удачном стечении обстоятельств позволяющее построить упрощенную формализованную модель конфликта, которую принято называть игрой. От реальной конфликтной ситуации её отличает то, что она ведется по определенным правилам.

Рассмотрим основные термины. Заинтересованные стороны являются игроками. Любое возможное для игрока действие является стратегией. Набор стратегий, называется ситуацией. Число, выражающее степень удовлетворения интересов игрока, является выигрышем.

Классификация, по виду функций выигрышей игры делятся:

1)  Матричные.

2)  Биматричные.

3)  Игры типа дуэль.

4)  Непрерывные.

5)  Выпуклые.

6)  Позиционные.

В моем докладе мы рассмотрим самые простые виды игр — матричные.

Матричные игры моделируют основные ситуации, в которых каждая из сторон-участниц делает свой ход одновременно со второй стороной.

Рассмотрим основные понятия матричных игр.

Рассмотрим игру, в которой участвуют 2 игрока, причем каждый из игроков имеет конечное число стратегий. Для удобства обозначим их как A и B. Предположим, что игрок А имеет m стратегий, а игрок Bn стратегий. Будем считать что выигрыш игрока А со стратегий Аik равен выигрышу игрока Bik или проигрышем. Тогда если нам известны значения aik, выигрыша при каждой паре стратегий, то их удобно записать в виде матрицы.

Полученная матрица имеет размер m x n и называется матрицей игры или платежной матрицей.

Оптимальная стратегия — это стратегия при многократном повторении которой отказ от выбранной стратегии одним из игроков увеличивает его шансы на проигрыш. В теории игр предполагается, что каждый из игроков стремиться к максимальному выигрышу, считая что соперник действует наилучшим для себя образом.

Таблица 1.

Действия игроков А и B при оптимальных стратегиях

Игрок A

Игрок B

Первый шаг

В каждой строке матрицы А ищется минимальный элемент. Полученный числа дописываются к заданной таблице виде правого добавочного столбца

В каждом столбике матрицы А ищется максимальный элемент. Полученные числа приписываются к заданной таблице в виде нижней добавочной строки

Второй шаг

Среди полученных чисел выбирается максимальное число.

Среди полученных чисел выбирается минимальное число.

Если игрок А будет придерживаться выбранной стратегии, то при любом поведении игрока В игроку А гарантирован выигрыш, не меньший α.

Если игрок В будет придерживаться выбранной стратегии, то при любом поведении игрока А игроку В гарантирован проигрыш, не больший β.

Число α является нижней ценой игры. Принцип построения стратегии игрока А, называется принципом максимина, а стратегия Аi0 — максиминной стратегией.

Число β называется верхней ценой игры. Принцип построения стратегии игрока В, называется принципом минимакса, а стратегия Вк0 — минимаксной стратегией игрока В.

 

Если α=β, то ситуация оказывается равновесной, и ни один из игроков не заинтересован в том, чтобы её нарушить. Если нижняя цена игры равна верхней цене игры, то общее значение называется ценой игры и обозначается ν.

В случае если α<β, уже нельзя говорить о равновесной игре и стоит говорить о смешанных стратегиях.

Смешанная стратегия — это случайная величина, значением которой являются стратегии игрока. Задание смешанной стратегии игрока состоит в указании вероятностей, с которыми выбираются его первоначальные стратегии. Рассмотрим матрицу m x n.

Сумма чистых стратегий игрока А равна 1.

Сумма чистых стратегий игрока В равна 1.

Задав 2 набора P={p1, p2, …, pm} и Q={q1, q2, …,qn} мы оказываемся в ситуации смешанных стратегий.

Величина ν=HA(P0,Q0) является ценой игры. А набор (P0, Q0, ν), называется решением матричной игры.

Методы решения матричных игр.

Игры 2 x n.

Предположим что игрок А выбрал смешанную стратегию P={p,1-p}, а игрок В чистую стратегию k=1,2,…,n. Тогда средний выигрыш игрока А в ситуации {P,k} оказывается равным w=aikp+a2k(1-p), на плоскости это уравнение описывает прямую, тем самым каждой чистой стратегии игрока В соответствует своя прямая. Поэтому на плоскости (p,w) рисуем все прямые w=aikp+a2k(1-p), k=1,2, …, n. Затем на каждой из построенных прямых определяется и отмечается наименьшее значение. В результате должна получиться ломаная, которая огибает снизу все семейство построенных прямых. Данная кривая является нижней огибающей. Верхняя точка нижней огибающий определяет цену игры — ν и оптимальную стратегию игрока А — P0={p0,1-p0}.

 

 

Игры m x 2.

Пусть Q={q,1-q} — произвольная смешанная стратегия игрока В. Если игрок А выбирает i-ю чистую стратегию, i=1,2, …, m, то средний выигрыш игрока В в ситуации {I,Q} будет равен w=ai1q+ai2(1-q), i=1,2, …,m. Аналогично строим прямые, но теперь находим максимальные значения. В результате получается ломаная — верхняя огибающая. Абсциссой нижней точки полученной ломаной будет значение q0, определяющие оптимальную смешанную стратегию игрока B, а ординатой w0 — цена игры.

 

Игры m x n.

Решение любой матричной игры можно свести к решению матриц 2 x n и m x 2.

Рассмотрим несколько правил, помогающих решать матричные игры.

Правило доминирования.

Произвольная матрица.

Будем говорить, что i-я строка матрицы А (ai1 ai2 … ain) не больше j-й строки этой матрицы (aj1 aj2 … ajn), если одновременно выполнены следующие n неравенств — ai1 ≤ aj1, ai2 ≤ aj2, … ainajn. При этом говорят, что j-я строка доминирует i-ю строку, или что стратегия Aj игрока А доминирует стратегию Ai. Если в матрице А строка доминирует другую строку, то число строк можно уменьшить путем отбрасывания доминируемой строки.

Рассмотрим случай когда k-й (a1k, a2k, …, amk) столбец матрицы А не меньше l-го (a1l, a2l, …, aml) столбца этой матрицы, если одновременно выполнены следующие m неравенствa a1ka1l, a2k a2l, …, amkaml. При этом говорят, что l-й столбец доминирует k-й столбец, или что стратегия Bl игрока В доминирует стратегию Bk. Если в матрице А один из столбцов доминирует другой столбец, то число столбцов в матрице А можно уменьшить путем отбрасывания доминируемого столбца.

Аффинное правило. (Допустимые преобразования матрицы игры и её цена).

Оптимальные стратегии у матричных игр, элементы матриц А и С которые связаны равенством сik=aik+µ, i=1,2,…,m; k=1,2,…,n, где λ>0, а µ — произвольно, имеют одинаковые равновесные ситуации, а их цены удовлетворяют следующему условию νс=νА+µ.

Рассмотрим пример матричной игры.

«Рейтинг-план студента».

Рассмотрим рейтинг-план студента по некоторому предметы.

Предположим, что платежная матрица, отражающая интересы договаривающихся сторон, имеет следующий вид

Матрица описывает результаты студента (игрок А) и баллы преподавателя (игрок В). Первая строка это баллы студента, которые он получил за первый модуль, Первый столбец — баллы преподавателя, которые можно максимально получить за первый модуль. Вторая строка показывает баллы студента за второй модуль, а второй столбец баллы, которые готов поставить преподаватель за второй модуль и так далее аналогично.

Студент стремиться максимизировать свои баллы, в то время как преподавателю хотелось бы минимизировать баллы для того что бы студент учился еще лучше.

В данной задаче нас интересует вопрос, хватит ли студенту баллов для получения зачета?

Нетрудно заметить, что седловой точки у платежной матрицы нет. Кроме того, для дальнейшего анализ существенными являются лишь стратегии А1 и А4 игрока А и стратегии В3 и В4 игрока В. (в этом нетрудно убедиться, воспользовавшись правилом доминирования стратегий) В результате соответствующего усечения получим матрицу

Воспользовавшись аффинным правилом

65=5·4+45; 45=5·0+45; 50=5·1+45; 55=5·2+45,

Получаем новую матрицу


w1=4p;

w2=1p+2(1-p);

w1=4q+1(1-q);

w2=2(1-q);


Воспользовавшись графическом методом, в итоге получим P={}, Q={0,0,}, ν=53.

Тем самым, студенту следуют выбирать стратегию А1 в 20 % случаев и стратегию А4 в 80 %. Что касается преподавателя, то ему следует выбирать стратегию В3 с вероятностью 0,4 и стратегию В4 с вероятностью 0,6. При этом ожидаемая цена игра равно 53.

Для изучения матричных игр мною было решено множество задач, сводимых к матричным играм: «Локальный конфликт», «Войны», «заработная плата», все задачи связанные с конфликтной ситуацией в которой двое участников легко разрешаются с помощью матричных игр.

В дальнейшем я собираюсь изучить и научиться решать другие виды игр, позиционные, биматричные, что бы разрешать конфликты не только между двумя игроками, но и с большим участием игроков. И получение знаний для решения конкретных задач на производстве.

 

Список литературы:
1.    «Вся высшая математика», М.Л. Краснов, А.И. Киселев, Г.И. Макаренко, Е.В. Шикин, В.И. Заляпин. Москва 2002.
2.    «Игры и решения» Р.Д. Льюс, Х. Райфа. Москва, 1961.
3.    «Теория игр и экономическое поведение» Дж. Фон Нейман, О. Моргенштерн.