Теория игр: история и применение. Использование теории игр в практике принятия управленческих решений Теория игр в бизнесе пример

Теория игр опирается на предположение о том, что независимо от цели игры и ее обстоятельств найдется стратегия, которая позволит вам добиться успеха. Составляете ли вы бизнес-стратегию, чтобы увеличить долю рынка, играете ли в покер, ведете ли переговоры о заработной плате или участвуете в аукционе — это всегда происходит по определенным правилам, хотя иногда их бывает трудно распознать.

Теория игр родилась не в учебном классе или на заседании совета директоров, а в казино. В 1930-е гг. профессор Принстона (Princeton University) и Гарварда (Harvard University) Джон фон Нойманн внимательно наблюдал за игрой в покер. Фон Нойманн был гениальным математиком, а не игроком. В результате возникла теория игр — уникальное математическое открытие, проливающее свет на возможности и вероятности поведения человека.

В дальнейшем фон Нойманн переключился на исследования, связанные с развитием ядерного арсенала США, и разработки первого компьютера. А теория игр обзавелась собственным «дзенским» языком дилемм и загадок. Самая известная из них — «дилемма узника».

Она представляет собой сценарий, придуманный в 1950 г. Альбертом Такером из Принстонского университета. Двое заключенных обвиняются в одном преступлении. Во время допросов в разных камерах каждому из них говорят, что, если один признается, а другой нет, признавшийся будет отпущен, а другой получит длительный тюремный срок. Если ни один из них не признается, оба отсидят в тюрьме небольшой срок, а если оба признаются, то получат средний срок.

Поразмышляв над возможностями, заключенные приходят к выводу, что лучше всего — сознаться. Поскольку принимают такое решение оба, они получают средний срок.

У «дилеммы узника» есть один серьезнейший изъян: теория игр рациональна, реальность — нет. Компании, которые интересуются теорией игр, обычно работают в жестко регулируемых отраслях, например в энергетике, там, где конкуренция ограниченна или существуют картели (такие, как ОПЕК в нефтяной промышленности). При ограниченном числе участников, соблюдающих установленные правила и ведущих себя рационально, теория игр помогает найти лучшие конкурентоспособные ходы.

Интерес к теории игр активизировался в 1994 г., когда нобелевскую премию по экономике получили три известных ученых — Джон Нэш, Джон Харшаньи и Рейнхард Зельтен. Харшаньи показал, что даже если участники конкретной игры знают друг о друг немного, ее все равно можно проанализировать так же, как и остальные. Молодой гений Нэш, прототип героя Рассела Кроу из фильма «Игры разума», внес самый весомый академический вклад в теорию игр. Он придумал так называемое равновесие Нэша, разработав эту идею в своей докторской диссертации.

Равновесие Нэша — точка, в которой ни один из игроков уже больше не может улучшить свое положение, сменив стратегию. Игроки меняют стратегии, пока не достигнут равновесия. (В «дилемме узника» равновесие Нэша достигается, когда оба преступника сознаются: они больше не могут улучшить свое положение, меняя стратегию, потому что тогда они попадут в тюрьму на более долгий срок.)

Есть другой классический пример. В отрасли действуют две конкурирующие компании. Каждая из них определяет цену на свой продукт. Если обе установят высокие цены, то получат максимальную прибыль; если они одновременно снизят цены, то все равно останутся в прибыли. Проблемы начинаются, когда компании устанавливают цены на разных уровнях. Если одна назначит высокую цену, а другая — низкую, конкурент с низкими ценами заработает гораздо больше денег. Оптимальным решением для обеих является установление высоких цен. Беда в том, что они будут стараться сбить цены конкурента. Дело кончится низкими ценами и меньшей прибылью для обеих фирм.

Основной урок этого и других сценариев, изученных теорией игр, состоит в том, что действия различных компаний и организаций взаимозависимы.

Фактически теория игр охватывает некоторые фундаментальные истины принятия решений. Если компания решает инвестировать, она должна учитывать реакцию окружающих — будь то конкуренты, клиенты или поставщики. Теория игр признает, что реальная жизнь проходит не в вакууме.

Компании должны хорошо представлять себе ответные действия конкурентов. Проще говоря, нужно поставить себя на их место и просчитать их возможные ходы. На профессиональном жаргоне это называется «аллоцентризмом».

Нет похожих записей

Предисловие

Задача данной статьи заключается в ознакомлении читателя с базовыми понятиями теории игр. Из статьи читатель узнает, что из себя представляет теория игр, рассмотрит краткую историю теории игр, познакомится с основными положениями теории игр, включая основные типы игр и формы их представления. В статье будет затронута классическая задача и фундаментальная проблема теории игр. Заключительный раздел статьи посвящен рассмотрению проблем применения теории игр для принятии управленческих решений и практического применения теории игр в управлении.

Введение.

21 век. Век информации, бурно развивающихся информационных технологий, инноваций и технологических новшеств. Но почему именно век информации? Почему информация играет ключевую роль практически во всех процессах, происходящих в обществе? Все очень просто. Информация даёт нам бесценное время, а в некоторых случаях даже возможность его опередить. Ведь ни для кого не секрет, что в жизни часто приходится сталкиваться с задачами, в которых необходимо принимать решения в условиях неопределённости, в условиях отсутствия информации об ответных реакциях на твои действия т. е. возникают ситуации, в которых две (или более) стороны преследуют различные цели, а результаты любого действия каждой из сторон зависят от мероприятий партнёра. Такие ситуации возникают каждый день. Например, при игре в шахматы, шашки, домино и так далее. Несмотря на то, что игры носят в основном развлекательный характер, по природе своей они относятся к конфликтным ситуациям, в которых конфликт уже заложен в цели игры - выигрыш одного из партнёров. При этом, результат каждого хода игрока зависит от ответного хода противника. В экономике конфликтные ситуации встречаются очень часто и имеют разнообразный характер, а количество их настолько велико, что невозможно подсчитать все конфликтные ситуации, возникающие на рынке хотя бы за один день. К конфликтным ситуациям в экономике относятся, например, взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом. Во всех вышеперечисленных примерах конфликтная ситуация порождается различием интересов партнёров и стремлением каждого из них принимать оптимальные решения, которые реализуют поставленные цели в наибольшей степени. При этом каждому приходится считаться не только со своими целями, но и с целями партнёра, и учитывать неизвестные заранее решения, которые эти партнёры будут принимать. Для грамотного решения задач в конфликтных ситуациях необходимы научно обоснованные методы. Такие методы разработаны математической теорией конфликтных ситуаций, которая носит название теории игр.

Что такое теория игр?

Теория игр представляет из себя сложное многоаспектное понятие, поэтому представляется невозможным привести толкование теории игр, используя лишь одно определение. Рассмотрим три подхода к определению теории игр.

1.Теория игр - математический метод изучения оптимальных стратегий в играх. Под игрой понимается процесс, в котором участвуют две и более сторон, ведущих борьбу за реализацию своих интересов. Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу - в зависимости от поведения других игроков. Теория игр помогает выбрать лучшие стратегии с учётом представлений о других участниках, их ресурсах и их возможных поступках.

2.Теория игр - это раздел прикладной математики, точнее - исследования операций. Чаще всего методы теории игр находят применение в экономике, чуть реже в других общественных науках - социологии, политологии, психологии, этике и других. Начиная с 1970-х годов её взяли на вооружение биологи для исследования поведения животных и теории эволюции. Очень важное значение теория игр имеет для искусственного интеллекта и кибернетики.

3.Одна из важнейших переменных, от которой зависит успех организации - конкурентоспособность. Очевидно, способность прогнозировать действия конкурентов означает преимущество для любой организации. Теория игр - метод моделирования оценки воздействия принятого решения на конкурентов.

История теории игр

Оптимальные решения или стратегии в математическом моделировании предлагались ещё в XVIII в. Задачи производства и ценообразования в условиях олигополии, которые стали позже хрестоматийными примерами теории игр, рассматривались в XIX в. А. Курно и Ж.Бертраном. В начале XX в. Э.Ласкер, Э.Цермело, Э.Борель выдвигают идею математической теории конфликта интересов.

Математическая теория игр берёт своё начало из неоклассической экономики. Впервые математические аспекты и приложения теории были изложены в классической книге 1944 года Джона фон Неймана и Оскара Моргенштерна «Теория игр и экономическое поведение».

Джон Нэш после окончания Политехнического института Карнеги с двумя дипломами - бакалавра и магистра - поступил в Принстонский университет, где посещал лекции Джона фон Неймана. В своих трудах Нэш разработал принципы «управленческой динамики». Первые концепции теории игр анализировали антагонистические игры, когда есть проигравшие и выигравшие за их счет игроки. Нэш разрабатывает методы анализа, в которых все участники или выигрывают, или терпят поражение. Эти ситуации получили названия «равновесие по Нэшу», или «некооперативное равновесие», в ситуации стороны используют оптимальную стратегию, что и приводит к созданию устойчивого равновесия. Игрокам выгодно сохранять это равновесие, так как любое изменение ухудшит их положение. Эти работы Нэша сделали серьезный вклад в развитие теории игр, были пересмотрены математические инструменты экономического моделирования. Джон Нэш показывает, что классический подход к конкуренции А.Смита, когда каждый сам за себя, неоптимален. Более оптимальны стратегии, когда каждый старается сделать лучше для себя, делая лучше для других. В 1949 году Джон Нэш пишет диссертацию по теории игр, через 45 лет он получает Нобелевскую премию по экономике.

Хотя теория игр первоначально и рассматривала экономические модели вплоть до 1950-х она оставалась формальной теорией в рамках математики. Но уже с 1950-х гг. начинаются попытки применить методы теории игр не только в экономике, но в биологии, кибернетике, технике, антропологии. Во время Второй мировой войны и сразу после нее теорией игр серьезно заинтересовались военные, которые увидели в ней мощный аппарат для исследования стратегических решений.

В 1960 - 1970 гг. интерес к теории игр угасает, несмотря на значительные математические результаты, полученные к тому времени. С середины 1980-х гг. начинается активное практическое использование теории игр, особенно в экономике и менеджменте. За последние 20 - 30 лет значение теории игр и интерес значительно растет, некоторые направления современной экономической теории невозможно изложить без применения теории игр.

Большим вкладом в применение теории игр стала работа Томаса Шеллинга, нобелевского лауреата по экономике 2005 г. «Стратегия конфликта». Т.Шеллинг рассматривает различные «стратегии» поведения участников конфликта. Эти стратегии совпадают с тактиками управления конфликтами и принципами анализа конфликтов в конфликтологии и в управлении конфликтами в организации.

Основные положения теории игр

Ознакомимся с основными понятиями теории игр. Математическая модель конфликтной ситуации называется игрой, стороны, участвующие в конфликте - игроками . Чтобы описать игру, необходимо сначала выявить ее участников (игроков). Это условие легко выполнимо, когда речь идет об обычных играх типа шахмат и т.п. Иначе обстоит дело с "рыночными играми". Здесь не всегда просто распознать всех игроков, т.е. действующих или потенциальных конкурентов. Практика показывает, что не обязательно идентифицировать всех игроков, надо обнаружить наиболее важных. Игры охватывают, как правило, несколько периодов, в течение которых игроки предпринимают последовательные или одновременные действия. Выбор и осуществление одного из предусмотренных правилами действий называется ходом игрока. Ходы могут быть личными и случайными. Личный ход - это сознательный выбор игроком одного из возможных действий (например, ход в шахматной игре). Случайный ход - это случайно выбранное действие (например, выбор карты из перетасованной колоды). Действия могут быть связаны с ценами, объемами продаж, затратами на научные исследования и разработки и т.д. Периоды, в течение которых игроки делают свои ходы, называются этапами игры. Выбранные на каждом этапе ходы в конечном счете определяют "платежи" (выигрыш или убыток) каждого игрока, которые могут выражаться в материальных ценностях или деньгах. Еще одним понятием данной теории является стратегия игрока. Стратегией игрока называется совокупность правил, определяющих выбор его действия при каждом личном ходе в зависимости от сложившейся ситуации. Обычно в процессе игры при каждом личном ходе игрок делает выбор в зависимости от конкретной ситуации. Однако в принципе возможно, что все решения приняты игроком заранее (в ответ на любую сложившуюся ситуацию). Это означает, что игрок выбрал определённую стратегию, которая может быть задана в виде списка правил или программы. (Так можно осуществить игру с помощью ЭВМ). Иначе говоря, под стратегией понимаются возможные действия, позволяющие игроку на каждом этапе игры выбирать из определенного количества альтернативных вариантов такой ход, который представляется ему "лучшим ответом" на действия других игроков. Относительно концепции стратегии следует заметить, что игрок определяет свои действия не только для этапов, которых фактически достигла конкретная игра, но и для всех ситуаций, включая и те, которые могут и не возникнуть в ходе данной игры. Игра называется парной , если в ней участвуют два игрока, и множественной , если число игроков больше двух. Для каждой формализованной игры вводятся правила, т.е. система условий, определяющая: 1) варианты действий игроков; 2) объём информации каждого игрока о поведении партнёров; 3) выигрыш, к которому приводит каждая совокупность действий. Как правило, выигрыш (или проигрыш) может быть задан количественно; например, можно оценить проигрыш нулём, выигрыш - единицей, а ничью - ½. Игра называется игрой с нулевой суммой, или антагонистической, если выигрыш одного из игроков равен проигрышу другого, т. е. для полного задания игры достаточно указать величину одного из них. Если обозначить а - выигрыш одного из игроков, b - выигрыш другого, то для игры с нулевой суммой b = -а, поэтому достаточно рассматривать, например а. Игра называется конечной, если у каждого игрока имеется конечное число стратегий, и бесконечной - в противном случае. Для того чтобы решить игру, или найти решение игры , следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности, т.е. один из игроков должен получать максимальный выигрыш , когда второй придерживается своей стратегии. В то же время второй игрок должен иметь минимальный проигрыш , если первый придерживается своей стратегии. Такие стратегии называются оптимальными . Оптимальные стратегии должны также удовлетворять условию устойчивости , т. е. любому из игроков должно быть невыгодно отказаться от своей стратегии в этой игре. Если игра повторяется достаточно много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной партии, а средний выигрыш (проигрыш) во всех партиях. Целью теории игр является определение оптимальной стратегии для каждого игрока . При выборе оптимальной стратегии естественно предполагать, что оба игрока ведут себя разумно с точки зрения своих интересов.

Кооперативные и некооперативные

Игра называется кооперативной, или коалиционной , если игроки могут объединяться в группы, беря на себя некоторые обязательства перед другими игроками и координируя свои действия. Этим она отличается от некооперативных игр, в которых каждый обязан играть за себя. Развлекательные игры редко являются кооперативными, однако такие механизмы нередки в повседневной жизни.

Часто предполагают, что кооперативные игры отличаются именно возможностью общения игроков друг с другом. В общем случае это неверно. Существуют игры, где коммуникация разрешена, но игроки преследуют личные цели, и наоборот.

Из двух типов игр, некооперативные описывают ситуации в мельчайших деталях и выдают более точные результаты. Кооперативные рассматривают процесс игры в целом.

Гибридные игры включают в себя элементы кооперативных и некооперативных игр. Например, игроки могут образовывать группы, но игра будет вестись в некооперативном стиле. Это значит, что каждый игрок будет преследовать интересы своей группы, вместе с тем стараясь достичь личной выгоды.

Симметричные и несимметричные

Несимметричная игра

Игра будет симметричной тогда, когда соответствующие стратегии у игроков будут равны, то есть иметь одинаковые платежи. Иначе говоря, если игроки могут поменяться местами и при этом их выигрыши за одни и те же ходы не изменятся. Многие изучаемые игры для двух игроков - симметричные. В частности, таковыми являются: «Дилемма заключённого», «Охота на оленя». В примере справа игра на первый взгляд может показаться симметричной из-за похожих стратегий, но это не так - ведь выигрыш второго игрока при профилях стратегий (А, А) и (Б, Б) будет больше, чем у первого.

С нулевой суммой и с ненулевой суммой

Игры с нулевой суммой - особая разновидность игр с постоянной суммой, то есть таких, где игроки не могут увеличить или уменьшить имеющиеся ресурсы, или фонд игры. В этом случае сумма всех выигрышей равна сумме всех проигрышей при любом ходе. Посмотрите направо - числа означают платежи игрокам - и их сумма в каждой клетке равна нулю. Примерами таких игр может служить покер, где один выигрывает все ставки других; реверси, где захватываются фишки противника; либо банальное воровство .

Многие изучаемые математиками игры, в том числе уже упоминавшаяся «Дилемма заключённого», иного рода: в играх с ненулевой суммой выигрыш какого-то игрока не обязательно означает проигрыш другого, и наоборот. Исход такой игры может быть меньше или больше нуля. Такие игры могут быть преобразованы к нулевой сумме - это делается введением фиктивного игрока , который «присваивает себе» излишек или восполняет недостаток средств.

Ещё игрой с отличной от нуля суммой является торговля , где каждый участник извлекает выгоду. Сюда также относятся шашки и шахматы; в двух последних игрок может превратить свою рядовую фигуру в более сильную, получив преимущество. Во всех этих случаях сумма игры увеличивается. Широко известным примером, где она уменьшается, является война .

Параллельные и последовательные

В параллельных играх игроки ходят одновременно, или, по крайней мере, они не осведомлены о выборе других до тех пор, пока все не сделают свой ход. В последовательных, или динамических , играх участники могут делать ходы в заранее установленном либо случайном порядке, но при этом они получают некоторую информацию о предшествующих действиях других. Эта информация может быть даже не совсем полной , например, игрок может узнать, что его противник из десяти своих стратегий точно не выбрал пятую, ничего не узнав о других.

Различия в представлении параллельных и последовательных игр рассматривались выше. Первые обычно представляют в нормальной форме, а вторые - в экстенсивной.

С полной или неполной информацией

Важное подмножество последовательных игр составляют игры с полной информацией. В такой игре участники знают все ходы, сделанные до текущего момента, равно как и возможные стратегии противников, что позволяет им в некоторой степени предсказать последующее развитие игры. Полная информация не доступна в параллельных играх, так как в них неизвестны текущие ходы противников. Большинство изучаемых в математике игр - с неполной информацией. Например, вся «соль» Дилеммы заключённого заключается в её неполноте.

Примеры игр с полной информацией: шахматы, шашки и другие.

Часто понятие полной информации путают с похожим - совершенной информации . Для последнего достаточно лишь знание всех доступных противникам стратегий, знание всех их ходов необязательно.

Игры с бесконечным числом шагов

Игры в реальном мире или изучаемые в экономике игры, как правило, длятся конечное число ходов. Математика не так ограничена, и в частности, в теории множеств рассматриваются игры, способные продолжаться бесконечно долго. Причём победитель и его выигрыш не определены до окончания всех ходов.

Задача, которая обычно ставится в этом случае, состоит не в поиске оптимального решения, а в поиске хотя бы выигрышной стратегии.

Дискретные и непрерывные игры

Большинство изучаемых игр дискретны : в них конечное число игроков, ходов, событий, исходов и т. п. Однако эти составляющие могут быть расширены на множество вещественных чисел. Игры, включающие такие элементы, часто называются дифференциальными. Они связаны с какой-то вещественной шкалой (обычно - шкалой времени), хотя происходящие в них события могут быть дискретными по природе. Дифференциальные игры находят своё применение в технике и технологиях, физике.

Метаигры

Это такие игры, результатом которых является набор правил для другой игры (называемой целевой или игрой-объектом ). Цель метаигр - увеличить полезность выдаваемого набора правил.

Форма представления игры

В теории игр наряду с классификацией игр огромную роль играет форма представления игры. Обычно выделяют нормальную, или матричную форму и развернутую, заданную в виде дерева. Эти формы для простой игры представлены на рис. 1а и 1б.

Чтобы установить первую связь со сферой управления, игру можно описать следующим образом. Два предприятия, производящие однородную продукцию, стоят перед выбором. В одном случае они могут закрепиться на рынке благодаря установлению высокой цены, которая обеспечит им среднюю картельную прибыль П K . При вступлении в жесткую конкурентную борьбу оба получают прибыль П W . Если один из конкурентов устанавливает высокую цену, а второй - низкую, то последний реализует монопольную прибыль П M , другой же несет убытки П G . Подобная ситуация может, например, возникнуть когда обе фирмы должны объявить свою цену, которая впоследствии не может быть пересмотрена.

При отсутствии жестких условий обоим предприятиям выгодно назначить низкую цену. Стратегия "низкой цены" является доминирующей для любой фирмы: вне зависимости от того, какую цену выбирает конкурирующая фирма, самой всегда предпочтительней устанавливать низкую цену. Но в таком случае перед фирмами возникает дилемма, так как прибыль П K (которая для обоих игроков выше, чем прибыль П W) не достигается.

Стратегическая комбинация "низкие цены/низкие цены" с соответствующими платежами представляет собой равновесие Нэша, при котором ни одному из игроков невыгодно сепаратно отходить от выбранной стратегии. Подобная концепция равновесия является принципиальной при разрешении стратегических ситуаций, но при определенных обстоятельствах она все же требует усовершенствования.

Что касается указанной выше дилеммы, то ее разрешение зависит, в частности, от оригинальности ходов игроков. Если предприятие имеет возможность пересмотреть свои стратегические переменные (в данном случае цену), то может быть найдено кооперативное решение проблемы даже без жесткого договора между игроками. Интуиция подсказывает, что при многократных контактах игроков появляются возможности добиться приемлемой "компенсации". Так, при известных обстоятельствах нецелесообразно стремиться к краткосрочным высоким прибылям путем ценового демпинга, если в дальнейшем может возникнуть "война цен".

Как отмечалось, оба рисунка характеризуют одну и ту же игру. Предоставление игры в нормальной форме в обычном случае отражает "синхронность". Однако это не означает "одновременность" событий, а указывает на то, что выбор стратегии игроком осуществляется в условиях неведения о выборе стратегии соперником. При развернутой форме такая ситуация выражается через овальное пространство (информационное поле). При отсутствии этого пространства игровая ситуация приобретает иной характер: сначала решение должен бы принимать один игрок, а другой мог бы делать это вслед за ним.

Классическая задача в теории игр

Рассмотрим классическую задачу в теории игр. Охота на оленя - кооперативная симметричная игра из теории игр, описывающая конфликт между личными интересами и общественными интересами. Игра была впервые описана Жан-Жаком Руссо в 1755 году:

" Если охотились на оленя, то каждый понимал, что для этого он обязан оставаться на своем посту; но если вблизи кого-либо из охотников пробегал заяц, то не приходилось сомневаться, что этот охотник без зазрения совести пустится за ним вдогонку и, настигнув добычу, весьма мало будет сокрушаться о том, что таким образом лишил добычи своих товарищей."

Охота на оленя - классический пример задачи обеспечения общественного блага при искушении человека поддаться своекорыстию. Должен ли охотник остаться с товарищами и сделать ставку на менее благоприятный случай доставить крупную добычу всему племени, либо покинуть товарищей и вверить себя более надежному случаю, сулящему его собственной семье зайца?

Фундаментальная проблема в теории игр

Рассмотрим фундаментальную проблему в теории игр под названием Дилемма заключенного.

Дилемма заключённого - фундаментальная проблема в теории игр, согласно которой игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других. Суть проблемы была сформулирована Мерилом Фладом и Мелвином Дрешером в 1950 году. Название дилемме дал математик Альберт Такер.

В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие - предательство обоих участников. Проще говоря, неважно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальному решению, т.е. решению, которое не может быть улучшено без ухудшения положения других элементов.). В этом и заключается дилемма.

В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания.

Классическая дилемма заключённого

Во всех судебных системах кара за бандитизм (совершение преступлений в составе организованной группы) намного тяжелее, чем за те же преступления, совершённые в одиночку (отсюда альтернативное название - «дилемма бандита»).

Классическая формулировка дилеммы заключённого такова:

Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет)(20 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и они приговариваются к 6 месяцам(1 год). Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года)(5 лет). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?

Игру можно представить в виде следующей таблицы:

Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.

Представим рассуждения одного из заключённых. Если партнёр молчит, то лучше его предать и выйти на свободу (иначе - полгода тюрьмы). Если партнёр свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе - 10 лет). Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу.

С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным.

Обобщённая форма

  1. В игре - два игрока и банкир. Каждый игрок держит 2 карты: на одной написано «сотрудничать», на другой - «предать» (это стандартная терминология игры). Каждый игрок кладёт одну карту перед банкиром лицом вниз (то есть никто не знает чужого решения, хотя знание чужого решения не влияет на анализ доминирования). Банкир открывает карты и выдаёт выигрыш.
  2. Если оба выбрали «сотрудничать», оба получают C . Если один выбрал «предать», другой «сотрудничать» - первый получает D , второй с . Если оба выбрали «предать» - оба получают d .
  3. Значения переменных C, D, c, d могут быть любого знака (в примере выше все меньше либо равны 0). Обязательно должно соблюдаться неравенство D > C > d > c, чтобы игра представляла собой «Дилемму заключённого» (ДЗ).
  4. Если игра повторяется, то есть играется больше 1 раза подряд, общий выигрыш от сотрудничества должен быть больше суммарного выигрыша в ситуации, когда один предаёт, а другой - нет, то есть 2C > D + c.

Эти правила были установлены Дугласом Хофштадтером и образуют каноническое описание типичной дилеммы заключённого.

Похожая, но другая игра

Хофштадтер предположил, что люди проще понимают задачи, как задача дилемма заключенного, если она представлена в виде отдельной игры или процесса торговли. Один из примеров - «обмен закрытыми сумками »:

Два человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая - товар. Каждый игрок может уважать сделку и положить в сумку то, о чём договорились, либо обмануть партнёра, дав пустую сумку.

В этой игре обман всегда будет наилучшим решением, означая также, что рациональные игроки никогда не будут играть в неё, и что рынок обмена закрытыми сумками будет отсутствовать.

Применение теории игр для принятия стратегических управленческих решений

В качестве примеров можно назвать решения по поводу проведения принципиальной ценовой политики, вступления на новые рынки, кооперации и создания совместных предприятий, определения лидеров и исполнителей в области инноваций, вертикальной интеграции и т.д. Положения теории игр в принципе можно использовать для всех видов решений, если на их принятие влияют другие действующие лица. Этими лицами, или игроками, необязательно должны быть рыночные конкуренты; в их роли могут выступать субпоставщики, ведущие клиенты, сотрудники организаций, а также коллеги по работе.

 Инструментарий теории игр особенно целесообразно применять, когда между участниками процесса существуют важные зависимости в области платежей . Ситуация с возможными конкурентами приведена на рис. 2.

 Квадранты 1 и 2 характеризуют ситуацию, когда реакция конкурентов не оказывает существенного влияния на платежи фирмы. Это происходит в тех случаях, когда у конкурента нет мотивации (поле 1 ) или возможности (поле 2 ) нанести "ответный удар". Поэтому нет необходимости в детальном анализе стратегии мотивированных действий конкурентов.

Аналогичный вывод следует, хотя и по другой причине, и для ситуации, отражаемой квадрантом 3 . Здесь реакция конкурентов могла бы изрядно воздействовать на фирму, но поскольку ее собственные действия не могут сильно повлиять на платежи конкурента, то и не следует опасаться его реакции. В качестве примера можно привести решения о вхождении в рыночную нишу: при определенных обстоятельствах у крупных конкурентов нет оснований реагировать на подобное решение небольшой фирмы.

Лишь ситуация, показанная в квадранте 4 (возможность ответных шагов рыночных партнеров), требует использования положений теории игр. Однако здесь отражены лишь необходимые, но недостаточные условия, чтобы оправдать применение базы теории игр для борьбы с конкурентами. Бывают ситуации, когда одна стратегия безусловно доминирует над всеми другими независимо от того, какие действия предпримет конкурент. Если взять, например, рынок лекарственных препаратов, то для фирмы часто бывает важно первой заявить новый товар на рынке: прибыль "первопроходца" оказывается столь значительной, что всем другим "игрокам" остается только быстрее активизировать инновационную деятельность.

 Тривиальным с позиций теории игр примером "доминирующей стратегии" является решение относительно проникновения на новый рынок. Возьмем предприятие, которое выступает в качестве монополиста на каком-либо рынке (например, IВМ на рынке персональных компьютеров в начале 80-х годов). Другое предприятие, действующее, к примеру, на рынке периферийного оборудования для ЭВМ, обдумывает вопрос о проникновении на рынок персональных компьютеров с переналадкой своего производства. Компания-аутсайдер может принять решение о вступлении или невступлении на рынок. Компания-монополист может отреагировать на появление нового конкурента агрессивно или дружественно. Оба предприятия вступают в двухэтапную игру, в которой первый ход делает компания-аутсайдер. Игровая ситуация с указанием платежей показана в виде дерева на рис.3.

 Та же самая игровая ситуация может быть представлена и в нормальной форме (рис.4).

Здесь обозначены два состояния - "вступление/дружественная реакция" и "невступление/ агрессивная реакция". Очевидно, что второе равновесие несостоятельно. Из развернутой формы следует, что для уже закрепившейся на рынке компании нецелесообразно реагировать агрессивно на появление нового конкурента: при агрессивном поведении теперешний монополист получает 1(платеж), а при дружественном - 3. Компания-аутсайдер к тому же знает, что для монополиста не рационально начинать действия по ее вытеснению, и поэтому она принимает решение о вступлении на рынок. Грозившие потери в размере (-1) компания-аутсайдер не понесет.

Подобное рациональное равновесие характерно для "частично усовершенствованной" игры, которая заведомо исключает абсурдные ходы. Такие равновесные состояния на практике в принципе довольно просто найти. Равновесные конфигурации могут быть выявлены с помощью специального алгоритма из области исследования операций для любой конечной игры. Игрок, принимающий решение, поступает следующим образом: вначале делается выбор "лучшего" хода на последнем этапе игры, затем выбирается "лучший" ход на предшествующем этапе с учетом выбора на последнем этапе и так далее, до тех пор пока не будет достигнут начальный узел дерева игры.

Какую пользу могут извлечь компании из анализа на базе теории игр? Известен, например, случай столкновения интересов компаний IВМ и Telex. В связи с объявлением о подготовительных планах последней к вступлению на рынок состоялось "кризисное" совещание руководства IВМ, на котором были проанализированы мероприятия, направленные на то, чтобы заставить нового конкурента отказаться от намерения проникнуть на новый рынок. Компании Telex, видимо, стало известно об этих мероприятиях. Анализ на базе теории игр показал, что угрозы IВМ из-за высоких затрат безосновательны. Это свидетельствует, что компаниям полезно в обдумывать возможные реакции партнеров по игре. Изолированные хозяйственные расчеты, даже опирающиеся на теорию принятия решений, часто носят, как в изложенной ситуации, ограниченный характер. Так, компания-аутсайдер могла бы и выбрать ход "невступление", если бы предварительный анализ убедил ее в том, что проникновение на рынок вызовет агрессивную реакцию монополиста. В этом случае в соответствии с критерием ожидаемой стоимости разумно выбрать ход "невступление" при вероятности агрессивного ответа 0,5.

 Следующий пример связан с соперничеством компаний в области технологического лидерства. Исходной является ситуация, когда предприятие 1 ранее обладало технологическим превосходством, но в настоящее время располагает меньшими финансовыми ресурсами для научных исследований и разработок (НИР), чем его конкурент. Оба предприятия должны решить вопрос, попытаться ли с помощью крупных капиталовложений добиться доминирующего положения на мировом рынке в соответствующей технологической области. Если оба конкурента вложат в дело крупные средства, то перспективы на успех у предприятия 1 будут лучше, хотя оно и понесет большие финансовые расходы (как и предприятие 2 ). На рис. 5 эта ситуация представлена платежами с отрицательными значениями.

Для предприятия 1 лучше всего было бы, если бы предприятие 2 отказалось от конкуренции. Его выгода в таком случае составила бы 3 (платежа). С большой вероятностью предприятие 2 выиграло бы соперничество, когда предприятие 1 приняло бы урезанную программу инвестиций, а предприятие 2 - более широкую. Это положение отражено в правом верхнем квадранте матрицы.

Анализ ситуации показывает, что равновесие наступает при высоких затратах на НИР предприятия 2 и низких предприятия 1 . При любом другом раскладе у одного из конкурентов появляется резон отклониться от стратегической комбинации: так, для предприятия 1 предпочтителен сокращенный бюджет, если предприятие 2 откажется от участия в соперничестве; в то же время предприятию 2 известно, что при низких затратах конкурента ему выгодно инвестировать в НИР.

Предприятие, имеющее технологическое преимущество, может прибегнуть к анализу ситуации на базе теории игр, чтобы в конечном счете добиться оптимального для себя результата. С помощью определенного сигнала оно должно показать, что готово осуществить крупные затраты на НИР. Если такой сигнал не поступил, то для предприятия 2 ясно, что предприятие 1 выбирает вариант низких затрат.

О достоверности сигнала должны свидетельствовать обязательства предприятия. В данном случае это может быть решение предприятия 1 о закупке новых лабораторий или найме на работу дополнительного научно-исследовательского персонала.

С точки зрения теории игр подобные обязательства равнозначны изменению хода игры: ситуация одновременного принятия решений сменяется ситуацией последовательных ходов. Предприятие 1 твердо демонстрирует намерение пойти на крупные затраты, предприятие 2 регистрирует этот шаг и у него нет больше резона участвовать в соперничестве. Новое равновесие вытекает из расклада "неучастие предприятия 2 " и "высокие затраты на НИР предприятия 1 ".

 К числу известных областей применения методов теории игр следует отнести также ценовую стратегию, создание совместных предприятий, расчет времени разработки новой продукции.

Важный вклад в использование теории игр вносят экспериментальные работы . Многие теоретические выкладки отрабатываются в лабораторных условиях, а полученные результаты служат импульсом для практиков. Теоретически было выяснено, при каких условиях двум эгоистически настроенным партнерам целесообразно сотрудничать и добиваться лучших для себя результатов.

Эти знания можно использовать в практике предприятий, чтобы помочь двум фирмам достичь ситуации "выигрыш/выигрыш". Сегодня консультанты с подготовкой в области игр быстро и однозначно выявляют возможности, которыми предприятия могут воспользоваться для заключения стабильных и долгосрочных договоров с клиентами, субпоставщиками, партнерами по разработкам и т.п.

Проблемы практического применения в управлении

Безусловно, следует указать и на наличие определенных границ применения аналитического инструментария теории игр. В следующих случаях он может быть использован лишь при условии получения дополнительной информации.

Во-первых, это тот случай, когда у предприятий сложились разные представления об игре, в которой они участвуют, или когда они недостаточно информированы о возможностях друг друга. Например, может иметь место неясная информация о платежах конкурента (структуре издержек). Если неполнотой характеризуется не слишком сложная информация, то можно оперировать сопоставлением подобных случаев с учетом определенных различий.

Во-вторых, теорию игр трудно применять при множестве ситуаций равновесия. Эта проблема может возникнуть даже в ходе простых игр с одновременным выбором стратегических решений.

В-третьих, если ситуация принятия стратегических решений очень сложна, то игроки часто не могут выбрать лучшие для себя варианты. Легко представить более сложную ситуацию проникновения на рынок, чем та, которая рассмотрена выше. Например, на рынок в разные сроки могут вступить несколько предприятий или реакция уже действующих там предприятий может оказаться более сложной, нежели быть агрессивной или дружественной.

Экспериментально доказано, что при расширении игры до десяти и более этапов игроки уже не в состоянии пользоваться соответствующими алгоритмами и продолжать игру с равновесными стратегиями.

Теория игр используется не так часто. К сожалению, ситуации реального мира зачастую очень сложны и настолько быстро изменяются, что невозможно точно спрогнозировать, как отреагируют конкуренты на изменение тактики фирмы. Тем не менее, теория игр полезна, когда требуется определить наиболее важные и требующие учета факторы в ситуации принятия решений в условиях конкурентной борьбы. Эта информация важна, поскольку позволяет руководству учесть дополнительные переменные или факторы, могущие повлиять на ситуацию, и тем самым повышает эффективность решения.

В заключение следует особо подчеркнуть, что теория игр является очень сложной областью знания. При обращении к ней надо соблюдать известную осторожность и четко знать границы применения. Слишком простые толкования, принимаемые фирмой самостоятельно или с помощью консультантов, таят в себе скрытую опасность. Анализ и консультации на основе теории игр из-за их сложности рекомендуются лишь для особо важных проблемных областей. Опыт фирм показывает, что использование соответствующего инструментария предпочтительно при принятии однократных, принципиально важных плановых стратегических решений, в том числе при подготовке крупных кооперационных договоров.

Список литературы

1. Теория игр и экономическое поведение, фон Нейман Дж., Моргенштерн О., изд-во Наука, 1970

2. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр: Учеб. пособие для ун-тов - М.: Высш. шк., Книжный дом «Университет», 1998

3. Дубина И. Н. Основы теории экономических игр: учебное пособие.- М.: КНОРУС, 2010

4. Архив журнала "Проблемы Теории и Практики Управления"., Райнер Фелькер

5. Теория игр в управлении организационными системами. 2-е издание ., Губко М.В., Новиков Д.А. 2005


- Ж. Ж. Руссо. Рассуждение о происхождении и основаниях неравенства между людьми // Трактаты / Пер. с франц. А. Хаютина - М.: Наука, 1969. - С. 75.

экспериментальной экономики

И других методов анализа

Как и любая другая не полностью конвенциальная наука, институциональная экономика применяет разные методы анализа. К ним относятся традиционный микроэкономический инструментарий, эконометрические методы, анализ статистической информации и др. В данном разделе кратко рассмотрим применение теории игр, экспериментальной экономики и других методов, адаптированных к институциональному анализу.

Теория игр . Теория игр – аналитический метод, получивший развитие после второй мировой войны и используемый для анализа ситуаций, в которых индивидуумы стратегически взаимодействуют. Шахматы – это прототип стратегической игры, так как результат зависит от поведения противника, так же как и от поведения собственно игрока. Из-за аналогий, найденных между стратегическими играми и формами политического и экономического взаимодействия, теории игр уделяется повышенное внимание в общественных науках. Современная теория игр начинается с работы Д. Неймана и О. Моргенштерна «Теория игр и экономическое поведение» (1944, русский вариант – 1970). Теория исследует взаимодействие индивидуальных решений при некоторых допущениях, касающихся принятия решения в условиях риска, общего состояния окружающей среды, кооперативного или некооперативного поведения других индивидов. Очевидно, что рациональному индивиду приходится принимать решения в условиях неопределенности и взаимодействия. Если выигрыш одного индивида является проигрышем другого, то это игра с нулевой суммой. Когда каждый из индивидов может выиграть от решения одного из них, то имеет место игра с ненулевой суммой. Игра может быть кооперативной, когда возможен сговор, и некооперативной, когда преобладает антагонизм. Одним из известных примеров игры с ненулевой суммой является дилемма заключенного (ДЗ). Этот пример показывает, что, вопреки утверждениям либерализма, преследование индивидом собственного интереса ведет к решению менее удовлетворительному, чем возможные альтернативы.

Предельная теорема Ф.И. Эджуорта рассматривается как ранний пример кооперативной игры n участников. Теорема утверждает, что по мере увеличения числа участников в экономике чистого обмена сговор становится менее полезным, а множество возможных равновесных относительных цен (ядро) уменьшается. Если число участников стремится к бесконечности, то остается только одна система относительных цен, соответствующая ценам общего равновесия.

Понятие оптимального (равновесного) по Нэшу решения является одним из ключевых в теории игр. Оно было введено в 1951 г. американским экономистом-математиком Джоном Ф. Нэшем.

В данном контексте достаточно рассмотреть это понятие применительно к теоретико-игровой модели двух лиц 25 . В этой модели каждый из участников располагает некоторым непустым множеством стратегий S i , i = 1, 2. При этом выбор конкретных стратегий из числа доступных игроку осуществляется таким образом, чтобы максимизировать значение собственной функции выигрыша (полезности) u i , i = 1, 2. Значения функции выигрыша заданы на множестве упорядоченных пар стратегий игроков S 1 ´ S 2 , элементами которого выступают всевозможные сочетания стратегий игроков (s 1 , s 2) (упорядоченность пар стратегий заключается в том, что в каждом из сочетаний на первом месте стоит стратегия первого игрока, на втором – второго), т.е. u i = u i (s 1 , s 2), i = 1, 2. Иными словами, выигрыш каждого игрока зависит не только от выбираемой им самим стратегии, но и от стратегии, принятой его противником.

Оптимальным по Нэшу решением признается пара стратегий (s 1 *, s 2 *), s i S i , i = 1, 2, обладающая следующим свойством: стратегия s 1 * обеспечивает игроку 1 максимальный выигрыш, когда игрок 2 выбирает стратегию s 2 *, и симметрично s 2 * доставляет максимальное значение функции выигрыша игрока 2 , когда игроком 1 принимается стратегия s 1 *. Пара стратегий приводит к равновесию по Нэшу, если выбор, сделанный игроком 1 , оптимален при данном выборе игрока 2 , а выбор, сделанный игроком 2, оптимален при данном выборе игрока 1 . Понятие оптимальности по Нэшу очевидным образом обобщается на случай игры n лиц. Следует заметить, что существование равновесия по Нэшу не означает его Парето-оптимальности, а Парето-оптимальный набор стратегий не обязательно должен удовлетворять равновесию по Нэшу. В 1994 г. Дж. Ф. Нэшу, Р. Зельтену и Дж. Ч. Харшани была присуждена Премия памяти А. Нобеля по экономике за их вклад в разработку теории игр и ее приложение к экономике.

Обращение к этому методу опирается на его явную силу в освещении причин и последствий институционального изменения. Способность теории игр помочь анализировать последствия изменения правил бесспорна; ее сила в раскрытии причин неоднозначна. Любой теоретико-игровой анализ должен предполагать предшествующее определение основных правил игры. Так, О. Моргенштерн в 1968 г. писал: «Игры описаны путем определения возможного поведения в пределах правил игры. Правила являются в каждом случае однозначными; например, в шахматах определенные ходы разрешены для специфических фигур, но запрещены для других. Правила также ненарушаемы. Когда социальная ситуация рассматривается как игра, правила даны физической и юридической окружающей средой, в пределах которой имеют место действия индивидуумов» 26 .

Если эта точка зрения принимается, нельзя ожидать, что теория игр объяснит причину изменения в фундаментальных правилах организации экономической, политической и социальной жизни: определение таких правил, очевидно, является предварительным условием для проведения такого анализа.

Для понимания значения институтов используются модели координационной игры и дилеммы заключенных.

Рассмотримпроблему чистой и обобщенной координации . Чистая координационная игра показывает, что экономические агенты не могут гарантированно реализовать взаимные выгоды кооперации, даже если отсутствует конфликт интересов. Другими словами, в ситуации «чистой» координации имеется множественное равновесие, которое одинаково предпочитается каждой стороной. В этом случае нет конфликта интересов, но нет гарантии, что все будут стремиться к одному равновесному результату. Известный пример – выбор стороны дороги (правой или левой), по которой люди должны ездить (рис. 2.1). Данная игра имеет два равновесия по Нэшу, соответствующих наборам стратегий (левая, левая) и (правая, правая). Никто заранее не возражает ездить справа или слева, но достижение скоординированного результата при большом количестве участников переговоров потребует высоких трансакционных издержек. Необходим институт, который бы выполнил функцию фокальной точки, т.е. ввел согласованное решение. Таким институтом может быть результат общего знания, полученного на основе однотипного анализа ситуации, а может быть и государство, которое вмешивается, чтобы ввести правило координации и сократить трансакционные издержки. В целом институты выполняют координационную функцию, снижая неопределенность.

Обобщенная проблема координации существует, если матрица выигрышей такова, что в любой точке равновесия никто из игроков не имеет стимула изменить свое поведение при данном поведении других игроков, но и никто из игроков не желает, чтобы какой-либо другой игрок изменил его. В этом случае каждый предпочел бы скоординированный результат не скоординированному, но, возможно, каждый захочет предпочесть особый скоординированный результат (рис. 2.2). Например, два производителяА и Б используют различную технологию X и Y , но хотят ввести национальный стандарт изделия, который вызовет сетевые внешние эффекты. Производитель А больше выиграет, если стандартом станет технология Х , а производитель Б – технология Y . Выигрыш оказывается распределенным асимметрично. Итак, производитель А (Б ) предпочтет, чтобы стандартом стала X (Y )-технология, но оба предпочтут любой из скоординированных результатов не скоординированному. Трансакционные издержки в этой модели будут выше, чем в предыдущей (особенно при участии большого количества сторон), так как налицо столкновение интересов. Замена частных попыток координации государственным вмешательством позволила бы уменьшить трансакционные издержки в экономике. Примерами являются государственное введение технологических стандартов, стандартов измерения и качества и т.д. Обобщенная координационная модель иллюстрирует важность не только координационной функции институтов, но и распределительной, от которой зависит способ, ограничивающий возможные альтернативы игроков, и в конечном счете результативность взаимодействия.

Дилемма заключенного часто приводится как пример проблемы установления кооперации между индивидами. В игре участвуют два игрока, два заключенных, которые разделены своими надзирателями. У каждого есть два выбора: кооперироваться, т.е. хранить молчание, или отказаться от кооперации, т.е. предать другого. Каждый должен действовать, не зная, что предпримет другой. Каждому говорят, что признание, если другой молчит, ведет к свободе. Отказ от признания в случае предательства другого означает смерть. Если оба признаются, то проведут вместе несколько лет в тюрьме. Если каждый из них откажется от признания, то будет на короткое время арестован и затем освобожден. Предполагая, что тюрьма предпочтительнее смерти, а свобода – наиболее желаемое состояние, заключенные сталкиваются с парадоксом: хотя они оба предпочли бы не предавать друг друга и провести недолгое время в тюрьме, каждый окажется в лучшем положении, предав другого, не считаясь с тем, что предпримет другой. Аналитически способность заключенных установить связь находится на заднем плане, так как стимулы к предательству остаются одинаково сильными при наличии или без наличия связи. Предательство остается доминирующей стратегией.

Этот анализ помогает объяснить, почему эгоистично-макси­ми­зирующие агенты не могут рационально приходить к кооперативному результату или поддерживать его (парадокс индивидуальной рациональности). Он полезен в объяснении ex post распада картеля или другого кооперативного соглашения, но не объясняет, каким способом сформирован картель или кооперативное соглашение. Если заключенные способны достичь соглашения, то проблема исчезает: они договариваются не предавать друг друга и прийти к тому, чтобы максимизировать совместные выигрыши. Итак, достаточно вступить в соглашение, которое совместно желательно, но делает каждого в отдельности потенциально более уязвимым к ущербу, чем в отсутствие такого соглашения. Этот анализ обращает внимание на институты, которые с индивидуальной точки зрения могут превратить такие соглашения в менее рискованные.

В теоретической литературе дается различие между анализом кооперативных и некооперативных игр. Как уже описано, игроки способны заключать связывающие их соглашения. Гарант таких соглашений – неявный. Многие теоретики игр настаивают на том, что обман и разрыв соглашений – общие черты человеческих взаимоотношений, поэтому такое поведение должно оставаться внутри стратегического пространства. Они пытаются объяснить возникновение и сохранение кооперации в модели некооперативных игр, особенно в модели бесконечно повторяющейся последовательности игр ДЗ. Конечная последовательность игр не даст результата, потому что с момента, когда доминирующая стратегия в последней игре станет явно отступнической, и с момента, когда она станет ожидаемой, то же самое будет верно для предпоследней игры и так далее, до первой игры. В бесконечных сериях игр при определенных предположениях о дисконтировании выигрышей может появиться кооперация как равновесная стратегия. Таким образом, некооперативный анализ не избегает потребности принять основные правила игры как часть описания стратегического пространства. Он просто предполагает отличный и менее ограничительный набор правил. В отличие от кооперативного анализа соглашения могут быть разорваны по желанию. С другой стороны, выход из непрерывной игры ограничен. Ни один подход не избегает потребности определять правила игры, перед тем как начать анализ.

Одним из наиболее интересных недавних достижений в исследовании ДЗ была организация турниров между предопределенными стратегиями для проведения конечно повторяющихся игр ДЗ с двумя участниками. Первый из них был организован Робертом Аксельродом (описан в 1984 г.) и включал игру последовательностью в 200 партий. Опытными в ДЗ участниками были предложены компьютерные программы, и которые затем состязались друг с другом.

Р. Аксельрод сообщил игрокам, что стратегии будут оценены не по числу побед, а согласно сумме очков против всех других стратегий, причем три очка каждый получает за взаимную кооперацию, одно очко за взаимное отступничество и выигрыш 5 к 0 за отступничество/кооперацию. Как отмечено ранее, аналитически ясно, что отступничество – доминирующая стратегия последней игры и, следовательно, каждой предыдущей игры.

Рассмотрим матрицу выигрышей в ДЗ, анализируемую Р. Аксельродом 27 (рис. 2.3). Независимо от того, что делает другой игрок, предательство дает более высокое вознаграждение, чем кооперация. Если первый игрок думает, что другой игрок будет молчать, то ему выгоднее предать ($5>$3). С другой стороны, если первый игрок думает, что другой предаст, ему все равно выгоднее предать самому ($1 лучше, чем ничего). Следовательно, искушение склоняет к предательству. Но если оба предают, то оба получают меньше, чем в ситуации кооперации ($1+$1<$3+$3).

Второй игрок

Кооперируется

Первый игрок

Кооперируется

Рис. 2.3 . Матрица выигрышей в дилемме заключенного

Дилемма заключенного – знаменитая проблема в экономике – показывает: то, что рационально или оптимально для одного агента, может не быть рациональным или оптимальным для группы индивидов, рассматриваемых совместно. Эгоистичное поведение индивида может быть вредным или разрушительным для группы. В повторяющихся играх ДЗ соответствующая стратегия неочевидна. Чтобы найти хорошую стратегию, и были организованы турниры. Если выигрыш был бы получен строго на основе победа–проигрыш, то каждый участник турнира должен был предложить непрерывное отступничество. Однако правила выигрыша дали понять, что организация некоторой кооперации могла бы привести к более высоким общим результатам. К удивлению многих, победила простая стратегия «зуб за зуб», предложенная А. Рапопортом: игрок кооперируется на первом шаге и затем делает тот ход, который другой игрок делал на предыдущем шаге.

Во втором турнире участвовало гораздо больше игроков, в том числе профессионалов, а также тех, кто знал о результатах первого раунда. Итогом была еще одна победа стратегии копирования («зуб за зуб»).

Анализ результатов турниров выявил четыре свойства, приводящие к успешной стратегии: 1) стремление избежать ненужного конфликта и кооперироваться так долго, как это делает другой; 2) способность к вызову перед лицом ничем не вызванного предательства другого; 3) прощение после ответа на вызов; 4) ясность поведения, чтобы другой игрок мог распознать и адаптироваться к образу действия первого.

Р. Аксельрод показал, что кооперация может начаться, развиваться и стабилизироваться в ситуациях, которые в противном случае являются экстраординарными, не обещая ничего хорошего. Можно согласиться с тем, что стратегия «зуб за зуб» в аналитическом смысле иррациональна в конечно повторяющейся игре, но эмпирически, очевидно, нет. Если бы стратегия «зуб за зуб» состязалась с другими аналитическими стратегиями, все из которых состояли из непрерывных отступничеств, она не смогла бы победить в турнире.

Теория игр может быть важным инструментом для изучения человеческого взаимодействия в ограниченных правилами обстоятельствах. Благодаря своим возможностям изучать последствия разных институциональных соглашений она также может быть полезна с точки зрения государственной политики при проектировании новых институциональных соглашений. Теория игр использовалась в анализе общественных благ, олигополии, картеля и сговоров на рынках товаров и труда. При всех своих достоинствах теория игр обладает и относительными слабостями. Некоторые авторы высказали сомнения относительно применения модели дилеммы заключенного в социальной науке. Например, М. Тейлор в 1987 г. предположил, что такие игры соответствуют обстоятельствам обеспечения общественными благами. В 1985 г. Н. Шофилд утверждал, что агенты должны формировать согласованные понятия об убеждениях и желаниях других агентов, включая проблемы познания и интерпретации, которые не просты для моделирования 28 . Многие экономисты отмечали, что использование теории игр без оговорок может свести экономическую деятельность к слишком статичной схеме. В частности, нобелевский лауреат Р. Стоун в 1948 г. писал: «Главная черта, благодаря которой теория игр впадает в противоречие с живой действительностью, заключается в том, что объект исследования ограничен во времени – игра имеет начало и конец. Об экономической действительности этого не скажешь. Именно в возможности обособить партию от игры и заключается глубокое расхождение теории с реальностью, а это расхождение ограничивает ее применение» 29 . Однако с тех пор неоценимо много сделано для сглаживания этого расхождения и расширения применения теории игр в экономике.

Экспериментальная экономика . Другим методическим подходом, использующимся для проверки постулатов экономической теории и смежных наук, а также объяснения институциональных проблем является экспериментальная экономика . Влияние проектируемых институтов на эффективность разме­щения ресурсов не всегда можно предсказать ex ante. Один из вариантов экономии на издержках ех post – имитация работы институтов в лабораторных условиях.

Вообще экономический эксперимент – это воспроизведение экономического явления или процесса с целью изучения в наиболее благоприятных условиях и дальнейшего практического изменения. Эксперименты, которые осуществляются в реальных условиях, называются естественными, или полевыми, а эксперименты, проводимые в искусственных условиях, – лабораторными. Последние зачастую требуют использования экономико-математических методов и моделей. Естественные эксперименты могут проводиться на микроуровне (эксперименты Р. Оуэна, Ф. Тейлора, по внедрению хозрасчета на предприятии и т.п.) и на макроуровне (варианты экономической политики, свободные экономические зоны и пр.). Лабораторные эксперименты – это искусственно воспроизведенные экономические ситуации, некие экономические модели, чья среда (условия протекания эксперимента) контролируется исследователем в лаборатории.

Американский экономист Эл. Рот, с конца 70-х гг. работающий в области экспериментальной экономики, отмечает ряд преимуществ лабораторных экспериментов перед «полевыми» 30 . В лабораторных условиях возможен полный контроль экспериментатора над средой и поведением субъектов, в то время как при «полевых» экспериментах можно контролировать лишь ограниченное число факторов среды и почти невозможно – поведение экономических субъектов. Именно благодаря этому лабораторные эксперименты позволяют более точно определять условия, при которых можно ожидать повторения отдельных явлений. Кроме того, естественные эксперименты дорогостоящи, и в случае неудачи затрагивают судьбы многих людей.

Область интересов экспериментальной экономики достаточно обширна: положения теории игр, теории отраслевых рынков, модель рационального выбора, феномен рыночного равновесия, проблемы общественных благ и др.

Для примера остановимся на результатах исследования сравнительной эффективности институтов рынка, которые опубликованы Ч.А. Холтом и представлены А.Е. Шаститко 31 . В исследовании сопоставляются выводы теоретической и экспериментальной моделей рынка, полученные с помощью контролируемых экспериментов. Результаты поведения агентов измеряются с помощью коэффициента исчерпания суммы потенциальных рент покупателя и продавца, что соответствует эффективности обмена. Коэффициент исчерпания – отношение фактически (экспериментально) полученной ренты к максимально возможной величине – изменяется от 0 до 1. Сравнение проводилось по следующим формам рынка: двусторонний аукцион, торговля на основе ценовых заявок одной из сторон, расчетная палата, децентрализованные переговоры о цене, торговля на основе заявок с последующими переговорами. Наиболее интересные результаты экспериментов получены разными группами исследователей по двум первым формам рынка (табл. 2.1).

Теория игр - совокупность математических методов решения конфликтных ситуаций (столкновений интересов). В теории игр игрой называется математическая модель конфликтной ситуации. Предмет особого интереса теории игр - исследование стратегий принятия решений участников игры в условиях неопределённости. Неопределённость связана с тем, что две или более стороны преследуют противоположные цели, а результаты любого действия каждой из сторон зависят от ходов партнёра. При этом каждая из сторон стремится принимать оптимальные решения, которые реализуют поставленные цели в наибольшей степени.

Наиболее последовательно теория игр применяется в экономике, где конфликтные ситуации возникают, например, в отношениях между поставщиком и потребителем, покупателем и продавцом, банком и клиентом. Применение теории игр можно найти и в политике, социологии, биологии, военном искусстве.

Из истории теории игр

История теории игр как самостоятельной дисциплины начинается в 1944 году, когда Джон фон Нейман и Оскар Моргенштерн опубликовали книгу "Теория игр и экономическое поведение" ("Theory of Games and Economic Behavior"). Хотя примеры теории игр встречались и раньше: трактат Вавилонского Талмуда о разделе имущества умершего мужа между его жёнами, карточные игры в 18-м веке, развитие теории шахматной игры в начале 20-го века, доказательство теоремы о минимаксе того же Джона фон Неймана в 1928 году, без которой не было бы никакой теории игр.

В 50-х годах 20-го века Мелвин Дрешер и Мерил Флод из Rand Corporation первыми экспериментально применили дилемму заключённого, Джон Нэш в работах о состоянии равновесия в играх двух лиц развил понятие равновесия Нэша.

Рейнхард Сэлтен в 1965 году опубликовал книгу "Обработка олигополии в теории игр по требованию" ("Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit"), с которой применение теории игр в экономике получило новую движущую силу. Шагом вперёд в эволюции теории игр связан с работой Джона Мейнарда Смита "Эволюционно стабильная стратегия" ("Evolutionary Stable Strategy", 1974). Дилемма заключённого была популяризована в книге Роберта Аксельрода "Эволюция кооперации" ("The Evolution of Cooperation"), опубликованной в 1984 году. В 1994 году именно за вклад в теорию игр Нобелевской премии были удостоены Джон Нэш, Джон Харсаньи и Рейнхард Сэлтен.

Теория игр в жизни и бизнесе

Остановимся подробнее на сути кофликтной ситуации (столкновении интересов) в том смысле, как он понимается в теории игр для дальнейшего моделирования различных ситуаций в жизни и бизнесе. Пусть индивидуум находится в таком положении, которое приводит к одному из нескольких возможных исходов, причём у индивидуума имеются по отношению к этим исходам некоторые личные предпочтения. Но хотя он может до некоторой степени управлять переменными факторами, определяющими исход, он не имеет полной власти над ними. Иногда управление находится в руках нескольких индивидуумов, которые, подобно ему, имеют какие-то предпочтения по отношению к возможным исходам, но в общем случае интересы этих индивидуумов не согласуются. В других случаях конечный исход может зависеть как от случайностей (которые в юридических науках иногда именуются стихийными бедствиями), так и от других индивидуумов. Теория игр систематизирует наблюдения за такими ситуациями и формулировки общих принципов для руководства разумными действиями в таких ситуациях.

В некоторых отношениях название "теория игр" неудачно, так как наводит на мысль, что теория игр рассматривает лишь не имеющие социального значения столкновения, происходящие в салонных играх, но всё же эта теория имеет значительно более широкое значение.

О применении теории игр может дать представление следующая экономическая ситуация. Пусть имеется несколько предпринимателей, каждый из которых стремится получить максимум прибыли, имея при этом лишь ограниченную власть над переменными, определяющими эту прибыль. Предприниматель не имеет власти над переменными, которыми распоряжается другой предприниматель, но которые могут сильно влиять на доход первого. Трактовка этой ситуации как игры может вызвать следующее возражение. В игровой модели предполагается, что каждый предприниматель делает один выбор из области возможных выборов и этими единичными выборами определяются прибыли. Очевидно, что этого почти не может быть в действительности, так как при этом в промышленности не были бы нужны сложные управленческие аппараты. Просто есть ряд решений и модификаций этих решений, которые зависят от выборов, совершённых другими участниками экономической системы (игроками). Но в принципе можно вообразить, что какой-либо администратор предвидит все возможные случайности и подробно описывает действие, которое нужно предпринимать в каждом случае, вместо того чтобы решать каждую задачу по мере её возникновения.

Военный кофликт, по определению, есть столкновение интересов, в котором ни одна из сторон не распоряжается полностью переменными, определяющими исход, который решается рядом битв. Можно просто считать исход выигрышем или проигрышем и приписать им численные значения 1 и 0.

Одна из самых простых конфликтных ситуаций, которая может быть записана и решена в теории игр - дуэль, представляющая собой конфликт двух игроков 1 и 2, имеющих соответственно p и q выстрелов. Для каждого игрока существует функция, указывающая вероятность того, что выстрел игрока i в момент времени t даст попадание, которое окажется смертельным.

В итоге теория игр приходит к такой формулировке некоторого класса столкновений интересов: имеются n игроков, и каждому нужно выбрать одну возможность из стого определённого набора, причём при совершении выбора у игрока нет никаких сведений о выборах других игроков. Область возможных выборов игрока может содержать такие элементы, как "ход тузом пик", "производство танков вместо автомобилей", или в общем смысле, стратегию, определяющую все действия, которые нужно совершить во всех возможных обстоятельствах. Перед каждым игроком стоит задача: какой выбор он должен сделать, чтобы его частное влияние на исход принесло ему как можно больший выигрыш?

Математическая модель в теории игр и формализация задач

Как мы уже отмечали, игра является математической моделью конфликтной ситуации и требует наличия следующих компонент:

  1. заинтересованных сторон;
  2. возможных действий с каждой стороны;
  3. интересов сторон.

Заинтересованные в игре стороны называются игроками , каждый из них может предпринять не менее двух действий (если в распоряжении игрока только одно действие, то он фактически не участвует в игре, так как заранее известно, что он предпримет). Исход игры называется выигрышем .

Реальная конфликтная ситуация не всегда, а игра (в понятии теории игр) - всегда - протекает по определённым правилам , которые точно определяют:

  1. варианты действий игроков;
  2. объём информации каждого игрока о поведении партнёра;
  3. выигрыш, к которому приводит каждая совокупность действий.

Примерами формализованных игр могут служить футбол, карточная игра, шахматы.

Но в экономике модель поведения игроков возникает, например, когда несколько фирм стремятся занять более выгодное место на рынке, несколько лиц пытаются поделить между собой какое-либо благо (ресурсы, финансы) так, чтобы каждому досталось по возможности больше. Игроками в конфликтных ситуациях в экономике, которые можно моделировать в виде игры, являются фирмы, банки, отдельные люди и другие экономические агенты. В свою очередь в условиях войны модель игры используется, например, в выборе более лучшего оружия (из имеющегося или потенциально возможного) для разгрома противника или защиты от нападения.

Для игры характерна неопределённость результата . Причины неопределённости можно распределить по следующим группам:

  1. комбинаторные (как в шахматах);
  2. влияние случайных факторов (как в игре "орёл или решка", кости, карточные игры);
  3. стратегические (игрок не знает, какое действие предпримет противник).

Стратегией игрока называется совокупность правил, определяющих его действия при каждом ходе в зависимости от сложившейся ситуации.

Целью теории игр является определение оптимальной стратегии для каждого игрока. Определить такую стратегию - значит решить игру. Оптимальность стратегии достигается, когда один из игроков должен получить максимальный выигрыш, при том, что второй придерживается своей стратегии. А второй игрок должен иметь минимальный проигрыш, если первый придерживается своей стратегии.

Классификация игр

  1. Классификация по числу игроков (игра двух и более лиц). Игры двух лиц занимают центральное место во всей теории игр. Основным понятием теории игр для игры двух лиц является обобщение весьма существенной идеи равновесия, которая естественно появляется в играх двух лиц. Что же касается игр n лиц, то одна часть теории игр посвящена играм, в которых сотрудничество между игроками запрещено. В другой части теории игр n лиц предполагается, что игроки могут сотрудничать для взаимной пользы (см. далее в этом параграфе о некооперативных и кооперативных играх).
  2. Классификация по числу игроков и их стратегиям (число стратегий не менее двух, может быть бесконечностью).
  3. Классификация по количеству информации относительно прошлых ходов: игры с полной информацией и неполной информацией. Пусть есть игрок 1 - покупатель и игрок 2 - продавец. Если у игрока 1 нет полной информации о действиях игрока 2, то игрок 1 может и не различить две альтернативы, между которыми ему предстоит сделать выбор. Например, выбирая между двумя видами некоторого товара и не зная о том, что по некоторым признакам товар A хуже товара B , игрок 1 может не видеть различия между альтернативами.
  4. Классификация по принципам деления выигрыша : кооперативные, коалиционные с одной стороны и некооперативные, бескоалиционные с другой стороны. В некооперативной игре , или иначе - бескоалиционной игре , игроки выбирают стратегии одновременно, не зная, какую стратегию выберет второй игрок. Коммуникация между игроками невозможна. В кооперативной игре , или иначе - коалиционной игре , игроки могут объединяться в коалиции и предпринимать коллективные действия, чтобы увеличить свои выигрыши.
  5. Конечная игра двух лиц с нулевой суммой или антогонистическая игра – это стратегическая игра с полной информацией, в которой участвуют стороны с противоположными интересами. Анатагонистическими играми являются матричные игры .

Классический пример из теории игр - дилемма заключённого

Двух подозреваемых берут под стражу и изолируют друг от друга. Окружной прокурор убеждён, что они совершили тяжкое преступление, но не имеет достаточных доказательств, чтобы предъявить им обвинение на суде. Он говорит каждому из заключённых, что у него имеется две альтернативы: признаться в преступлении, которое по убеждению полиции он совершил, или не признаваться. Если оба не признаются, то окружной прокурор предъявит им обвинение в каком-либо незначительном преступлении, например, мелкая кража или незаконное владение оружием, и они оба получат небольшое наказание. Если они оба признаются, то будут подлежать судебной ответственности, но он не потребует самого строгого приговора. Если же один признается, а другой нет, то признавшемуся приговор будет смягчён за выдачу сообщника, в то время как упорствующий получит "на полную катушку".

Если эту стратегическую задачу сформулировать в сроках заключения, то она сводится к следующему:

Таким образом, если оба заключённых не признаются, они получат по 1 году каждый. Если оба признаются, то каждый получит по 8 лет. А если один признается, другой не признается, то тот, который признался отделается тремя месяцами заключения, а тот, который не признается, получит 10 лет. Приведённая выше матрица правильно отражает дилемму заключённого: перед каждым стоит вопрос - признаться или не признаться. Игра, которую окружной прокурор предлагает заключённым, представляет собой некооперативную игру или иначе - бескоалиционную игру . Если бы оба заключённых имели возможность сотрудничать (то есть игра была бы кооперативной или иначе коалиционной игрой ), то оба не признались бы и получили по году тюрьмы каждый.

Примеры использования математических средств теории игр

Переходим теперь к рассмотрению решений примеров распространённых классов игр, для которых в теории игр существуют методы исследования и решения.

Пример формализации некооперативной (бескоалиционной) игры двух лиц

В предыдущем параграфе мы уже рассмотрели пример некооперативной (бескоалиционной) игры (дилемма заключённого). Давайте закрепим наши навыки. Для этого подойдёт также классический сюжет, навеянный "Приключениями Шерлока Холмса" Артура Конан Дойля. Можно, конечно, возразить: пример не из жизни, а из литературы, но ведь Конан Дойль не зарекомендовал себя как писатель-фантаст! Классический ещё и потому, что задание выполнено Оскаром Моргенштерном, как мы уже установили - одним из основателей теории игр.

Пример 1. Будет приведено сокращённое изложение фрагмента одного из "Приключений Шерлока Холмса". Согласно известным понятиям теории игр составить модель конфликтной ситуации и формально записать игру.

Шерлок Холмс намерен отправиться из Лондона в Дувр с дальнейшей целю попасть на континент (европейский), чтобы спастись от профессора Мориарти, который преследует его. Сев в поезд, он увидел на вокзальной платформе профессора Мориарти. Шерлок Холмс допускает, что Мориарти может выбрать особый поезд и обогнать его. У Шерлока Холмса две альтернативы: продолжать поездку до Дувра или сойти на станции Кентерберри, являющейся единственной промежуточной станцией на его маршруте. Мы принимаем, что его противник достаточно разумен, чтобы определить возможности Холмса, поэтому перед ним те же две альтернативы. Оба противника должны выбрать станцию, чтобы сойти на ней с поезда, не зная, какое решение примет каждый из них. Если в результате принятия решения оба окажутся на одной и той же станции, то можно однозначно считать, что Шерлок Холмс будет убит профессором Мориарти. Если же Шерлок Холмс благополучно доберётся до Дувра, то он будет спасён.

Решение. Героев Конан Дойля можем рассматривать как участников игры, то есть игроков. В распоряжении каждого игрока i (i =1,2) две чистые стратегии:

  • сойти в Дувре (стратегия s i1 (i =1,2) );
  • сойти на промежуточной станции (стратегия s i2 (i =1,2) )

В зависимости от того, какую из двух стратегий выберет каждый из двух игроков, будет создана особая комбинация стратегий как пара s = (s 1 , s 2 ) .

Каждой комбинации можно поставить в соответствие событие - исход попытки убийства Шерлока Холмса профессором Мориарти. Составляем матрицу данной игры с возможными событиями.

Под каждым из событий указан индекс, означающий приобретение профессора Мориарти, и рассчитываемый в зависимости от спасения Холмса. Оба героя выбирают стратегию одновременно, не зная, что выберет противник. Таким образом, игра является некооперативной, поскольку, во-первых, игроки находятся в разных поездах, а во-вторых, имеют противоположные интересы.

Пример формализации и решения кооперативной (коалиционной) игры n лиц

В этом пункте практическая часть, то есть ход решения примера задачи, будет предварена теоретической частью, в которой будем знакомиться с понятиями теории игр для решения кооперативных (бескоалиционных) игр. Для этой задачи теория игр предлагает:

  • характеристическую функцию (если говорить упрощённо, она отражает величину выгоды объединения игроков в коалицию);
  • понятие аддитивности (свойства величин, состоящее в том, что значение величины, соответствующее целому объекту, равно сумме значений величин, соответствующих его частям, в некотором классе разбиений объекта на части) и супераддитивности (значение величины, соответствующее целому объекту, больше суммы значений величин, соответствующих его частям) характеристической функции.

Супераддитивность характеристической функции говорит о том, что объединение в коалиции выгодна игрокам, так как в этом случае величина выигрыша коалиции увеличивается с увеличением числа игроков.

Для формализации игры нам нужно ввести формальные обозначения вышеназванных понятий.

Для игры n обозначим множество всех её игроков как N = {1,2,...,n} Любое непустое подмножество множества N обозначим как Т (включая само N и все подмножества, состоящие из одного элемента). На сайте есть занятие "Множества и операции над множествами ", которое при переходе по ссылке открывается в новом окне.

Характеристическая функция обозначается как v и область её определения состоит из возможных подмножеств множества N . v (T ) - значение характеристической функции для того или иного подмножества, например, доход, полученный коалицией, в том числе, возможно, состоящей из одного игрока. Это важно по той причине, что теория игр требует проверить наличие супераддитивности для значений характеристической функции всех непересекающихся коалиций.

Для двух непустых коалиций из подмножеств T 1 и T 2 аддитивность характеристической функции кооперативной (коалиционной) игры записывается так:

А супераддитивность так:

Пример 2. Трое студентов музыкальной школы подрабатывают в разных клубах, свою выручку они получают от посетителей клубов. Установить, выгодно ли им объединять свои силы (если да, то с какими условиями), используя понятия теории игр для решения кооперативных игр n лиц, при следующих исходных данных.

В среднем их выручка за один вечер составляла:

  • у скрипача 600 единиц;
  • у гитариста 700 единиц;
  • у певицы 900 единиц.

Пытаясь увеличить выручку, студенты в течение нескольких месяцев создавали различные группы. Результаты показали, что, объединившись, они могут увеличить свою выручку за вечер следующим образом:

  • скрипач + гитарист зарабатывали 1500 единиц;
  • скрипач + певица зарабатывали 1800 единиц;
  • гитарист + певица зарабатывали 1900 единиц;
  • скрипач + гитарист + певица зарабатывали 3000 единиц.

Решение. В этом примере число участников игры n = 3 , следовательно, область определения характеристической функции игры состоит из 2³ = 8 возможных подмножеств множества всех игроков. Перечислим все возможные коалиции T :

  • коалиции из одного элемента, каждая из которых состоит из одного игрока - музыканта: T {1} , T {2} , T {3} ;
  • коалиции из двух элементов: T {1,2} , T {1,3} , T {2,3} ;
  • коалиция из трёх элементов: T {1,2,3} .

Каждому из игроков присвоим порядковый номер:

  • скрипач - 1-й игрок;
  • гитарист - 2-й игрок;
  • певица - 3-й игрок.

По данным задачи определим характеристическую функцию игры v :

v(T{1}) = 600 ; v(T{2}) = 700 ; v(T{3}) = 900 ; эти значения характеристической функции определены исходя из выигрышей соответственно первого, второго и третьего игроков, когда они не объединяются в коалиции;

v(T{1,2}) = 1500 ; v(T{1,3}) = 1800 ; v(T{2,3}) = 1900 ; эти значения характеристической функции определены по выручке каждой пары игроков, объединившихся в коалиции;

v(T{1,2,3}) = 3000 ; это значение характеристической функции определено по средней выручке в случае, когда игроки объединялись в тройки.

Таким образом, мы перечислили все возможные коалиции игроков, их получилось восемь, как и должно быть, так как область определения характеристической функции игры состоит именно из восьми возможных подмножеств множества всех игроков. Что и требует теория игр, так как нам нужно проверить наличие супераддитивности для значений характеристической функции всех непересекающихся коалиций.

Как выполняются условия супераддитивности в этом примере? Определим, как игроки образуют непересекающиеся коалиции T 1 и T 2 . Если часть игроков входят в коалицию T 1 , то все остальные игроки входят в коалицию T 2 и по определению эта коалиция образуется как разность всего множества игроков и множества T 1 . Тогда, если T 1 - коалиция из одного игрока, то в коалиции T 2 будут второй и третий игроки, если в коалиции T 1 будут первый и третий игроки, то коалиция T 2 будет состоять только из второго игрока, и так далее.

В 1930-е годы Джон и Оскар Моргенштерн стали основателями нового интересного направления математики, которое получило название "теория игр". В 1950-е годы этим направлением заинтересовался молодой математик Джон Нэш. Теория равновесия стала темой его диссертации, которую он написал, будучи в возрасте 21 год. Так родилась новая под названием «Равновесие по Нэшу», заслужившая Нобелевскую премию спустя много лет - в 1994 году.

Долгий разрыв между написанием диссертации и всеобщим признанием стал испытанием для математика. Гениальность без признания вылилась в серьезные ментальные нарушения, но и эту задачу Джон Нэш смог решить благодаря прекрасному логическуму разуму. Его теория "равновесие по Нэшу" удостоилась премии Нобеля, а его жизнь экранизации в фильме «Beautiful mind» («Игры разума»).

Кратко о теории игр

Поскольку теория равновесия Нэша объясняет поведение людей в условиях взаимодействия, поэтому стоит рассмотреть основные понятия теории игр.

Теория игр изучает поведение участников (агентов) в условиях взаимодействия друг с другом по типу игры, когда исход зависит от решения и поведения нескольких людей. Участник принимает решения, руководствуясь своими прогнозами относительно поведения остальных, что и называется игровой стратегией.

Существует также доминирующая стратегия, при которой участник получает оптимальный результат при любом поведении других участников. Это наилучшая безпроигрышная стратегия игрока.

Дилемма заключенного и научный прорыв

Дилемма заключенного - это случай с игрой, когда участники вынуждены принимать рациональные решения, достигая общей цели в условии конфликта альтернатив. Вопрос заключается в том, какой из этих вариантов он выберет, осознавая личный и общий интерес, а также невозможность получить и то, и другое. Игроки словно заключены в жесткие игровые условия, что порой заставляет их мыслить очень продуктивно.

Эту дилемму исследовал американский математик Равновесие, которое он вывел, стало революционным в своем роде. Особенно ярко эта новая мысль повлияла на мнение экономистов о том, как делают выбор игроки рынка, учитывая интересы других, при плотном взаимодействии и пересечении интересов.

Лучше всего изучать теорию игр на конкретных примерах, поскольку сама эта математическая дисциплина не является сухо-теоретической.

Пример дилеммы заключенного

Пример, два человека совершили грабеж, попали в руки полиции и проходят допрос в отдельных камерах. При этом служители полиции предлагают каждому участнику выгодные условия, при которых он выйдет на свободу в случае дачи показаний против своего напарника. У каждого из преступников существует следующий набор стратегий, которые он будет рассматривать:

  1. Оба одновременно дают показания и получают по 2,5 года в тюрьме.
  2. Оба одновременно молчат и получают по 1 году, поскольку в таком случае доказательная база их вины будет мала.
  3. Один дает показания и получает свободу, а другой молчит и получает 5 лет тюрьмы.

Очевидно, что исход дела зависит от решения обоих участников, но сговориться они не могут, поскольку сидят в разных камерах. Также ярко виден конфликт их личных интересов в борьбе за общий интерес. У каждого из заключенных есть два варианта действий и 4 варианта исходов.

Цепь логических умозаключений

Итак, преступник А рассматривает следующие варианты:

  1. Я молчу и молчит мой напарник — мы оба получим по 1 году тюрьмы.
  2. Я сдаю напарника и он сдает меня — мы оба получим по 2,5 года тюрьмы.
  3. Я молчу, а напарник меня сдает — я получу 5 лет тюрьмы, а он свободу.
  4. Я сдаю напарника, а он молчит - я получаю свободу, а он 5 лет тюрьмы.

Приведем матрицу возможных решений и исходов для наглядности.

Таблица вероятных исходов дилеммы заключенного.

Вопрос состоит в том, что выберет каждый участник?

«Молчать, нельзя говорить» или «молчать нельзя, говорить»

Чтобы понять выбор участника, нужно пройти по цепочке его размышлений. Следуя рассуждениям преступника А: если я промолчу и промолчит мой напарник, мы получим минимум срока (1 год), но я не могу узнать, как он себя поведет. Если он даст показания против меня, то мне также лучше дать показания, иначе я могу сесть на 5 лет. Лучше мне сесть на 2,5 года, чем на 5 лет. Если он промолчит, то мне тем более нужно дать показания, поскольку так я получу свободу. Точно так же рассуждает и участник B.

Нетрудно понять, что доминирующая стратегия для каждого из преступников - это дача показаний. Оптимальная точка этой игры наступает тогда, когда оба преступника дают показания и получают свой «приз» — 2,5 года тюрьмы. Теория игр Нэша называет это равновесием.

Неоптимальное оптимальное решение по Нэшу

Революционность нэшевского взгляда в том, не является оптимальным, если рассмотреть отдельного участника и его личный интерес. Ведь наилучший вариант - это промолчать и выйти на свободу.

Равновесие по Нэшу - это точка соприкосновения интересов, где каждый участник выбирает такой вариант, который для него оптимальный только при условии, что другие участники выбирают определенную стратегию.

Рассматривая вариант, когда оба преступника молчат и получают всего по 1 году, можно назвать него Парето-оптимальным вариантом. Однако он возможен, только если преступники смогли бы сговориться заранее. Но даже это не гарантировало бы этого исхода, поскольку соблазн отступить от уговора и избежать наказания велик. Отсутствие полного доверия друг к другу и опасность получить 5 лет вынуждает выбрать вариант с признанием. Размышлять о том, что участники будут придерживаться варианта с молчанием, действуя согласованно, просто нерационально. Такой вывод можно сделать, если изучать равновесие Нэша. Примеры только доказывают правоту.

Эгоистично или рационально

Теория равновесия Нэша дала потрясающие выводы, опровергнувшие существующие до этого принципы. Например, Адам Смит рассматривал поведение каждого из участников как абсолютно эгоистичное, что и приводило систему в равновесие. Эта теория носила название «невидимая рука рынка».

Джон Нэш увидел, что если все участники будут действовать, преследуя только свои интересы, то это никогда не приведет к оптимальному групповому результату. Учитывая, что рациональное мышление присуще каждому участнику, более вероятен выбор, который предлагает стратегия равновесия Нэша.

Чисто мужской эксперимент

Ярким примером может служить игра «парадокс блондинки», которая хотя и кажется неуместной, но является яркой иллюстрацией, показывающей, как работает теория игр Нэша.

В этой игре нужно представить, что компания свободных парней пришла в бар. Рядом оказывается компания девушек, одна из которых предпочтительнее других, скажем блондинка. Как парням повести себя, чтобы получить наилучшую подругу для себя?

Итак, рассуждения парней: если все начнут знакомиться с блондинкой, то, скорее всего, она никому не достанется, тогда и ее подруги не захотят знакомства. Никто не хочет быть вторым запасным вариантом. Но если парни выберут избегать блондинку, то вероятность каждому из парней найти среди девушек хорошую подругу высока.

Ситуация равновесия по Нэшу неоптимальна для парней, поскольку, преследуя лишь свои эгоистические интересы, каждый выбрал бы именно блондинку. Видно, что преследование только эгоистичных интересов будет равнозначно краху групповых интересов. Равновесие по Нэшу будет значить то, что каждый парень действует в своих личных интересах, которые соприкасаются с интересами всей группы. Это неоптимальный вариант для каждого лично, но оптимальный для каждого, исходя из общей стратегии успеха.

Вся наша жизнь игра

Принятие решений в реальных условиях очень напоминает игру, когда вы ожидаете определенного рационального поведения и от других участников. В бизнесе, в работе, в коллективе, в компании и даже в отношениях с противоположным полом. От больших сделок и до обычных жизненных ситуаций все подчиняется тому или иному закону.

Конечно, рассмотренные игровые ситуации с преступниками и баром - это всего лишь отличные иллюстрации, демонстрирующие равновесие Нэша. Примеры таких дилемм очень часто возникают на реальном рынке, а особенно это работает в случаях с двумя монополистами, контролирующими рынок.

Смешанные стратегии

Часто мы вовлекаемы не в одну, а сразу в несколько игр. Выбирая один из вариантов одной игре, руководствуясь рациональной стратегией, но попадаете в другую игру. После нескольких рациональных решений вы можете обнаружить, что ваш результат вас не устраивает. Что же предпринимать?

Рассмотрим два вида стратегии:

  • Чистая стратегия - это поведение участника, которое исходит из размышления над возможным поведением других участников.
  • Смешанная стратегия или случайная стратегия - это чередование чистых стратегий случайным образом или выбор чистой стратегии с определенной вероятностью. Такую стратегию еще называют рэндомизированной.

Рассматривая такое поведение, мы получаем новый взгляд на равновесие по Нешу. Если ранее говорилось о том, что игрок выбирает стратегию один раз, то можно представить и другое поведение. Можно допустить тот вариант, что игроки выбирают стратегию случайно с определенной вероятностью. Игры, в которых нельзя найти равновесия Нэша в чистых стратегиях, всегда имеют их в смешанных.

Равновесие Нэша в смешанных стратегиях называется смешанным равновесием. Это такое равновесие, где каждый участник выбирает оптимальную частоту выбора своих стратегий при условии, что другие участники выбирают свои стратегии с заданной частотой.

Пенальти и смешанная стратегия

Пример смешанной стратегии можно привести в игре в футбол. Лучшая иллюстрация смешанной стратегии - это, пожалуй, серия пенальти. Так, у нас есть вратарь, который может прыгнуть только в один угол, и игрок, который будет бить пенальти.

Итак, если в первый раз игрок выберет стратегию сделать удар в левый угол, а вратарь также упадет в этот угол и словит мяч, то как могут развиваться события во второй раз? Если игрок будет бить в противоположный угол, это, скорее всего, слишком очевидно, но и удар в тот же угол не менее очевиден. Поэтому и вратарю, и бьющему ничего не остается, как положиться на случайный выбор.

Так, чередуя случайный выбор с определенной чистой стратегией, игрок и вратарь пытаються получить максимальный результат.