Каталог@Mail.ru - каталог ресурсов интернет HitMeter - счетчик посетителей сайта, бесплатная статистика

Принятие решений при наличии неопределённостей

Часть 1. Природная и поведенческая неопределённость. Многошаговые задачи принятия решений

На главную Математический раздел Криптография и т.д. Новости

Что это за неопределённости

Простейший процесс принятия решений заключается в следующем. Есть множество альтернатив (вариантов, из которых мы должны выбрать наилучший), а также правило оценки вариантов, по сути отражающее, что для нас хорошо и что плохо. Это правило является функцией, показывающей, от чего и как зависит предпочтительность или "неудачность" для нас варианта выбора, и называется целевой функцией. На множестве вариантов выбора решается задача оптимизации целевой функции - выбора такого варианта, при котором значение целевой функции наибольшее (или наоборот, наименьшее). В самом счастливом случае, хорошо пережёванном теорией принятия решений, целевая функция - функция оценок вариантов по критериям. Да ещё и предполагается, что для каждого варианта мы можем определить оценку по каждому из критериев.

Допустим, командование республики Бананос выбирает новую модификацию танка, чтобы оснастить армию, критерии - защищённость, быстрота, вооружённость. Предпочтительность танка зависит только от этих критериев, при этом для всех танков можно оценить характеристики брони, скорость, дальность орудия, убойную силу снаряда, скорострельность и т.п.

Бывает, что нам приходится принимать решение исходя из того, что нельзя пренебречь неким не зависящим от нас фактором. При этом он оказывается известен уже после принятия решения. Скажем, мы решили сходить в поход, а тут как назло жутко похолодало, да ещё и дождь пошёл. А такой погоды могло и не быть. Заранее не знали.

Другая ситуация с независимым параметром - когда выбираем, по какой стратегии играть в шахматной партии. Ясно, что есть некие практически универсальные правила вроде не подставлять тупо фигуру под бой, не допускать, чтобы было слабым пешечное прикрытие короля. Но ведь мы не знаем, как будет ходить противник. Мы можем с высокой вероятностью полагать, что после нашего ближайшего хода e2-e4 он ответит e7-e5 (вроде разумно), но не можем этого гарантировать. А вдруг он пойдёт одной из крайних пешек? Да, вроде как тупо, но именно с крайних пешек автор сей статьи начинал немало победных своих партий.

Итак, вот общая суть, что это за принятие решений в условиях неопределённости: есть некий вопрос, ответ на который мы получим уже после принятия решения, хотя очень неплохо бы получить его ещё до выбора.

Теория принятия решений рассматривает такие виды неопределённостей, как природная и поведенческая. Они принципиально различны.

Суть природной неопределённости - наличие некоторых непредсказуемых состояний внешней среды, "безмозглой природы", которая слепо что-то подкинет нам, не желая пособить или навредить и не извлекая от наших успехов и страданий своей выгоды. Ну пошёл дождь, а мы были без зонта - а что, кто-то прямо подгадывал этот момент, чтобы вымочить нас? Или мы бурили скважину, а нефти не нашли - а что, она от нас нарочно удрала? В целом же "природа" в этой теории в широком смысле - в смысле слепых обстоятельств. Поэтому даже участие в лотерее - при условии её честности - вполне задача из серии природной неопределённости.

Суть поведенческой неопределённости - в деле принимает участие некий мыслящий (или считающий себя мыслящим) агент, у которого есть свои цели. Мы не можем поковыряться у него в мозгах и понять, как он себя поведёт, разве что сделать разумные предположения, если знаем его цели. А ведь от его действий зависят и наши результаты. Яркий пример - поля сражений, вот уж где немало поломали головы и набили шишек даже гениальные стратеги. Вспомните те же слова Бисмарка про наших: "Никогда не воюйте с русскими. На каждую вашу военную хитрость они ответят непредсказуемой глупостью". Правда, тут поправка: глупость или не глупость, суть проста - супостаты неудачно просчитывали наши ходы.

В самом конце также коротко укажем на ещё один важный момент. Задача принятия решений может быть одношаговой - решение принимается один раз - и многошаговой - идёт выбор сценариев, в которых, возможно, придётся неоднократно принимать какие-либо решения. Там же коротко скажем про деревья решений.

Природная неопределённость

Суть этой штуки изложена выше. Теперь подробнее. Как правило, рассматривается следующий случай. Известно множество возможных состояний "природы", целевая функция зависит как от нашего выбора, так и от состояния, с которым мы столкнёмся, и называется функцией реализации. Допустим, x = {x1, x2, ..., xn} - множество вариантов выбора, z = {z1, z2, ..., zm} - множество состояний, тогда удобно использовать матрицу размера n*m, где элемент (i, j) - наша оценка ситуации, когда мы выбрали вариант xi, а внешняя среда приняла состояние zj, оценка, насколько для нас это хорошо или плохо.

Допустим, мы собрались прогуляться далеко от мест, где можно укрыться, варианты - делать или не делать это, внешняя среда характеризуется тем, какая будет погода в день прогулки (будет ли дождь?). Допустим, мы оцениваем ситуацию 1 - "дела идут хорошо", 0 - "так себе", -1 - "паршиво". Вот какой матрицей мы можем это представить:

Нет дождяМелкий дождикПриличный дождь
Гулять10-1
Не гулять000


Теория принятия решений рассматривает два варианта ситуаций: 1) известны вероятности состояний внешней среды; 2) вероятности неизвестны. Приведённый пример с погодой ближе к случаю 2. Пример, вполне сводимый к варианту 1 - розыгрыш лотереи, когда организатору без разницы, кому выпадет приз, "подставных" победителей нет. В этом случае, если мы знаем, сколько билетов есть и сколько из них выигрышных, мы можем оценить вероятность своего выигрыша.

Когда известны вероятности, первый напрашивающийся вариант - прибегнуть к математическому ожиданию. Скажем, участвуем в лотерее, с вероятностью 0,1 выиграем 1000 руб., с вероятностью 0,9 проиграем 200 руб. (ну на билет же потратились). Математическое ожидание: вероятность_выигрыша * выигрыш - вероятность_проигрыша * величина_проигрыша = 0,1*1000 - 0,9 * 200 = -80. Опачки, невыгодно, ведь если мы не участвуем, то результат 0, а при участии отрицательный. Математическое ожидание, по-видимому, кому-то показалось настолько очевидным подходом, что в теории принятия решений применительно к лотереям получило второе имя - объективно ожидаемый выигрыш. Если бы всё было так просто... На деле приходится учитывать склонность принимающего решение лица к риску и многое другое, из-за чего тут и понадобились разные более хитрые научные наработки.

Когда вероятности неизвестны, нужны уже другие методы принятия решений. Один из широко известных: "мудрец надеется на лучшее, но рассчитывает на худшее". Для каждого варианта выбора смотрим, что он даст в худшем случае. Выбираем тот, который в худшем случае оказывается лучше, чем другие, то есть максимизируется целевая функция f(x) = min f(x, z), z = z1, ..., zm. Такой критерий по-умному называется критерием Вальда и моделирует пессимистичное поведение, поведение боящегося негативного стечения обстоятельств. Есть ещё принцип недостаточного обоснования, гласящий, что раз мы не знаем законы внешней среды, то её состояния равновероятны, то есть если имеется m возможных состояний, то вероятность каждого состояния равна 1/m. Вот такое красивое, но опасное сведение к ситуации, когда вероятности состояний известны. Есть и другие методы, но суть данной статьи не в том, чтобы тупо перечислить тут всё.

Поведенческая неопределённость и теория игр

Итак, теперь наше положение дел зависит от чьих-то действий и решений, этот кто-то целенаправленно действует исходя из своих соображений. Иначе говоря, внешние состояния теперь - действия других субъектов, преследующих собственные цели.

Принятием решений в условиях поведенческой неопределённости занимается теория игр. В моделях с природной неопределённостью принятие решений рассматривается как индивидуальный выбор, в теории игр речь идёт о совместном выборе - в процессе участвуют несколько субъектов, принимающих решения, один из которых - наша сторона. Постулируется, что принимающие решение субъекты рациональны ("там тоже не дураки сидят") и делают всё возможное, чтобы достичь своих целей. Это опасный постулат, но не автор статьи его придумал. Игрой и называется модель принятия решений в описанных условиях, а не то, о чём подумали футбольные фаны или компьютерные геймеры.

В теории принятия решений есть разные классификации игр. Одна из наиболее принципиальных: 1) бескоалиционные игры - у игроков нет смысла или возможности вступать в соглашения, обмениваться информацией (не дезой!); 2) коалиционные, они же кооперативные (здесь можно и посотрудничать). Теория игр прежде всего рассматривает бескоалиционные парные игры. Кстати, привычные спортивные игры - шахматы, шашки, футбол - по сути такие и есть. Примечательно, что нестандартные варианты шахмат для троих игроков являются коалиционной игрой. Яркий исторический пример коалиционных игровых моделей - крупномасштабные войны, если в качестве игроков рассматривать страны-участники. Ещё пример коалиционной игры - карточный дурак с несколькими участниками, где, например, несколько игроков могут согласованно "топить" одного.

И уж совсем изумительный пример коалиционной игры - нестандартная шахматная композиция "кооперативный мат", суть которой - чёрным должен быть поставлен мат, но не только белые пытаются это сделать, но и чёрные помогают процессу.

Многошаговые задачи принятия решений и деревья решений

Относительно простые задачи принятия решений состоят в том, что решение нужно принять однажды, оно, возможно вкупе с внешними силами, и определит исход дела. Иногда же приходится выбирать среди сценариев, в части из которых или во всех из них принимать решение придётся не однажды, такие задачи называются многошаговыми задачами принятия решений. Как правило, следующее из принимаемых решений зависит от того, какое решение мы приняли до этого и к чему оно привело. Если речь идёт о теории игр, здесь также решение будет зависеть и от действий других субъектов (например, ходов шахматиста-оппонента).

Нетрудно понять, что возможные решения и варианты внешних обстоятельств удобно представлять схематически в виде "ответвлений" от текущей ситуации, вследствие чего в многошаговых задачах принятия решений часто используются методы, основанные на построении деревьев (в этом случае деревья называются деревьями решений). В частности, в случае природной неопределённости в ход нередко идут вероятностные деревья решений:

В примере вероятностного дерева решений на рисунке первое решение, которое мы принимаем: участвовать ли в лотерее? Мы с вероятностью 0,2 выигрываем 10 денежных единиц и с вероятностью 0,8 проигрываем 2 единицы (стоимость билета). Если мы не покупаем билет или проигрываем, конец истории. Если же мы выигрываем, то нам предлагают поучаствовать в супер-игре, то есть в этой истории мы принимаем уже второе решение.

В теории игр известны так называемые игровые деревья решений. Суть их в том, что если есть k игроков, ходящих по очереди, возможные варианты первого хода m-го игрока располагаются на уровне m, его второго хода - на уровне m+k и т.д. Если в некоторой ситуации игрок может пойти n способами, из узла ситуации исходит n ветвей. Как правило, в "чистом" виде такие деревья быстро растут, и даже игрокам-программам сложно вести построение, поэтому обычно выполняются попытки упростить дерево, не рассматривая неэффективные стратегии. Назначение такого рода деревьев состоит в исследовании игр, а также просчёте, как вести себя конкретному игроку, на сколько-то ходов вперёд.

copyright © Исканцев Н.В., 2012

К математическому разделу
На главную
X