Бурцев М.С., Редько В.Г.

Влияние агрессии на эволюцию в многоагентной системе

Многоагентное моделирование является мощным инструментом исследования процессов эволюции сложных социальных систем [1]. Основные преимущества многоагентного моделирования по сравнению с другими методами изучения социальных процессов заключаются в следующем [2]:

1. многоагентные системы позволяют исследовать процессы самоорганизации;

2. дают возможность естественного описания сложных систем;

3. обладают высокой гибкостью.

В качестве примеров использования многоагентных систем для моделирования в социологии можно привести такие исследования, как моделирование коллективного самоопределения [3] или гражданского неповиновения [4].

В данной работе представляется простая модель многоагентной системы, и исследуется влияние возможности возникновения агрессии на динамику системы.

Модель представляет собой искусственный мир в двухмерном замкнутом пространстве (тор). Пространство разбито на клетки, в которых могут находиться агенты и ресурс. В одной клетке не может быть больше одного агента. Время дискретно, t = 0,1,2,... В каждый такт времени каждый агент совершает строго одно действие: подобрать пищу (ресурс); двигаться на одну клетку вперед; повернуть на лево; повернуть на право; отдыхать; делиться; ударить агента в клетке спереди (напасть); защищаться.

В клетках с некоторой вероятностью появляется пища, потребляемая агентами. Агенты могут получать информацию о состоянии окружающего их мира и своем внутреннем состоянии, совершать определенные действия.

Каждый агент имеет внутренний энергетический ресурс. Ресурс пополняется при питании и расходуется при выполнении действий.

Изменение поведения агентов в популяции происходит от родителя к потомку. При делении потомок наследует систему управления родителя измененную мутациями и часть его энергии. Если в течение жизни агента его энергетический ресурс уменьшается до 0, то агент погибает.

Агент ориентирован. Он имеет направление «вперед», относительно которого ориентировано его поле зрения и действия совершаемые им. Поле зрения агента состоит из 4-х клеток расположенных – перед, справа, слева и под агентом. Агент может видеть пищу и других агентов, расположенных в поле его зрения.

Опишем физиологию агентов, характеризуя взаимосвязи между действиями агента и его внутренним состоянием.

Используем следующие обозначения: R – энергетический ресурс, ΔR – изменение ресурса за один такт времени; k_i– параметры, характеризующие изменение внутреннего энергетического ресурса. Емкость внутреннего энергетического ресурса агента ограничена, она не может быть больше R_max.

Выполнение какого-либо действия приводит к изменению внутреннего ресурса агента по следующим правилам:

1) Отдых (нахождение в состоянии покоя): ΔR = - k₁.

2) Движение: ΔR = - k₂.

3) Поворот (направо или налево): ΔR = - k₃.

4) Питание: ΔR = - k₄ + k₅.

5) Действие деления: ΔR = - k₆.

При появлении потомка родитель передает ему часть своей энергии: ΔR_p = - 0.5R_p, здесь индекс p обозначает родителя. Начальный ресурс потомка R_o равен полученной от родителя энергии R_o= 0.5R_p.

6) При нападении на другого агента: ΔR = 0.5k₇, если жертва не защищается, и ΔR = -k₇ в противном случае.

7) Защита: ΔR = k₈.

Система управления агента состоит из однослойной модульной нейронной сети, состоящей из рецепторных (входных) и эффекторных (выходных) модулей. Набор модулей, а так же параметры связи между ними определяются геномом агента.

Нейронная сеть агента имеет следующие входы:

1) постоянный внутренний сигнал;

2) наличие пищи рядом, впереди, слева, справа;

3) наличие агента впереди, слева, справа;

4) текущее значение внутреннего энергетического ресурса;

5) разность между максимальным R_max и текущим R значениями внутреннего энергетического ресурса;

6) изменение энергетического ресурса на предыдущем такте времени.

Значения, поступающие на входы нейронной сети, нормируются к R_max.

Значения на выходах нейронной сети y_j вычисляются умножением вектора входных сигналов на матрицу весов связей входов с выходами, где входы соответствуют рецепторам, а выходы – эффекторам:

Y_j= Σ_iw_ijx_i,

где x_i – входы j-го нейрона, а w_ij– его синаптические веса.

В данный момент времени выполняется действие, соответствующее нейрону с максимальным выходным значением.

Популяция агентов эволюционирует во времени за счет изменения структуры и весов синапсов управляющей нейронной сети.

Геном агента S состоит из двух хромосом S = (W, M). Первая хромосома содержит веса синапсов нейронной сети. Наличие или отсутствие модуля в структуре сети определяется значением соответствующего двоичного числа во второй хромосоме.

С моделью был проведен ряд компьютерных экспериментов, в которых рассматривалось влияние возможности возникновения агрессивного поведения на динамику системы.

В начале каждого эксперимента мир заселялся популяцией агентов, имеющих минимальный набор рецепторов и эффекторов. Агент начальной популяции мог видеть пищу в той клетке, где он находился, и в клетке находящейся перед ним. А также совершать следующие действия – есть, двигаться и делиться. Веса синапсов были заданы таким образом, чтобы обеспечить агенту два начальных инстинкта – питания и размножения. Если агент видел пищу рядом с собой, то он должен был выполнять действие «есть», если в соседней клетке, то – двигаться в соседнюю клетку; если он не видел ничего, то вызывалось действие «делиться».

Рассмотрим результаты типичных экспериментов для двух вариантов модели. В первом случае агенты не могли нападать друг на друга, а во втором агрессивное поведение было возможно. В случае "миролюбивых" агентов эволюция быстро находит эффективную стратегию поведения, что приводит сначала к резкому, а потом боле плавному росту численности популяции переходящему в насыщение (рис. 1 верхняя кривая). В случае "агрессивных" агентов модель ведет себя иначе. Сначала в популяции отсутствуют агрессивные агенты, и динамика численности популяции аналогична первому случаю, но когда численность популяции возрастает, повышается вероятность локальных взаимодействий между агентами. Следовательно, чем выше численность популяции, тем больший выигрыш сможет получить агент, нападающий на соседей. И действительно, в модели рост численности популяции вызывает появление агрессивных агентов, что приводит к резкому падению численности при t = 8000000 (рис.1 нижняя кривая).

Рис.1. Динамика численности агентов в отсутствии возможности агрессии (верхняя кривая), и когда агенты могут нападать друг на друга (нижняя кривая).

Результаты экспериментов можно интерпретировать следующим образом, возникновение агрессии в обществе приводит к резкому уменьшению его благосостояния.

Литература:

1. Epstein J.M., Axtel R.I., Growing Artificial Societies: Social Science from the Bottom Up, Cambridge, MA: MIT Press, 1996.

2. Bonabeau E., Agent-based modeling: Methods and techniques for simulating human systems // Proceedings of the National Academy of Sciences, vol. 9, issue 90003, 2002.

3. Lustick I., Agent-based modeling of collective identity: testing constructivist theory // Journal of Artificial Societies and Social Simulations, vol. 3, no. 1, 2000.

4. Epstein J.M., Modeling civil violence: An agent-based computational approach // Proceedings of the National Academy of Sciences, vol. 9, issue 90003, 2002.

[*] Работа выполнена при поддержке РФФИ проект МАС №02-06-06028 (в рамках проекта №02-06-80435).

<<:o: