Лекция 3

Спиновые стекла как модель случайно взаимодействующих элементов. "Спин-стекольная" модель эволюции


В предыдущей лекции была рассмотрена Дарвиновская эволюция информационных последовательностей – модель квазивидов. Был рассмотрен простейший случай Хемминговой меры близости между последовательностями. А именно, анализировалась эволюция популяции последовательностей S1 , S2 , ... , Sn в предположении, что имеется одна наилучшая особь Sm , а приспособленность f(S) произвольной особи S определяется расстоянием по Хеммингу
r (S, Sm) между S и Sm (числом несовпадающих компонент в этих векторах), причем  f(S) экспоненциально уменьшается с ростом r (S, Sm):

  f(Sk) = exp[- br (Sk, Sm)],                                                              (1)

где b - параметр, характеризующий интенсивность отбора.

Рассматривался поэтапный эволюционный процесс, в котором на каждом этапе происходит отбор особей в популяцию следующего поколения с вероятностями, пропорциональными их приспособленностям, а также мутации особей - равновероятные замены компонент векторов S . При достаточно малой интенсивности мутаций после большого числа этапов эволюции в популяции формируется стационарное распределение последовательностей   - квазивид, в который входят оптимальная особь Sm и ее ближайшие мутанты.

Существенный недостаток модели с Хемминговой мерой близости – предположение о существовании единственного максимума приспособленности f(S). В настоящей лекции мы устраним этот недостаток и построим модель для многоэкстремальной функции приспособленности f(S) , используя хорошо известную модель спиновых стекол Шеррингтона-Киркпатрика (1975г.), и покажем, что основные особенности "спин-стекольной" модели эволюции во многом аналогичны таковым в модели с Хемминговой мерой близости. Основное отличие состоит в том, что квазивид формируется в окрестности не глобального минимума приспособленности, а в окрестности одного из локальных максимумов приспособленности.

1. Модель спиновых стекол Шеррингтона-Киркпатрика

Модель Шеррингтона-Киркпатрика [1,2] описывает систему попарно взаимодействующих спинов. Взаимодействия между спинами предполагаются случайными. Формально модель сводится к следующему. 

1) Имеется система S , состоящая из N спинов: S = S1 , S2 ,..., SN ; число спинов предполагается большим, N >> 1. Спины принимают значения 1 или  -1: Si = 1, -1 .

2) Взаимодействия между спинами случайны. Энергия спиновой системы определяется формулой:

E (S) = - S i<j Jij Si Sj         ,                     ij = 1,..., N ,                       (2)

или
Lec3_1.gif (1592 bytes)

где  Jij  – элементы матрицы взаимодействий между спинами. Величины Jij нормально распределены, плотность распределения   P(Jij ) определяется выражением:

P(Jij )  =  (2p)-1/2 (N-1)1/2 exp [- Jij2 (N-1)2-1] .                                      (3)

Отметим, что для упрощения дальнейшего анализа в формуле (3) введена специальная нормировка.

Модель спиновых стекол была введена для интерпретации нетривиальных фазовых состояний в физике. Формула (2) обычно интерпретируется как гамильтониан Гейзенберга для системы спинов, при этом  Jij  есть интеграл обменного взаимодействия между i-м и  j-м спинами. Приведенные соотношения, естественно, описывают очень упрощенную ситуацию с точки зрения физики: здесь не учитывается пространственные координаты спинов (для реального трехмерного твердого тела должна быть учтена  зависимость обменного интеграла  Jij   от расстояния  r между i-м и  j-м спинами), спины могут принимать другие значения, отличные от  1 или  -1 и т. п.  Подчеркнем, что модель Шеррингтона-Киркпатрика характеризует симметричные взаимодействия между спинами.

Модель Шеррингтона-Киркпатрика характеризует довольно общую схему попарно взаимодействующих элементов, поэтому она получила широкое распространение вне физики. В частности, эта модель в 1980 годах послужила мощным стимулом к интенсивному развитию теории нейронных сетей. В 1982 году Дж. Дж. Хопфилд [3] предложил модель нейросетевой ассоциативной памяти на базе теории спиновых стекол, что вызвало мощный всплеск исследований нейронных сетей методами статистической физики. Физики-теоретики стали записывать Гамильтонианы нейросетей, оценивать информационную емкость нейросетевой ассоциативной памяти (т.е. оценивать, сколько образов можно записать в сеть с данным числом нейронов) – высокоэффективные методы математической физики стали использоваться в нейроинформатике. Естественно, что в силу своей общности и результативности модель Шеррингтона-Киркпатрика интенсивно исследовалась (вторая половина 1970-х -1980-е годы).

Приведем результаты исследований модели Шеррингтона-Киркпатрика, которые нам потребуются при анализе эволюционных процессов.

Число локальных минимумов энергии  M  очень велико [4]:

M   Lec3_2.gif (855 bytes)  exp(aN) ,      a  Lec3_2.gif (855 bytes) 0,2 .                                                       (4)

Локальный минимум есть такое состояние системы спинов  SL , для которого любой переворот одного спина приводит к повышению энергии.

Глобальный  минимум энергии  E0 приближенно составляет величину - 0,8 N [5]:

E0  Lec3_2.gif (855 bytes) - 0,8 N   .                                                                              (5)

Из формул (2), (3) можно получить распределение энергии E спинового стекла и распределение вариации энергии dE при перевороте одного спина (Si --> - Si). Соответствующие плотности распределения вероятности  P(E) и P(dE) определяются выражениями:

Lec3_3.gif (1571 bytes)

Lec3_4.gif (1602 bytes)

Согласно выражениям (4), (5) среднее значение энергии и вариации энергии равны нулю (<E> = 0, <dE> = 0) . Дисперсия энергии  D(E)   составляет N/2 , а дисперсия вариации энергии D(dE)  равна 4, т.е. среднее квадратическое вариации энергии s(dE) равно 2:

s(dE) =  MSQR { (Si --> - Si) } = 2 .                                                          (8)

Теперь построим спин-стекольную модель эволюции.

2. "Спин-стекольная" модель эволюции

Рассмотрим эволюцию популяции, в которой "геномы" S модельных особей представляют собой информационные последовательности N символов S = S1 , S2 ,..., SN . Символы принимают значения 1 или  -1: Si = 1, -1 .   Популяция есть набор {Sk}, состоящий из n  последовательностей, k = 1,..., n. Приспособленности модельных "организмов" Sk определяем как:

f(Sk) = exp[- b E(Sk)] ,                                                                             (9)

где E(Sk)   – энергия спинового стекла, задаваемая формулами (2), (3), b параметр интенсивности отбора.

Определение (9) подразумевает, что модельный "геном"  Sk состоит из последовательности элементов Ski,  i = 1 , ..., N ,  которые случайно попарно взаимодействуют в  соответствии с матрицей взаимодействия Jij . Максимальной приспособленностью (соответственно, минимальной энергией  E(S)) будут обладать те "организмы",  имеющие такую комбинацию элементов Si , которая обеспечивает максимальную  кооперативность взаимодействий между спинами Si  для данной матрицы Jij .

Как и для Хемминговой меры близости предполагаем, что эволюционный процесс состоит из последовательности поколений. Новое поколение  {Sk (t+1)}получается из старого Sk(t) путем отбора и мутаций последовательностей Sk (t).

Формально эволюционный процесс может быть описан следующим псевдокодом:

Шаг 0. Формирование начальной популяции {Sk (0)}. Для каждого k = 1, ..., n, и для каждого  i = 1 , ..., N , выбираем случайно символ Ski, полагая его равным 1 или -1.
Шаг 1. Отбор
Подшаг 1.1.   Расчет приспособленностей. Для каждого k = 1, ..., n, вычисляем величину f(Sk) в соответствии с формулами (2), (3), (9).
Подшаг 1.2. Формирование популяции следующего поколения{Sk (t+1)}. Отбор   n особей в новую популяцию{Sk (t+1)} с вероятностями, пропорциональными f(Sk).
Шаг 2. Мутации. Для каждого k = 1, ..., n, для каждого   i = 1, ..., N, с вероятностью Pm переворачиваем спин Ski(t+1): Ski --> - Ski. Параметр Pm характеризует интенсивность мутаций.
Шаг 3. Организация последовательности поколений. Повторяем шаги 1, 2 для t = 0, 1, 2, ...


Отметим, что здесь параметр Pm отличается от параметра P (вероятность выбора символа для мутационной  замены), введенного в предыдущей лекции: Pm = 0,5P.

Описанная модель "спин-стекольной" эволюции анализировалась путем компьютерного моделирования и приближенных оценок [6]. Особенности эволюционного процесса иллюстрируются Рис. 1. Здесь n(E) – число таких последовательностей S , что  E(S) = E  в рассматриваемой популяции,  t   – номер поколения.

Lec3_5.gif (9811 bytes)

Рис. 1. Распределение последовательностей по энергиям  n(E) для разных поколений t ; t3 > t2 > t1E0 и EL – глобальный и локальный минимумы энергии, соответственно; глобальный минимум энергии E0 приближенно составляет: E0 = - 0,8 N. Схематично, согласно компьютерному моделированию  [6].

Эволюция в спин-стекольной модели аналогична таковой для Хемминговой меры близости. Но в отличие от модели с Хемминговой мерой близости эволюция сходится к одному из локальных минимумов энергии EL  , который может быть различен для различных реализаций эволюционного процесса.

Наряду с эволюционным процессом мы можем рассматривать последовательный поиск минимумов энергии спинового стекла. А именно, задаем систему из  N спинов, случайно выбираем спин Si , переворачиваем его (Si --> - Si) и смотрим: уменьшилась энергия или увеличилась, при уменьшении энергии принимаем новое значение спина, при увеличении – возвращаемся к старому. Такой последовательный процесс также сходится к какому-либо локальному минимуму EL . Моделирование показывает, что в среднем эволюционный процесс сходится к более глубокому локальному минимуму энергии EL, чем последовательный поиск. Это обусловлено тем, что при эволюционном поиске одновременно просматриваются несколько "долин" в энергетическом ландшафте E(S) и увеличиваются шансы попасть в более глубокую долину и соответственно достичь более глубокого минимума энергии. 

Итак, на основе понятия спиновых стекол можно построить модель эволюции для "организмов", геномы которых состоят из множества случайно взаимодействующих между собой элементов. Эволюция может рассматриваться как процесс поиска такой комбинации элементов, которая обеспечивает наиболее эффективную кооперацию элементов генома.

Литература:

  1. Sherrington D., Kirkpatrick S. Solvable model of spin-glass // Physical Review Letters. 1975. V.35. N.26. PP.1792-1796.
  2. Kirkpatrick S., Sherrington D. Infinite range model of spin-glass // Physical Review B. 1978. V.17. N.11. PP.4384-4403.
  3. Hopfield J.J. Neural networks and physical systems with emergent collective computational abilities // Proc. Natl. Acad. Sci. USA. 1982. V.79. N.8. P.2554-2558.
  4. Tanaka F., Edvards S. F. Analytic theory of the ground state of a spin glass: 1. Ising spin glass // Journ. Phys. F. 1980. V. 10. N.12. PP.2769-2778.
  5. Young A.P., Kirkpatrick S. Low-temperature behavior of the infinite-range Ising spin-glass: Exact statistical mechanics for small samples // Physical Review B.1982. V.25. N.1. PP.440-451.
  6. Редько В.Г. Спиновые стекла и эволюция // Биофизика. 1990. Т.35. Вып.5. С.831-834.

Copyright © Vladimir Red'ko,  Sep 26, 1999 ( redko@keldysh.ru )

Last modified: Dec 04, 1999