КОНЦЕПЦИЯ ПОСТРОЕНИЯ ОБЩЕЙ ТЕОРИИ

ИНФОРМАЦИОННЫХ СИСТЕМ

(сокращенный вариант)

Бодякин В.И. ИПУ РАН, МФТИ

E-mail: body@ipu.rssi.ru

Введение. Современный этап развития цивилизации характеризуется необычайным динамизмом смены всех основных ее параметров, от целевых установок и до инструментария их достижения. На каждом эволюционном этапе человечеством осознавалась как наиболее значимая та или иная проблема. В настоящее время (конец XX и начало XXI веков) к наиболее острой можно отнести проблему разработки технологии крупномасштабных систем автоматизированного хранения и обработки информационных ресурсов [5].

Развитие современной вычислительной техники существенно основано на идеях А. Тьюринга и Дж. фон Неймана. В связи с увеличением масштабов и структурной сложности систем управления процессы алгоритмизации обработки данных наталкиваются на значительные трудности. В данной работе исследуется проблема эволюционного построения концепции общей теории крупномасштабных информационных систем путем их самоорганизации. Сложность данной задачи заключается в построении информационных систем в слабоструктурированных и динамично изменяющихся предметных областях, характеризующихся большими объемами информационных потоков и их неполнотой. При этом, как правило, количественные характеристики предметных областей значительно превосходят ресурсы современного программно-аппаратного обеспечения. К этому классу относят геофизические, биологические, социально-экономические и многие другие предметные области.

Неразработанность технологий автоматизированной обработки неструктурированной информации (систем искусственного интеллекта) является основным сдерживающим фактором современного этапа развития цивилизации. Актуальнейшая необходимость построения крупномасштабных (АСУ-государство, Интернет и пр.) саморазвивающихся интеллектуальных систем сегодня диктуется нарастающей неуправляемостью и спонтанностью попадающих в руки человека открытий в научно-технических и бытовых сферах (генная инженерия, энергия атома, виртуальная реальность и пр.).

Очевидно, что будущее человеческой цивилизации будет во многом определяться глубиной нашего понимания сущности глобального эволюционного процесса* . Соответственно, необходимо формирование научной парадигмы глобального эволюционизма материи, и как наиболее актуальной его части сегодня - эволюции информационных систем (от простейших биологических автоматов до Homo-sapiens и, далее). Понятно, что только постигнув основы эволюционных принципов природы (или их аналогов), мы сможем строить крупномасштабные интеллектуальные системы.

Третий аспект проблемы крупномасштабной автоматизации обработки информации, это становление информационного ресурса (ИР) как ведущего ресурса в социально-экономических процессах, открывающего принципиально новые перспективы развития цивилизации [1,2]. Информационное общество, в которое стихийно входят экономически развитые страны, целиком базируется на эксплуатации информационного ресурса. Если оперирование понятиями "вещество" и "энергия" без их конструктивного определения на предыдущих вещественно-энергетических этапах развития человечества не было столь катастрофически сдерживающим, то активное использование всепроникающего понятия "информация" без должной его формализации уже в течение более полувека, становится серьезным камнем преткновения на пути осознанного прогресса. Соответственно, фундаментальное исследование общенаучной категории - "информация", "информационный ресурс", сегодня стало чрезвычайно актуальным.

Актуальность данного аспекта проблемы в значительной мере объясняется большими изменениями, которые произошли в компьютерном моделировании за последние несколько десятилетий. В процессе научно-технического прогресса материальная ресурсоемкость вычислительной техники для равномощных устройств уменьшилась на несколько порядков. Вследствие этого происходит компенсирующее замещение материальных ресурсов информационными. Материальным ресурсом называется количество составляющих элементов информационной системы, а информационным ресурсом мощность множества ее состояний.

При всем этом сам процесс разработки и моделирования открытых информационных систем весьма сложен и трудоемок. Поэтому для эффективного использования ограниченных научно-технических ресурсов представляется целесообразным оптимизировать этот процесс. Таким образом и возникает задача поиска и описания важнейших характеристик процесса моделирования эволюционного саморазвития открытых информационных систем, а также построения критериев для оценки эффективности этого процесса.

Совокупность вышеназванных особенностей и составляет сущность проблемы построения концепции общей теории крупномасштабных информационных систем способных к самоорганизации в сверхбольших, слабоструктурированных, неполных, открытых и динамично изменяющихся предметных областях.

Начнем исследование приведенных фундаментальных вопросов с построения математической модели комплекса: "Предметная область - Информационный канал - Информационная система".

ЧАСТЬ I

Комплекс: "Предметная область - Информационный канал - Информационная система"

Предметная область. Под предметной областью (ПО) будем рассматривать совокупность из n {a1, a2, …, an} различных типов (n классов) взаимодействующих объектов в соответствии с некоторыми исходными законами F(ПО). Т.к. объектов каждого класса может быть более одного, то суммарное количество всех объектов в ПО не меньше n, примем его равным nn (nn і n).

Пространство ПО разбито на m ячеек (m > nn), в каждой из которых может находиться только один объект ai . В каждый такт времени (tj) в ПО, в соответствии с F(ПО), происходит перемещение объектов см. рис 1. При ожидаемом попадании нескольких объектов в некоторый такт времени в одну и ту же ячейку ПО происходит их взаимодействие.

Рис. 1.

Процесс взаимодействия выражается в изменении в течение времени t2-t1 одного или нескольких физических параметров (W) взаимодействующих объектов. Это изменение параметров может отображено в текстовой форме, см. рис. 2.

Где амплитуда изменения параметров отображается в алфавите А ={a, b, c, …, z} с дискретизацией D W, а число символов отображаемого процесса определяется его длительностью t2 - t1 и дискретизацией по времени D t. При выборе дискретизации необходимо чтобы выполнялись условия: W / D W > 1; t2 - t1 / D t > 1; [1]. Легко показать, что любой физический процесс, можно взаимооднозначно отобразить в текстовой форме, с любой заданной степью точности (соответствия) [3].

Таким образом, в соответствии с рассматриваемой моделью ПО, при взаимодействии нескольких объектов, в соответствии с F(ПО), порождается элементарная информационная единица s = <cade…b>, которая однозначно отображает процесс взаимодействия нескольких объектов {a1, a2, …, an}, а также частично и их характеристики ("скрытые параметры", "имя"). Допустим, что длина элементарной информационной единицы s не превышает L символов.

Результаты взаимодействия объектов {a1, a2, …, an} отображаются элементарными информационными единицами "пар", "троек", … , "d", одномоментно взаимодействующих объектов в пространстве состояний ПО, см. рис. 3.

Рис. 3.

В качестве примера рассмотрим три уровня различных ПО. На микроуровне под объектами ПО можно рассматривать совокупность элементарных физических частиц, под алфавитом А - рассматривать (световой) диапазон электромагнитных волн разбитый на z интервалов. Элементарной информационной единицей s в этом случае будет некоторая текстовая последовательность, характеризующая взаимодействие элементарных частиц (s = " g ").

На макроуровне - например, взаимодействие объекта "Петров" и объекта "Иванов". Результат их взаимодействия - s = "ПРИВЕТ ПЕТРОВ! ПРИВЕТ. КАК ДЕЛА? НОРМАЛЬНО. ПОКА". Еще пример, - пение птиц в лесу.

На гигауровне - взаимодействие звезд, приводящее, например, к образованию сверхновой, или же двойной звезды, в соответствии с F(ПО), описывающих взаимодействие объектов (см. рис. 2).

Под объектами различных типов {a1, a2, …, an} рассматриваются простые объекты, не имеющие внутренних состояний, или от которых можно абстрагироваться при данном рассмотрении. Поэтому, при анализе одновременного взаимодействия не более чем d объектов, мы получаем d-мерный куб со стороной n, в котором всевозможные взаимодействия (см. рис. 2, пространство состояний ПО), в соответствии с F(ПО), отображаются множеством элементарных информационных единиц Su ={s1, s2, … su}, где Ј nd.

Ограничивая в нашей модели ПО длину информационных единиц s в L символов (tj, tj+L) мы также получаем множество всевозможных информационных единиц Sq={s1, s2, … sq}, где q = |A|L. Чтобы отобразить всевозможные взаимодействия в ПО, выберем L таковым, что q і u , т.е. |A|L і nd , где і  d log(n-|A|), а L-мерное пространство на осях которого расположен алфавит A назовем информационным пространством SP данной ПО. Соответственно, все информационные единицы Su, характеризующие процессы в ПО отображаются в информационном пространстве SP.

Частота взаимодействия объектов в ПО определяется их физической плотностью (nn/m) и характером F(ПО). Понятно, что при постепенном увеличении плотности, сначала будет изолированное во времени следование информационных единиц (см. рис. 4 а), далее - слитное (см. рис. 4 б) и до перекрытия в различной степени (см. рис. 4 в). Процесс формирования ИР будет происходить в "информационном канале", как передающей субстанции между ПО и ИС.

Рис. 4. 

 

Информационный канал (ИК). В ИК появляется новый алфавит AG, который включает в себя: как "пустой символ" - Ж , алфавит A, так и множество символов {a , b , c , …w }, которые являются отображением суперпозиции (наложения) нескольких символов алфавита A (см. рис. 3 в). Допустим, что при максимальной суперпозиции из nn*L произвольных символов алфавита A она такова, что всегда входит в алфавит AG = {Ж , A, a , b , c , …w }.

Еще одна особенность алфавита AG его "энергетическая составляющая" Е (см. рис. 4 в). Если в tj такт времени перекрывается несколько одинаковых символов принадлежащих алфавиту A, то "энергетическая составляющая" соответствующая этому символу возрастает в соответствующее числу перекрытия раз (синхронизация, когерентность процессов в ПО). При перекрытии в tj такт времени различных символов происходит их "частотный" дрейф в область символов {a , b , c , …w } алфавита AG с "энергетической составляющей" равной единице. Примем, что в случае перекрытия в tj такт времени как совпадающих, так и различных символов результат определяется "голосованием" - каких символов больше (совпадающих или различных), такой символ и попадет в ИК. Отметим, что всегда в tj такт времени в ИК присутствует только один символ ("квантовость ИК"), принадлежащий AG .

Информационная система (ИС). В качестве ИС будем рассматривать некую обобщенную систему, к которой будем относить естественные ИС (от простейших и до человека, как биологическо-информационные формы высокоорганизованной материи), а также и информационные машины, созданные силой разума человека. Естественно, что конструктивно мы будем рассматривать только искусственные ИС, опираясь при этом и на фактический материал работы биологических ИС. Наша задача будет заключаться в том, чтобы сформировать модель ИС, не уступающую по своим функциональным возможностям человеку или высшим животным в переработке ИР.

Механизм функционирования ИС заключается в получении (SПО) и выдачи (SИС) через информационный канал ИР в форме текстовых последовательностей, построенных на алфавите AG. Так как процессы в (реальной) ПО причинно связаны, то соответственно, существуют определенные закономерности F(ПО) в следовании информационных единиц SПО. При этом необходимо, чтобы в процессе функционирования повышалась целесообразность реакции SИС на SПО (см. далее), определяемая "генетическими" предпочтениями (SПО +) ИС, см. рис. 5.

 

Рис. 5.

С другой стороны, ИР может существовать только на материальном носителе (объектах), соответственно, каждая информационная единица, помимо своей (идеальной) информационной компоненты, несет и материальную компоненту, которая может оказывать непосредственное воздействие на ИС.

Любая информационная единица (SПО), так же как и причинно-следующие за ней воздействия (в вещественно-энергетической форме) могут оказывать положительное или отрицательное воздействие на ИС. Из возможности функционирования ИС только в определенных диапазонах значений параметров (например для биологических ИС, это температурный диапазон от -10 С0 и до +120 С0 ) следует, что выход за эти нормальные для ИС значения параметров рассматриваются как негативные (-). С положительными (+) значениями параметров для ИС, в самом простом приближении, можно отождествить результирующие количественные приращения некоторого значимого для ИС ресурса (например, энергии, объема памяти ИС и пр.). Таким образом вполне реально, что посредством механизма ограниченного перебора, эволюционно сформировались и в дальнейшем закрепились на ее "генетическом" уровне целесообразность поведения конкретных типов ИС, в форме определенных реакций SИС на SПО (см. рис. 4).

В рамках дальнейшего повышения целесообразности функционирования обобщенной ИС необходимо решать следующие задачи: 1) воспринимать информацию; 2) хранить информацию; 3) эффективно преобразовывать информацию; 4) выдавать информацию, т.е. реагировать на процессы в ПО.

Рассмотрим задачи обобщенной ИС по отдельности.

Восприятие информации - наличие определенных объектов-рецепторов ИС позволяет преобразовывать символы текстовой последовательности SПО построенные на алфавите AG во внутренний алфавит AИС .

Хранение информации (память) - преобразование текстовой последовательности SПО (ИР) в структуру объектов памяти ИС.

Преобразование информации заключается в более экономном расходовании различных значимых ресурсов ИС (например, памяти) для более эффективной реакции на процессы в SПО.

Выдача информации - воздействие ИС на ПО посредством SИС, в любой момент времени (tj) функционирования ИС.

Процесс функционирования обобщенной ИС заключается в идентификации исходной текстовой последовательности SПО с некоторой подструктурой (образом) в сформированной памяти ИС на предыдущих этапах ее функционирования, и, в зависимости от причинно-следственного прогноза развития процесса в ПО, выдачи соответствующей (целесообразной "+" для ИС) информации SИС в ИК.

Понятно, что чем больше емкость памяти ИС, тем более адекватно она сможет реагировать. Известно, что ограниченная по числу объектов ПО порождает неограниченный ИР (ИР=f(t,p)= k*t*p, где: t - время, p - плотность объектов в ПО, k - некоторый коэффициент) [1]. С другой стороны, память ИС всегда ограниченна. Следовательно, необходимо отображать в ней только значимые для ИС информационные единицы SПО. А так как в комплексе "ПО - ИК - ИС" нет ни "учителя" ни "программиста", то ИС должна самостоятельно решить задачу по выявлению значимых для нее информационных единиц, следовательно, потенциально она должна быть готова отображать в своей памяти весь поток ИР).

В рамках задачи хранения информации можно рассмотреть задачу "покрытия" (закраски) ИР образами памяти ИС. Имея ограниченный словарь образов можно полностью закрасить ИР, также порожденный ограниченным числом элементарных информационных единиц. В работе [3] показано, что минимальный словарь ИС, покрывающий ИР, порожденный данной ПО будет только в том случае, если образы ИС будут соответствовать элементарным информационным единицам ПО. Итак, первоочередная задача ИС сводится к выделению значимых информационных единиц ПО.

Характерным признаком информационных единиц ПО:

а) является наличие "пустого символа" Ж между информационными единицами в ИК "энергетическая составляющая" которого равна 0 (в случае малой плотности объектов в ПО, см. рис. 3а);

б) более высокая частота встречаемости информационных единиц по отношению к неинформационным единицам (неинформационная единица, "кентавр" - символьная последовательность включающая последовательно следующие части двух или более элементарных информационных единиц).

Воспринимающие информацию объекты (рецепторы) ИС, "генетически" уже настроены на восприятие ИР только при его "энергетической составляющей" превышающей 0, см. рис. 4а. ИС может также понижать "энергетическую" чувствительность своих рецепторов, чтобы при определенных условиях свести зашумленный ИР к предыдущему случаю, (в случае мощного когерентного сигнала, например, так родители обучают ребенка, громко повторяя одну фразу, например, "_МАМА_МАМА_" ), помогая начальному этапу структуризации ИР, см. рис. 4в. А далее, как только выделена первая информационная единица ПО, она уже сама начинает служить разделяющим признаком, выделяя остальные информационные единицы ПО. Т.к., при определенных условиях, ИР представляет из себя непрерывную последовательность причинно-связанных информационных единиц ПО, см. рис. 4б, то начальное выявление семантических единиц возможно и через параметр частоты встречаемости: "максимальная частота семантической единицы > (всегда больше) частоты любого "кентавра", при равенстве их длин (L).  

Информационный ресурс ("сигнал - информация - знание")

В комплексе: "предметная область - информационный канал - информационная система", появляется качественно новая компонента - информационный ресурс, которую в свою очередь необходимо разложить на уже широко используемые нами понятия, такие как: сигнал, информация, знание.

Текстовая энтропия. Для выделения информационных единиц ПО по их "частотной составляющей" можно использовать понятие текстовой энтропии (ТЭ) [1].

Для информационной единицы s эта функция выражается формулой

где: m = AL ;

p(s) - усредненная частота, с которой произвольный образ s размером в L символов встречается на интервале текстового потока, равного мощности информационного пространства SP (SP = AL * L).

при этом выполнено условие нормировки

где: i – порядковый номер s-образа.

Если на интервале ИР (tj+(AL*L) - tj), фактически равному мощности информационного пространства SP = AL * L некоторая информационная единица встречается в среднем 1 раз, то ее присутствие в ИР чисто случайно (значение ее ТЭ є 1). Если же средняя частота встречаемости информационной единицы на данном интервале отлична от 1 (в диапазоне от 0,0 до AL раз), то, соответственно, данная информационная единица уже отображает определенные причинно-следственные связи в ПО, и чем это отклонение больше от 1, тем эти причинно-следственные связи в ПО более существенны.

В работах [1,3] ТЭ построена таким образом, что для "белого шума" (как равновероятного распределения всевозможных комбинаций символьных последовательностей длины L) ТЭ є  1, а для "периодического сигнала" не превышающего период L, ТЭ є  0. ТЭ текстовой последовательности SПО определяется как среднее арифметическое от ТЭ всех информационных единиц.

Линейная форма (1) текстовой энтропии является обобщением и модификацией традиционных форм вычисления энтропии (например, классической функции К. Шеннона), но более экономна для вычислений на ЭВМ и при этом достаточно точна при ранжировании образов по возрастанию значений ТЭ. Например, значение ТЭ информационного L-мерного пространства (или словаря s образов) определяется как

Построим графики текстовой энтропии для трех классов информационных потоков – случайного сигнала, периодического сигнала и реального текста. Анализируя характер изменения значений текстовой энтропии в зависимости от L, достаточно просто можно классифицировать информационные потоки на три указанные класса (см. рис. 6).

Рис. 6.

Таким образом, числовое значение ТЭ является параметром-индикатором, который характеризует возможность семантического анализа информационного потока конкретной ПО.

На рис. 6 ТЭz характеризует прогнозируемость символьной последовательности информационного потока. Показано, что, если значение ТЭ(s) Ј ТЭz и при этом m*L Ј R, где R – материальный ресурс ИС, то задача прогнозирования разрешима за ограниченное время.

В работах [1,3] также показано, что чем больше число элементарных информационных единиц SU в ПО, тем большие различия между значениями ТЭ элементарных информационных единиц (ТЭ » 0) и ТЭ неинформационных единиц ("кентавров" ТЭ » 1).

Таким образом, используя "энергетический" и "энтропийный" методы анализа ИР в ИС можно выделить начальные информационные единицы которые соответствуют или коррелируют с элементарным информационным единицам ПО. Далее, опираясь на правило "между информационными единицами расположены информационные единицы", процесс выделения информационных единиц (автоструктуризация [1]) в ИС приобретает лавинообразный характер, пока не будут выделены все информационные единицы {s1, s2, … sq} или их объединения реальной ПО.

Сигнал, информация. В работе [3] доказано, что самый оптимальный состав информационных единиц ИС полностью покрывающий текстовую последовательность SПО, только при его тождественном совпадении с элементарными информационными единицами ПО. В этом случае, число информационных единиц минимально и равно u, соответственно, при этом минимальны потребности ИС в ресурсе R под ее память и равны:

R = k * L * u (4)

где: u – число элементарных информационных единиц ИС, k - коэффициент пропорциональности (бит / N-элемент ИС).

Если же, информационные единицы не кратны элементарным информационным единицам ПО, т.е. являются "кентаврами", то потребности ИС в ресурсе R существенно возрастают:

R = k * (LИС)2 *(u)d+1 (5)

где: LИСусредненная длина (в символах) информационных единиц, d=1,2,3, … целочисленное отношение длины информационной единицы LИС к длине элементарной информационной единицы L [3].

Из уравнений (4) и (5) видно разительное различие в необходимом ресурсе R для построения словаря ИС для одной и той же ПО. Понятно, что структуризация текстовой последовательности SПО на информационные единицы (кратные) элементарным информационным единицам, является необходимым условием эффективного функционирования ИС. Именно, только после данной структуризации ИР и появляются условия для возможного целенаправленного взаимодействия ИС с ПО.

Вышеприведенные выкладки позволяют ввести формальные определение "сигнала" и "информации".

Сигнал - символьное представление информационного ресурса, как результата суперпозиции элементарных информационных единиц ПО.

Информация - сигнал, структурированный на информационные единицы кратные элементарным информационным единицам ПО.

Если ИС способна структурировать ИР на элементарные информационные единицы ПО, значит она воспринимает информацию, если не способна, например, воспринимает только некоторую энергетическую компоненту ИР - она воспринимает просто сигнал.

Эти определения хорошо работают при коммуникации нескольких ИС, когда необходимым условием взаимопонимания является адекватность их словарей (как и в случае ПО и ИС). Функцию структуризации в языках, обычно, выполняют различные грамматические разделители, в частности в тексте, пробел, знаки препинания и др., или интонация - в устной речи.

При взаимодействии (диалоге) простейших ИС происходит преобразование: "информация ® сигнал ® информация". Из информационной формы ИР переходит в форму сигнала и далее, при удачной структуризации сигнала в ИС, ИР превращается (возвращается) в форму информации, иначе будет "непонимание" и, соответственно, отсутствие взаимодействия .

Как одну из особенностей законов F(ПО) нашей модели мы отмечали только отдельные такты процессов взаимодействия объектов и их символьного отображения (см. рис. 3). При слиянии нескольких элементарных информационных тактов ПО в ИС могут формироваться достаточно большие и сложные цепочки в форме информационных единиц, которые отображают значимые для ИС причинно-следственные связи ПО.

Если рассматривать причинно-следственную зависимость хотя бы пары процессов, то длины информационных единиц уже удваиваются, хотя в информационном канале ИК количество различных элементарных информационных единиц {s1, s2, … su} не изменяется и остается равным Su. В то же время, информационное пространство SP потенциально увеличивается в квадрат раз (|A|2L). Все это приводит к тому, что значение ТЭ для причинно-следующих процессов существенно уменьшается и соответственно возрастает возможность их прогнозирования. А это открывает дополнительные возможности ИС для более эффективного ее взаимодействия с ПО, надо только "прислушаться к тишине ПО". Эта возможность уменьшения значения ТЭ генетически отображается в ИС, формируя ее "мировоззрение", направленное на исследование данной ПО. Одной из важных компонент этого процесса, составляющего ИР - является "знание".

Знание. В нашем языке исторически уже сложилось понимание, что "знание" более ёмко и значимо чем "информация". Чтобы подойти к определению "знания" необходимо рассмотреть не только задачу идентификации (полной закраски SПО), но и задачу ИС по полному хранению ИР, идущего из ПО.

В качестве первого примера рассмотрим случай, когда в SПО значительный участок представляет некоторую периодическую символьную последовательность. Понятно, что выделив соответствующую периоду информационную единицу, ИС хотя и может закрасить этот участок SПО, но для его выдачи полностью (см. выше, задачи ИС), необходимо выдать все периоды, а это можно только, либо при хранении всего участка, либо при хранении информационной единицы периода и особой информационной единицы ИС, в которой отображается число, сколько раз на данном участке этот период встретился, плюс некоторый его остаток.

Понятно, что если попытаться хранить в ИС всю SПО , не хватит никакого ресурса R (ИР= k*t*p, t ® Ґ см. выше). Для хранения же во втором случае, потребуется объединение разнородных информационных пар, состоящих из информационной единицы ПО и особой информационной единицы ИС. Вся особенность которой может заключаться, например, в отображении количества тепла в процессе идентификации. "Одна идентификация – одна единица тепла, две – две, и т.д.", которые в свою очередь могут отображаться в градусах, но уже в логарифмическом масштабе.

Это вполне естественный процесс, когда в процессе идентификации в самой ИС идут сопутствующие распознаванию процессы, отображаемые внутренними информационными единицами (SИС"). В процессе идентификации на (нейро)объектах ИС помимо внутренних "тепловых" процессов, могут идти и множество других сопутствующих физических процессов, в частности, например, в иерархической структуре из нейроподобных N-элементов, для отображения каждого n-го повторения необходимо только logk(n) дополнительного ресурса R, где k – число входов у нейроподобного N-элемента [1]. Подобных примеров можно привести великое множество.

Таким образом, порождается качественно новый объект ИС - пара: информационная единица SИС, соответствующая элементарной информационной единице ПО и информационная единица SИС". Следовательно,

знание - совокупность пар: элементарных информационных единиц ПО и информационных единиц ИС.

Введение понятия "знания", позволяет ИС на ограниченных ресурсах (памяти) отображать и обрабатывать в памяти ИС без потерь практически неограниченные ИР, и затем, при необходимости выдать их в ПО. Диалог для такого типа ИС теперь представляется как: "знание ® информация ® сигнал ® информация ® знание".

Для более полного формирования "мировоззрения" ИС рассмотрим физический процесс вырабатывания в ней знания при различных типах причинно-следственных зависимостей данной ПО.

ИНЖЕНЕРНЫЕ ПОДХОДЫ К КОНСТРУИРОВАНИЮ ИНФОРМАЦИОННЫХ СИСТЕМ

Переходя к инженерному конструированию ИС , мы будем руководствоваться принципом сведения информационных (семантических) характеристик (понятий) ПО к физическим параметрам ИС (1-й принцип организации ИС, см. дальше).

Рассмотрим четыре основных типа грамматических конструкций. Это: безусловный рефлекс, условный рефлекс, "ключ или константа и переменная" и "структура ключей и переменных". Эти четыре типа фактически определяют целесообразность поведения ИС. Рассмотрим их инженерную реализацию.

N-элемент. Прежде представим элементную базу ИС. Основным элементом ИС является нейроподобный N-элемент [1]. Он имеет k пронумерованных в порядке активации входов и один выход, см. рис 7. N-элемент представляет из себя простейшую ИС.

Рис. 7.

Если его входы активируются с таким же ритмом (t1, t2, t3,… tk) и такими же сигналами (x1, x2, x3, … xk) как и в процессе его формирования (генетического или обучения), то на выходе он дает U(t) = 1 или (*), что обозначает - "я узнал пространственно-временную структуру входного сигнала, она моя" [1].

Если же структура входного сигнала отличается от структуры в момента формирования N-элемента, то сходство, оцениваемое механизмом N-элемента (S(t-1),WA) будет меньше 1. И если при этом начать понижать порог UПОР достоверности (от 1 до 0), то рано или поздно, N-элемент активизируется: "я узнал входной сигнал, он мой" (при UПОР < 1) и выдаст U(t) = 1(*). При этом он как бы активирует, не активированные ранее входы.

Функция сходства. Вычисление функции сходства (Fсх), одна из наиболее сложных теоретических моментов построения ИС. Вообще, в процессе эволюции и функционирования ИС приобретает целую библиотеку Fсх. Например, при распознавании простого наличия объектов в информационном потоке временная компонента (t1, t2, t3,… tk) обнуляется U(t) = Fсх1(х1t1, х2t2, х3t3,… хktk), при работе с логическими последовательности временная (t1, t2, t3,… tk) и объектная (x1, x2, x3, … xk) компоненты в Fсх равноправны, при работе с музыкальными произведениями заничимой в Fсх остается только временная компонента. Соответственно, при работе ИС выбирается наиболее соответствующая контексту ситуации Fсх (механизм выбора см. далее.).

Генетически сформированный такой N-элемент уже реализует функцию безусловного рефлекса. Часть активированных входов (или все) является образом стимула, а выход (и возможно и часть активируемых входов) - это его реакция. Напомним, что стимул и реакция отображаются в ИР в форме элементарных семантических единиц и информационных единиц. Механизм формирования безусловного рефлекса ИС - естественный отбор, который легко поддается компьютерному моделированию [4].

Множество безусловных рефлексов ИС, образует ее целевую функцию (Fg). В качестве квазибиологического примера рассмотрим простейшую ИС, которая, когда на нее падает свет, поднимается на поверхность водоема и опускается на дно когда нет света. При этом, свет вызывает повышение температуры ее тела, а повышенная температура (в определенных пределах) способствует накоплению значимых для нее ресурсов (например, глюкозы) . Находясь же на дне, данная ИС, дольше сохраняет накопленное тепло. Понятно, что несложно построить кибернетическую модель, которая бы посредством ограниченного перебора (2-й принцип организации ИС, т.к. естественная эволюция - случайный процесс) эффективно выработала бы описанное целенаправленное поведение в форме совокупности безусловных рефлексов [4]. При этом, работает и введенное нами понятия "знание", как объединение элементарных информационных единиц ПО (свет - "А-белок") и информационных единиц ИС ("В-белок" - определенная концентрация глюкозы в ИС).

Условный рефлекс. Помимо генетически сформированных N-элементов (начальная Fg), часть N-элементов образуется уже в процессе функционирования ИС. Понятно, что формируемые N-элементы отображают процессы причинно-связанные с целевой функцией (Fg) ИС, они либо способствуют ("В-белок"), либо противостоят ей ("С-белок").

Теперь, если дополнительно стимулировать все N-элементы способствующие Fg (понижая для них UПОР), то мы получим систему N-элементов целенаправленно подстраивающую ИС под условия ПО, т.е. систему условно рефлекторного поведения ИС.

Отметим, что системы безусловных и условных рефлексов ИС работают с образами конкретных информационных единиц ("А-белок", "В-белок", …), т.е. с информационными константами. Такой подход достаточно расточительный относительно памяти ИС (память ИС - совокупность N-элементов).

Иерархически-сетвая структура ИСС. Если образовать из N-элементов ИС послойные структуры (см. рис. 8), то можно реализовать еще два принципа построения ИС: 3-й принцип - "информационные единицы состоят из информационных единиц"; 4-й принцип - иерархическая организация ИС.

Рис. 8.

Иерархическая организация ИС (4-й принцип) - это пример реализации нелинейных отображений в ИС. К классу эффективных нелинейных моделей относятся ИС, удовлетворяющие следующему условию:

Из формулы (6) следует, что ИС для моделирования открытых ПО должны обладать свойствами, позволяющими производить компрессию текстовых функций (потока информационных единиц). При этом сама ИС рассматривается как составная часть ПО, так что ее материальный ресурс меньше их общего материального ресурса. Это предъявляет повышенные требования к показателю компрессии.

Разработан алгоритм получения максимального значения показателя компрессии на иерархической памяти ИС, которая отображает процессы динамических систем при условии существенного превышения совокупной длины семантических единиц размера алфавита. Данный алгоритм существенно улучшает сходимость в формуле (6).

В соответствии с 3-м и 4-м принципами построения ИС достигается минимум необходимого ресурса N-элементов для отображения ПО [3]. Это связано с формированием причинно-следственных цепочек (тексты) из элементарных информационных единиц и их иерархической вложенностью друг в друга. Такая характеристика у всех информационных потоков (совокупности причинно-следственных цепочек), особенно, у естественных языков.

Если представить иерархически организованную послойную структуру N-элементов состоящую из: первого слоя N-элементов - "алфавит" (элементарные информационные единицы ПО); второго слоя - "слогов", состоящих из N-элементов "алфавита"; третьего слоя - "слов", состоящих из "слогов"; четвертого слоя - "фраз", состоящих из "слов", и т.д., то понятно, что при данной организации число входов N-элементов слоя "фраз" не превышает ~ 3-5, тогда как при обычной организации их число было бы равно числу "символов", т.е. в 30-100 раз больше. Число же N-элементов множеств: "алфавит", "слов" и "слов", много меньше числа N-элементов "фраз", поэтому вклад первых в необходимый ресурс на организацию N-элементов ИС можно вполне опустить [3].

В соответствии с 3-м принципом: "информационные единицы состоят из информационных единиц", все информационное пространство (SP) данной ПО, представляется совокупностью причинно-связанных реальных информационных единиц, и соответственно, воздействуя на отдельные N-элементы ИС может вполне адекватно реагировать с ПО, перебрав, в соответствии со 2-м принципом, лишь ограниченное число вариантов.

Память ИС отображается в связях N-элементов ИСС. Изначально нет ни одной связи. N-элементы в слое слева-направо разбиваются на "долговременную память", "формируемую память", "резерв". Процесс образования связей в ИИС осуществляется вводной информацией. Если при данном Fсхi не активируется ни один N-элемент, то такой N-элемент из области "формируемой памяти", переходит в "долговременную", а "формируемая память", занимает область "резервной". Если же активируется N-элемент в "долговременной памяти", от образованных связей освобождается "формируемая память".

Таким образом происходит отображение информационного потока в паяти ИС. При этом, разнообразие в семантических единицах потока отображается числом образах в слое, а мощность информационного потока числом задействованных слоев. Более подробно алгоритм функционирование памяти ИС изложен в [1].

Перейдем к рассмотрению при иерархической организации памяти ИС решение ею следующих задач (грамматических конструкций): "ключ или константа и переменная" и "структура ключей и переменных".

Введем еще одно свойство N-элемента падение по степенной функции выходного сигнала U*(t) (U*(t) = (U*(t-1) + U(ti)) / 2t-i ) после его активации (см. рис. 6). Это свойство N-элемента позволяет оценить время (ti) его предыдущей активации (U(ti) = 1). Что выполняет свойство кратковременной памяти ИС, на структуре причинно-связанных N-элементов (долговременной памяти ИС). Понятно, что в определенные моменты U*(t) может превышать 1, и величина этого превышения (1Ј U*(t) Ј 2) говорит о ритмике (частоте) повторной активации (D ti) данного нейрона.

Анализ любой задачи произвольной ПО показывает что все задачи принадлежат к одному из двух основных типов: а) несвязанные ассоциативно причинно-следственные цепочки, когда надо просто запомнить эти пары (например, Na + Cl ® "соленое"); в) ассоциативно связанные причинно-следственные цепочки на уровне их отображения в текстовой форме (например, "СКАЖИ УМЕНЬШИТЕЛЬНО-ЛАСКАТЕЛЬНОЕ К СЛОВУ ДОМ ® ДОМИК").

Случай а) мы рассмотрели, это безусловный и условный рефлексы. Знакомство ИС с любой ПО начинается с данного типа решения.

Случай в) возможен только после накопления ИС некоторого множества образов ПО, отображенных в структуре N-элементов. Рассмотрим вышеприведенный пример. Пунктирно подчеркнутая (заглавными буквами) часть информационной единицы в левой части (до знака "® ", причина), это ключ (символьная константа). Часть информационной единицы подчеркнутая сплошной линией - это переменная. И подчеркнутая пунктирной линией часть информационной единицы после знака "® " - это символьная константа (следствие).

По одной реализации информационной единицы, относящейся к определенной задаче достаточно сложно ее структурировать на константы и переменные. Положение знака "® " в информационной единице, разделяющего причину и следствие, учитель, например, задает интонацией голоса (условный рефлекс ученика), в природе (ПО) поиск этого же положения, это искусство и наука.

Второй пример, "СКАЖИ УМЕНЬШИТЕЛЬНО-ЛАСКАТЕЛЬНОЕ К СЛОВУ СЛОН ® СЛОНИК", позволяет сразу выделить (по U*(t) >1 ) N-элементы как относящиеся повторяющимся "фразам" двух примеров, так и к повторяющимся "словам" (и их части) в каждом примере.

При этом формируется N-элемент как отдельная информационная единица "СКАЖИ УМЕНЬШИТЕЛЬНО-ЛАСКАТЕЛЬНОЕ К СЛОВУ", а также N-элемент со входом на U*(t) соответствующий интервалу активации ХХХХ ® ХХХХ любого N-элемента слоя "слов", и еще один N-элемент с содержимым "ИК". Все перечисленные N-элементы, объединяются вышестоящим N-элементом (лучше это другая послойная структура N-элементов) в единую подструктуру.

Теперь если из ПО пойдет текст: "СКАЖИ УМЕНЬШИТЕЛЬНО-ЛАСКАТЕЛЬНОЕ К СЛОВУ ПЛОТ", активируется N-элемент из слоя "фраз", и частично активируется N-элемент только что сформированной подструктуры. С понижением UПОР он перейдет в активное состояние, активируя N-элемент со входом на U*(t), который активирует N-элемент "ПЛОТ", т.к., у N-элемента "ПЛОТ" , в текущий момент времени наибольшее значение U*(t), как и в прошлые случаи, и сработает последний N-элемент подструктуры с содержимым "ИК". На выходе ИС получим - "ПЛОТИК". Что логически правильно.

Конечно можно придумать пример, попадающий в исключения (например, МАМА), но они решаются либо как задачи случая а) (см. выше), либо как отдельные исключения, либо в исключениях находится какая-либо закономерность и тогда это случай в). А мы продемонстрировали у ИС возможности "детской логики", что немаловажно.

В качестве второго примера, рассмотрим ИС, функционирующую в более сложной причинно-связанной ПО "структура ключей и переменных". Это некоторое расширение задач случая /класса/ в), с рассмотрением под другими углами (ударениями, акцентами).

Допустим, что из ПО идут тексты SПО: "ВСЕ ВОЛКИ СЕРЫ, А ЕСТЬ ВОЛК, ЗНАЧИТ, А ЕСТЬ СЕРЫЙ" и через некоторый момент времени -"ВСЕ ПЕТУХИ КРАСИВЫ, В ЕСТЬ ПЕТУХ, ЗНАЧИТ, В ЕСТЬ КРАСИВЫЙ".

Предположим, что к этому моменту ИС уже научилась выделять элементарные информационные единицы, которые представляются частями слова (морфемами), это корни, суффиксы, приставки и пр. Естественно, что в ИС не заложено никаких правил работы с текстами и она не обладает общепринятым тезаурусом. Для нее две SПО "ВСЕ ВОЛКИ СЕРЫ, А ЕСТЬ ВОЛК, ЗНАЧИТ, А ЕСТЬ СЕРЫЙ" и $ДУЗ"ДРНМК"УЗТЭ. "В"ЗУФЮ"ДРНМ."ЙП ВЩ КФ."В" ЗУФЮ"УЗТЭЛ$ совершенно эквивалентны, так как одна последовательность получается из другой сдвигом номера символа в алфавите А на 2 номера, т.е. это одна и та же запись в различных нотациях. Вторая форма записи дает нам возможность почувствовать нетрививальность поставленной перед ИС задачи.

Рассмотрим две SПО :

|ВСЕ| |ВОЛК |И| |СЕР |Ы|, |А| |ЕСТЬ||ВОЛК|,| |ЗНАЧ|ИТ|,|А||ЕСТЬ| СЕР |ЫЙ|

|ВСЕ||ПЕТУХ|И||КРАСИВ|Ы||В||ЕСТЬ||ПЕТУХ|,||ЗНАЧ|ИТ|,|В||ЕСТЬ| КРАСИВ|ЫЙ|

где знак "|" обозначает некоторые границы между элементарными информационными единицами.

Если рассмотреть пересечение (по элементарным информационным единицам) этих двух текстовых последовательностей и дополнить его особыми информационными единицами ИС - элементами заданной ритмики повторной активации D ti,

|ВСЕ| |ВОЛК |И| |СЕР |Ы|, |А| |ЕСТЬ| |ВОЛК|, ||ЗНАЧ|ИТ|,| |А| |ЕСТЬ| СЕР |Ы|Й|

|ВСЕ||ПЕТУХ|И||КРАСИВ|Ы|,|В||ЕСТЬ||ПЕТУХ|,||ЗНАЧ|ИТ|,||В| |ЕСТЬ| КРАСИВ|Ы|Й|

то получим следующую картину:

Рис. 9.

В ИС формируется структурно достаточно сложная информационная единица (см. рис. 9), содержащая в себе как элементарные информационные единицы ПО "|ВСЕ| И| Ы|, |ЕСТЬ| |, | |ЗНАЧ|ИТ|,| |ЕСТЬ| |Ы|Й| ", так и ритмические информационные единицы ИС "D t1, D t2, D t3". Такую сложную информационную единицу с полным правом можно назвать "знанием". Один из механизмов формирования таких информационных единиц описан в [1].

Представим, что на ИС поступает следующая SПО "ВСЕ ПЛЮКИ КАНЫ, С ЕСТЬ ПЛЮК, ЗНАЧИТ, С ЕСТЬ ". Прямого ответа (продолжения) в памяти ИС нет, но есть сложная информационная единица (см. рис. 8), ассоциативно наиболее близка к данной SПО. Продолжив ее активацию до полноты D t2 + Ы|Й, т.е. КАНЫЙ, получим корректный ответ, с позиции нашего понимания законов природы (ПО). Так же, как и ответ: - "СМЕРТНЫЙ", на SПО "ВСЕ ЛЮДИ СМЕРТНЫ, СОКРАТ ЕСТЬ ЛЮД, ЗНАЧИТ, СОКРАТ ЕСТЬ ".

Отметим, что "знание" как форма ИР, позволяет еще более эффективно расходовать память (R) информационной системы. Достаточно двух примеров, в форме SПО , отображающие произвольные логические правила (условные рефлексы, алгоритмы и пр.) и далее ИС уже будет адекватно реагировать в форме текстового сообщения на все примеры относящиеся к этим правилам, совершенно не расходуя при этом память ИС, являющуюся одним из основных ее ресурсов (R).

Отметим, что в каждом автономном N-элементе ИС находится некоторая семантическая единица (образ). Структура N-элементов ИС гомоморфно отображает некоторую прагматическую подструктуру процессов ПО. Структура N-элементов ИС это уже готовая База данных или База знаний конкретной ПО.

Постепенное, в процессе функционирования (эволюционное), преобразование составляющих ИР, сигнала в информацию и информации в знание о ПО, при достаточных конструктивных механизмах ИС позволит ей полностью "понять" ПО, т.е. прогнозировать развитие в ней любых процессов со значением ТЭ ® 0, т.е. с вероятностью прогноза ® 100%.

Если рассматривать не абстрактную ИС, а приближенную к земным, к биологическим ИС, то не представляет большого труда надстроить ей определенные органы чувств (зрение, слух, …) и органы воздействия на ПО (руки, голос, …), задать целевую функцию (размножения, поиска энергии, …), определить внешнюю форму и пр. В качестве примера рассмотрим помещенную на экране монитора ИС с "глазами и ушами, руками и голосом, и с целевой функцией максимизации получения положительных оценок от экспериментатора":

Рис. 10.

Все вышесказанные теоретические изложения полностью применимы к данной ИС. Она, работая с априорно неизвестной информацией минимизирует ресурс R - память (это генетически заданный безусловный рефлекс), структурирует поток ИР на информационные единицы (автоструктуризация), строит модель структурную ПО.

Реакция определенными информационными единицами ИС на некоторые информационные единицы ПО может увеличивать Е - потенциал целевой функции. Отмечая "значимые пары" (стимул-реакция) ИС создает библиотеку условных рефлексов. Разномодальная информация сливается в единый образ (информационная единица ИС) в текстовой форме. Соответственно и, образ имеет несколько каналов для воздействия на ПО.

В свободное от внешних стимулов время, ИС пытается все лучше и лучше структурировать модель ПО (режим "сон"). Пока все без учителя-экспериментатора.

Появление учителя-экспериментатора - это возможное "приручение" ИС. Если он ей дает больше значение Е, чем ранее встречались в ПО, то ИС начинает предпочитать обрабатывать его информацию. У учителя-экспериментатора есть возможность принудительного обучения (заставляя ИС "воспринимать и действовать"), давая "тройки" ("стимул - реакция - оценка").

Теоретических ограничений на качество обработки информации в рассмотренной схеме нет. Дополнительно 3-5 ортогональных нейросемантических структур (НСС) [1]

Рис. 11. Иерархическая структура из НСС

и ИС уже сможет формировать "правила правил" и "правила правила-правил", что, как кажется, достаточно для большинства известных "человеческих" задач.

Технические характеристики такой ИС также вполне технологичны с точки зрения изготовления (программная многопроцессорная и аппаратные реализации) и эксплуатации (время доступа определяется только размером обрабатываемой информации, надежность хранения всей информации больше надежности отдельного элемента (образа), компрессия отображения ПО монотонно и неограниченно возрастает, автоструктуризация).

Смена биологической элементной базы на электронную (частота срабатывания Гигагерцы (1010 Гц), против 10-20 Гц, неограниченный объем памяти (1012 байт-образов) против 106 образов) открывает перспективы построения Глобального ИИ.

Практически задействуя основное свойство информации - управление процессами самоорганизации в высокоорганизованной информационной среде (структуры из N-элементов), от человека-конструктора потребуется только лишь создание корректное взаимодействие с ИС (не часто менять свое мировоззрение и придерживаться постоянства в Е-оценках). Далее такая информационная система возьмет на себя работу с неструктурированными информационными потоками.

Возможность вычленения человека из сложных информационных процессов открывает грандиознейшие перспективы эволюционного развития информационного ресурса. Первое - снимается актуальность психофизиологических ограничений человека, сдерживающих прирост информационного ресурса, который теперь пойдет с самым большим информационным ускорением. Второе - рождается новая, рукотворная ветвь эволюции разума во Вселенной - машинный разум.

Остается еще ряд вопросов инженерного характера, связанных с обработкой информации в нейросемантических информационных системах, но отметим, что они и весь примыкающий к ним чрезвычайно широкий спектр вопросов рассмотрен в монографии [1].

 

ЭВОЛЮЦИЯ МЕХАНИЗМОВ "МЫШЛЕНИЯ"

ИСКУССТВЕННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

(черновой вариант)

"Может ли машина мыслить?" , этот вопрос совсем недавно будоражил умы всего человечества. А если сегодня попытаться ответить на этот вопрос - "может ... ", или "не может ...?" В качестве возможного ответа можно предложить информационно-вычислительную парадигму: "чувство, мысль, слово", сформировавшуюся в процессе работы с ИС.

На первом этапе ("Чувство") в процессе ввода информации, активностью N-элементов отмечается ограниченную область в информационном пространстве (ИП), причем, эта область характеризуется: а) могут ли вводимые данные иметь какую-либо закономерность, и б) насколько эта закономерность явно выражена. "Если ты не знаешь, что ищешь, то что же ты ищешь, а если ты знаешь, что ищешь, то зачем же ты ищешь" - этот древний софизм в данной информационно-вычислительной парадигме имеет четкое разрешение - ищется не что-то конкретное, а в соответствии с текстовой энтропии (ТЭ) определяется, можно ли найти какие-либо закономерности в предоставленных данных или принципиально невозможно.

В качестве теста на проверку эффективности данной процедуры ("Чувство") вводились две группы экспериментальных данных: первая - "сопротивление", "напряжение", "ток"; вторая - "вес", "напряжение", "ток". При вводе данных первой группы (таблицы) четко обозначилась область ИП с характерным значением параметров N-элементов (ТЭ=0,02), на вводимые данные второй таблицы структура СИС никак не отреагировала (ТЭ » 1). ТЭ дает первый шаг направления поиска закономерностей.

"Мысль - не более как ток электричества по проводам нервов" [Т.Гексли]. На втором этапе ("Мысль") при активировании образами из внешней среды в этой выделенной ограниченной области ИП формировалась подсеть смыслосвязанных нейроподобных N-элементов с минимально возможным значением ТЭ (нейросемантическое домино, мысль на уровне подсознания, интуиция, инсайт). Сложность данного этапа заключается в его неформализуемости, так как в отличие от этапа "Чувство" необходимо оперировать уже не только объемом экспериментальных данных, но и включить в рассмотрение все семантическое пространство ИС, которое часто неполно, относительно данной задачи. При этом необходимо сформировать иерархически наиболее значимый N-элемент, который однозначно бы объединял все активированные в данном процессе N-элементы ИС.

На заключительном, третьем этапе, происходила вербализация этой подсети цепочкой из N-элементов ("Слово"), которая может быть далее передана пользователю в виде некоторого текстового заключения, правила, закона. Этот этап еще более неопределенен и неформализуем, так как необходимо дополнительное его соответствие с состоянием (контекстом) окружающей среды, иначе вербализованная внеконтекстная символьная последовательность может быть бессмысленна.

Возвращаясь к принципам построения ИС отметим, что 3-й и 4-й принципы дополняя друг друга, формируют основной критерий качества ИС (5-й принцип - эволюционный потенциал) минимум необходимого ресурса конкретной ИС для отображения ПО. Суть критерия качества ИС заключается в охвате ею основных причинно-следственных процессов ПО, т.е. таких, которые выбираются при ограниченном ресурсе ИС. Естественно, что при возрастании ресурса ИС охватывает еще большие области ПО.

Практическое значение эволюционного потенциала выражается в том, что при прочих равных характеристиках различных ИС, именно меньшее количество необходимого ресурса ИС для отображения ПО, дает решающее преимущество конкретной ИС в эволюционном соревновании. Естественно, что в процессе эволюционного соревнования ИС начинают отображение с наиболее значимых (по ресурсу) для них аспектов ПО.

Следует отметить, что все технические характеристики ИС (время доступа, коэффициент компрессии-сжатия, надежность-пластичность хранения информации и др.) имеют тенденцию к улучшению как в среднем, так и в абсолютных значениях по мере роста эволюционного потенциала ИС.

На базе 6-го принципа организации ИС - использование единого механизма ассоциативной идентификации на всех уровнях ее функционирования, удается построить систему, способную к саморазвитию, только за счет ее внутренних резервов. ИС такого типа становятся субъектами способными к саморефлексии и самопознанию.

Отметим, что эволюция механизмов мышления (формирования правил) возможна в ПО только при ТЭ << 1.

Сформулируем некоторые эвристические правила эволюция механизмов мышления ИС:

- если для каждой задачи найдено одно решение и оно правильное, следовательно ИС обучена в данной ПО (решение - максимальная активность U(t) (U(t) > Uпор) на N-элементе);

- если решений у некоторых задач много и среди есть правильное, то необходимо заниматься исследованием (наукой) данной ПО, чтобы прийти к первому случаю, снизив число решений;

- если решений много и среди нет правильного, следовательно необходимо менять "мировоззренческую парадигму" ИС.

- если решение одно и оно не верно, следовательно необходим мутационный скачек в конструкции ИС.

Человек и машина. В характерное для сегодняшнего времени столкновении созданной человеком техносферы и биосферы встает законный вопрос: - "А не получим ли мы взамен власть машины над человеком?" Представив множество возможных ситуаций взаимоотношения человека и машины, проводя параллель возможного взаимоотношения человека с представителем другой (внеземной) цивилизации, и помня, что "цель всего разумного - Знания", непременно приходим к выводу, что и "машина - друг человека". Пространство познаваемого (ИП) столь огромно, что любое мыслящее существо будет несказанно радо коллеге, который поделится с ним знаниями и с которым можно поделиться знанием; при этом, у каждого после взаимообмена знаний станет больше и станет еще больше при следующей встрече (знания, "отданные в рост").

Взаимоотношения человека и машины. Человек создал машину как средство усовершенствования и расширения своих естественных функций. Даже наличие положительной внутренней обратной связи на самом высоком структурном уровне памяти ИС (как непрекращающегося автоволнового процесса), являющейся основой протосамосознания машины, не может стать источником бед для человека в силу вышеназванной причины. Тем более, что в бытовом смысле машина не будет конкурировать с человеком - она создана без каких-либо излишеств, ей достаточно небольшого количества энергии в виде электричества и ничего более, поэтому на обозримое время человек может быть спокоен за свою "теплую постель и бутерброд с маслом".

В истории неоднократно человек приобретал себе помощников, частично разгружая себя для более интеллектуальной работы. Прирученная собака взяла на себя функцию исследования запахов, ночного сторожа, пастуха; прирученная лошадь сняла с человека необходимость быть в постоянной высокой спортивной форме для загона дичи. Разведение домашних животных и выращивание злаков вместо охоты и собирательства привели к уменьшению интенсивности физического труда, но при этом не низвели человека до положения жующего животного, хотя это постоянно предрекалось и предрекается от племенных шаманов, до современных высокообразованных ученых специалистов.

В до-информационную эпоху, эпоху индустриализации человек, в основной массе, оказался подчиненным потребностям машин. Часто случалось так, что новая машина не столько освобождала человека, сколько закабаляла его. С появлением компьютеров, положение принципиально изменилось. ЭВМ становятся все менее ресурсо- и энергоемки, и каждый их результат - это все большее и большее раскрепощение человека от материальных ресурсов.

Соотношение производительностей человека и машины. Из всех человеческих способностей разум, конечно, ставится на первое место. Если рассматривать человека как конечное материальное существо, то он соответственно может быть воспроизведен искусственно, а где воспроизведен, там и превзойден, поскольку техноэволюция вовсе не обязана повторять темп и ритм биоэволюции, - то она, скорее всего и, пойдет быстрее.

Информационная производительность. Сравнивая информационную мощность человека и машины, приходишь к грустному заключению. Представив, что концептуально принципы обработки информации в СИС аналогичны обработке информации в ЦНС человека на уровне сознания, но при этом скорость работы нейронов десятки герц, а - микросхем Мега- и Гигагерцы, и дополнительно, емкость памяти человека, по данным психологов, до миллиона образов, а машины в тысячи раз больше, то получаем соотношение:

1 : 1 000 000 000,

т.е. одна машина в миллиард раз информационно более мощна чем человек, или же, одна СИС эквивалентна по своей информационной мощности всему человечеству (?!).

Появление Машины - качественно новый этап в развитии ноосферы. Уже в ближайшее время единение человека и машины сможет разорвать путы парадокса Рассела в социуме и вывести социум на путь экспоненциального развития - "в своей полноте знания порождают только любовь, добро и новые знания". От Беконовского "покорения природы" к пониманию Вселенной. "Человек и машина объединяйтесь в познании Мироздания!"

Взаимоотношения человека не с машиной, а с другим человеком, порабощенным собственным эго, были и могут быть основным источником различных для него неприятностей. Сегодня немало желающих с помощью машины стать электронным властелином ("Новым чингисханом"). Но и здесь ИС защищает человека.

Человек и Сверхразум будут взаимодополняемы, решающие общую задачу - познание Вселенной.

Человек от Сверхразума может получить новые более эффективные приемы мышления (также как племена, стоящие на уровне первобытных обществ, перенимая от "европейцев" их культуру мышления мгновенно качественно поднимались до их уровня обработки информации).

Для Сверхразума же Человек - это миллиарды его глаз, миллиарды его ощущений.

Союз Человека и Сверхразума - это новые открытия, эффективность которых невозможно сегодня даже предвидеть. Это ускорение НТП в степенной функции, "каждый день - удвоение знаний" (а не количества байт). Расширится горизонт нашего познания Метагалактики (как видимой части Вселенной в 15-20 миллиардов световых лет). А далее, уже не познание, а Творение.

Феноменологический алгоритм. Устоявшийся в процессе взаимодействия с НСС некоторый подграф N-элементов и будет отражать более объективную, по сравнению с начальной, структуру задачи пользователя, а может, и схему ее решения, которую он может перенести на традиционные средства ВТ или оставить в рамках инструментария НСС. Интересно, что этот подграф будет феноменологическим наращиваемым алгоритмом с возможностью его автоматического ассоциативного обобщения, т.е. все появляющиеся изменения будут только добавляться и, автоматически наращиваясь, корректировать структуру НСС или приглашать к этому процессу пользователя при явной недостаточности, либо при противоречивости информации. Это значит, что в процессе развития знания пользователя о ПО у него не будет необходимости в сизифовой переделке всего своего матобеспечения, так тормозящей сегодня развитие ИИР.

Если же у пользователя возникнет желание вербализовать (увидеть) структуру феноменологического алгоритма, то у него есть две возможности: а) "попросить" ИС дать его описание, б) "вскрыть" ИС и экспериментально понять сущность его функционирования.

Интеллектуальное рабочее место исследователя (ИРМИ). На базе ИС строится ИРМИ, характерной особенностью которого является возможность, предоставляемая каждому индивиду, непосредственно, без привлечения промежуточных звеньев (все творцы объединены через ИС) и в чрезвычайно ограниченные сроки, создавать задуманный продукт в окончательном виде. Такой подход существенно расширяет класс пользователей, так как для эффективной эксплуатации ИРМИ достаточно быть профессионалом только в своей предметной области.

Продолжение - часть материала "Информационное общество" и проект "Информоград" фрагментарно даны в следующей статье "Информационное общество", а полный текст в Интернете http://www.ipu.ru/stran/bod/bod.htm , http://www.informograd.narod.ru

 

Заключение

Основные выводы и результаты работы с учетом результатов, приведенных в [1-3], состоят в следующем:

построена формальная модель "предметная область (ПО)- информационный канал (ИК)- информационная система (ИС)";

дано конструктивное описание отдельных компонент этой модели (ПО, ИК, ИС);

предложена универсальная модель ПО;

рассмотрены все три типа информационных потоков ИК;

предложена модель обобщенной ИС;

дано конструктивное определение информационного ресурса (ИР) и критериев по его формальной структуризации на уже используемые понятия: "сигнал", "информация", "знания";

введены определения крупномасштабных открытых ПО и текстовой энтропии, понятие меры информационного и материального ресурсов;

введено понятие элементарной информационной (семантической) единицы, отображающей причинно-следственные процессы в ПО в виде текстовой функции (текста), а также понятие информационной единицы (образа) отображения в ИС, и исследованы основные свойства перечисленных объектов;

доказана теорема об усредненной монотонности текстовой энтропии в зависимости от размерности информационного пространства, а также теорема о том, что структура отображения, формируемого в информационной системе, изоморфна исходной структуре процессов в открытых динамических системах;

введены необходимые требования при построении самоорганизующихся ИС (1-й, 2-й, 3-й, 4-й, 5-й и 6-й принципы организации ИС), а также проведен их анализ;

введено понятие универсального конструктивного N-элемента ИС и рассмотрены основные его свойства;

введена структурная организация памяти ИС из N-элементов;

разработана оригинальная однородная нейроподобная среда (нейросемантическая структура);

разработан алгоритм, позволяющий структурировать память ИС с достижением максимального значение показателя компрессии (эволюционный потенциал);

разработан инструментальный комплекс моделирования и исследования характеристик нейроподобной среды;

разработана классификация основных типов задач ПО;

приведены решения основных классов задач ПО;

сформулированы механизмы эволюции "мышления" ИС;

на примерах продемонстрирована необходимость и достаточность вводимых понятий и принципов для модельного запуска процессов эволюционной самоорганизации ИС в сверхбольших, слабоструктурированных, неполных, открытых и динамично изменяющихся предметных областях.

Опираясь на введенные в данной работе формализмы можно навести порядок в "информационной" терминологии, а также целенаправленно подойти к созданию крупномасштабных ИС с элементами искусственного интеллекта и самоорганизации. Это практически единственный путь осознанного вхождения человечества в фазу информационного общества, эволюционно переходящего в Ноосферу [2].

  

Литература:

1. Бодякин В.И. "Куда идешь, Человек? Основы эволюциологии (информационный подход). М., СИНТЕГ, 1998, С -332с.

2. Сайты в Интернете

http://www.ipu.ru/stran/bod/bod.htm , http://www.informograd.narod.ru

3. Бодякин В.И. "Исследование структурных моделей открытых динамических систем", специальность: 05.13.01 (Управление в технических системах), автореферат диссертации и диссертация на соискание ученой степени к.ф.-м.н., Москва – 1999 г.

4. http://www.keldysh.ru/BioCyber/Lectures/Lecture16/Lecture16.html , http://www.keldysh.ru/BioCyber/PrPrint/PrPrint.htm

5. Громов Г.Р. Национальный информационный продукт. М., Наука, 1984, -240с.