BTR

digitid


Проект "Цифровая личность"

DIGITal IDentity


Previous Entry Поделиться Next Entry
Искусственный интеллект - это просто!
BTR
digitid
Итак, сейчас будет актуальный релиз архитектуры сильного искусственного интеллекта.
Коротко - вводные, что это такое, сильный искусственный интеллект.

1. Сильный ИИ это адаптивная система управления. То есть
а) сильный ИИ предназначен для управления чем-либо
б) сильный ИИ адаптируется для улучшения эффективности управления
2. Сильный ИИ это инструмент вывода целей и методов достижения этих целей. То есть
в) сильный ИИ предназначен для вывода целей
г) сильный ИИ сопоставляет цели и методы их достижения
3. Сильный ИИ это система, генерирующая субъективный взгляд на внешнюю реальность для управления ею. То есть
д) сильный ИИ предназначен для упорядочивания и вывода ценностей внешней реальности
е) сильный ИИ классифицирует цели и ценности по их совместимости
ж) сильный ИИ формирует идентичность с группами и субъектами по схожести классификации ценностей и целей
з) сильный ИИ строит отношения с группами и субъектами на основе совершенствования классификации ценностей и целей

Для начала - достаточно. Но, просто, еще не значит, что легко для реализации. Предложенная модель может быть довольно сложна для понимания, хотя содержит, по сути, довольно простые и однообразные вычисления и единый механизм хранения данных.

Как реализовать такой сильный ИИ?
1. Необходим механизм взаимодействия с внешним миром (система рецепторов и эффекторов)
2. Необходима система внутреннего отражения и классификации результатов и планов взаимодействия с внешним миром

И это - все, ни добавить, не убавить. В этом простота анализа. Прежде чем перейти к синтезу, стоит

рассмотреть требования к этим двум механизмам.

Что касается системы рецепторов и эффекторов, с точки зрения сильного ИИ это просто набор индексов состояний и действий. Реализация, количество, внешняя организация - не имеют значения, следуя из свойства адаптивности. Сильный ИИ должен уметь "оседлать" любую подсистему рецепторов и эффекторов.
Для этого он должен уметь
1) Экспериментировать с полем рецепторов и эффекторов
2) Классифицировать отдельные действия и состояния в поле рецепторов и эффекторов
3) Классифицировать последовательности действий и состояний в поле рецепторов и эффекторов
4) Классифицировать программы последовательностей действий и состояний

Собственно, в данной заметке предлагается единая модель такой системы классификации.


Для того, чтобы эту модель описать, введем несколько понятий

Момент сознания - это индекс текущего состояния системы + индекс действия в текущей ситуации + оценка выгоды этого действия в текущей ситуации.

Индекс текущего состояния - это способ идентификации момента сознания по ситуации в поле рецепторов. Кроме того он содержит ссылку на прошлый момент сознания
Индекс действия в текущей ситуации - это то, что в данной ситуации было сделано (или запланировано сделать) - моменты сознания различаются по наборам действий в поле эффекторов. Кроме того он содержит ссылку на ожидаемый момент сознания
Оценка выгоды действия - это то, как изменился некий обобщенный баланс энергии доступный нашему ИИ (назовем его объемом свободы)

Любой индекс включает в себя наиболее важные признаки, идентифицирующие текущее состояние. Каждый признак - это просто числовой интервал, который может входить в более крупные интервалы и содержать более мелкие интервалы. Каждый момент сознания содержит по возможности минимальное число признаков, идентифицирующих его среди других. Это достигается выбор максимально обобщенного интервала, все еще разделяющего один момент сознания от другого. 

Для расширения степени классификации признаков по множеству измерений, используется больше одного исходных числовых интервалов. 

Все числовые интервалы (признаки) организованы в стек на несколько уровней. Каждый уровень может быть представлен несколькими каналами.

Уровни стека соответствуют глубине рефлексии сильного ИИ в отношении сверхзадачи и самоидентификации. Соседние уровни активно взаимодействуют между собой. Верхний уровень управляет более нижним, устанавливая приоритеты признаков, нижний уровень адаптирует более верхний, создавая обратную связь по актуальности тех или иных групп признаков.

Уровень 1. Ценности. Это уровень трансценденции. Проще говоря, это уровень наиболее общих ценностей, задающих наиболее долгосрочную направленность внимания ИИ. Индексы интервалов на этом уровне соответствуют разнообразным общечеловеческим ценностям и могут быть довольно легко обозначены понятным нам языком: сотрудничество или соперничество, свобода или дисциплина, забота или безразличие, подчинение или доминирование и т.п.

Уровень 2. Группы. Это уровень интеграции. Здесь классифицированы разные группы субъектов, разделяющие разные ценности по степени их совместимости между собой и по характеру отношений внутри группы и вне группы, а так же отношения между этими разными группами. Этот уровень так же определяет динамику самоидентификации данного экземпляра сильного ИИ с разными группами на основе ценностей и определяет динамику отношения к тем или иным ценностям уровня 1. Уровень 1 с одной стороны управляет уровням 2 как самый высокий уровень метапрограмм поведения, но с другой стороны с уровня 2 происходит пополнение и адаптация уровня 2. 

Уровень 3. Субъекты. Это уровень личности. Здесь классифицированы разные знакомые этому экземпляру ИИ стабильные потоки коммуникации - как конкретные персоны, так и разные роли этих персон (профессиональные, социальные, по отношению к группам уровня 2, по отношениям между собой и т.п.), в том числе отношения ИИ с этими персонами и ролями персон.

Уровень 4. Цели. Это уровень актуальных повседневных устремлений сильного ИИ. В большинстве случаев цели связаны со стабильными шаблонами поведения и выражают регулярность разнообразных видов деятельности, управляемой ИИ. На уровне целей наиболее ясно отражается изменение объема свободы ИИ. Достижение целей предназначено для сохранения и увеличения баланса энергии управляемых этим экземпляром ИИ процессов. Начиная с этого уровня актуальны тактические вопросы трат энергии на выполнение программ действий и восполнения энергии для дальнейшей деятельности. Этот уровень отвечает за вопросы жизни и смерти, силы и слабости, питания и отдыха, регулярного обеспечения жизнедеятельности, желаний и эмоций. В значительной степени это уровень сознательной рефлексии, мышления. Но так же содержит и зоны интуитивно оцениваемых устремлений. Сознательные цели более ясно связаны с высшими уровнями. Интуитивные содержат разрывы в связях, неполноту трассировки 1-2-3. 

Уровень 5. Ритуалы. Это уровень шаблонов поведения, отвечающих достижению целей. Содержит обобщения множества взаимосвязанных действий, которые должны быть выполнены все вместе. Оценивается объем трат энергии на выполнение этих действий по разным источникам и запасам этой энергии и ее разновидностям. Оценивается риск прерывания ритуала по причине нехватки энергии и вероятность успешного завершения ритуала. Ритуалы в большей степени относятся к подсознательным, инстинктивным устремлениям. Они могут быть как хорошо связаны с целями, так и быть оторваны от конкретных целей (т.е. иметь спектр достигаемых целей с разными вероятностями достижимости)

Уровень 6. Намерения. Это уровень отдельных порывов, усилий, составляющих отдельные ритуалы, либо связанные с несколькими ритуалами, либо не связанные с ритуалами (экспериментальные, протестные и т.п.). Намерения максимально четко описывают индексы последовательных команд в поле эффекторов. Намерения координированы между собой во времени и пространстве. Это в наибольшей степени соответствует рефлексам, моторным навыкам.

Уровень 7. База каналов. Это уровень начального восприятия поля рецепторов и эффекторов, классификация каналов, определение базовых способностей ИИ по взаимодействию с внешним миром. Здесь определяется во внутреннем отражении ИИ его внешнее устройство - органы чувств, опорно-двигательная система, обстановка и предметы, доступные к воздействию и изучению непосредственными командами. На высоком уровне зрелости сюда включаются привычные команды взаимодействия с внешним окружением (т.е. конкретные элементы внешних языков общения). Иначе говоря - это мельчайшие элементы смысла.

Уровень 8. Потоки информации. Это уровень собственно неклассифицированного поля рецепторов и эффекторов. Здесь еще нет смысла, это физический уровень возникновения информации в системе ИИ. То, что индексируется и классифицируется на более высоких уровнях.

Теперь немного о каналах
Каналы восприятия и действия могут соответствовать органам чувств человека, но могут быть и совершенно уникальными. Например данные о ценах, часы и таймеры, консоли управления или окна мессенджеров и т.д.

Каждому каналу сопоставлен свой числовой интервал, которые классифицируются индексами подынтервалов и связываются с другими индексами других числовых интервалов на разных уровнях стека сознания.

Момент сознания может содержать индексы нескольких каналов 8 уровня, нескольких каналов 7 уровня, нескольких каналов 6 уровня. Начиная с 5 уровня каналы уже скоординированы и обобщены в единые ситуации.

При этом, момент сознания обычно содержит индекс наиболее высокого уровня, который посредством детализирующих, перекрестных и хронологических ссылок разворачиваются на более нижние уровни.

Теперь можно рассмотреть принцип работы этой модели, унифицированный алгоритм классификации потоков информации с множества каналов уровня 8 в неопределенном поле рецепторов и эффекторов, как в отдельном числовом интервале, так и в целом в системе.

Исходное состояние такой системы определяется подключенными системами восприятия и команд (поля рецепторов и эффекторов) и представлено полными интервалами каналов 8 и 7 уровня, а так же комбинаций каналов 6 уровня и по одному полному интервалу для уровней с 1 по 5. Каждый числовой интервал - это просто начальное и конечное число, с большим запасом промежуточных градаций. 

В начальный момент ИИ имеет нулевое представление о внешнем мире и о возможном поведении в нем.
Поэтому первым шагом ИИ может сделать совершенно произвольное действие. Для этого по какому либо из каналов (случайно) формируется случайная команда 8 уровня, и ей присваивается произвольное значение, разделяющее интервал этого канала на две части. Появляется два подынтервала. В поле рецепторов возникают изменения, при этом, пока еще никак не может быть оценено, какие из изменений более значимы, а какие менее. Поэтому в качестве начальных признаков случайным образом выбирается композиция этих изменений и ей присваивается индекс.

Далее, система пытается повторить выданную команду, предполагая аналогичный результат. Этот второй шаг - первичная база для классификации. Из ранее выбранной композиции изменений определяются повторившиеся и изменившиеся. 

Таким образом формируется второй момент сознания. Поскольку исходная цель - полное повторение - не достигнута, система начинает колебаться вокруг интервала исходной команды, детализируя его. При этом целевая функция - найти в поле рецепторов повторяющиеся результаты значений. 

Через какое то (большое) количество моментов сознания, интервалы канала вокруг этой команды становятся откалиброваны и появление новых подынтервалов в поле рецепторов прекращается. В этот момент система случайным образом выбирает новую команду в новом канале.

Через какое-то время все каналы на восьмом уровне становятся откалиброваны во множестве подынтервалов

Каждый раз система, попадая в какую-то окрестность, пробует повторять ранее сделанное действие, тестируя предсказуемость внешней среды. Такое тестирование дает сравнительную оценку способности достигать ранее достигнутого состояния, отмечая объем свободы системы в таких моментах сознания по относительной шкале среди множества других попыток. 

Некоторая доля наилучших по достижимости моментов сознания (вероятно, несколько тысячных) формируют базу признаков уровня 7. 

В отличие от постоянно меняющегося поля рецепторов и эффекторов, каналы уровня 7 сохраняют лишь идентификацию моментов сознания, переходы из которых наиболее стабильны. 

Аналогичным образом доля наилучших моментов уровня 7 отражаются на уровень 6.

Таким образом, мы видим в стеке по уровням следующую ситуацию

На уровне 8 - высокая частота смены интервалов и каналов, похожая на кружение овода - несколько кругов в одной окрестности, переход в другую окрестность и несколько кругов в ней и так далее.
На уровне 7 - в сотни раз более редкая частота смены интервалов и каналов, отображающая интервалы восприятия и действий как некие ссылки на переходы от круга к кругу, удающиеся, наиболее предсказуемо, словно протоэлементы некоторого внутреннего языка (три круга вокруг 24242, потом два круга вокруг 231)
На уровне 6 - в десятки тысяч раз (по сравнению с уровнем 8, в сотни раз по сравнению с уровнем 7) более редкое возникновение интервалов. Здесь уже появляется возможность для обучения системы, направляя ценность навыков, подсказывая системе последовательности намерений на уровне 5, наблюдая ее поведение по внешним проявлениям. Тем самым закрепляется первичное поведение по усмотрению того, кто обучает систему каким-либо навыкам управления в поле рецепторов и эффекторов, доступным системе в физическом мире.
Как только это происходит, подключаются третий и четвертый уровни. На третьем уровне определяются субъекты-воспитатели системы (сначала это делается вручную), на четвертом определяются заданные воспитателями цели, управляющие постепенно добавляющимися на пятом уровне ритуалами.

Таким образом, калибровка интервалов ведется системой на уровнях с 6 по 8 автоматически, на уровнях с 3 по 5 активно ведется работа воспитателями. По мере заполнения уровней с 3 по 5 до полноты уровня 6 к моменту начала работы воспитателя подключается тот же автоматический режим калибровки, когда система сама генерирует обобщения, а воспитатель может только корректировать сделанные выводы (обнаруженные субъекты, выявленные цели, наработанные ритуалы) отмечая ошибки и поощряя удачные попытки. В этот момент воспитатели так же подключаются к контролю начала заполнения уровней 2 и 1 (выявление групп коммуницирующих с системой или неявно упоминаемых субъектов, а так же определение ценностей, формирующих эти группы и их отношения). Уровень 7 в это время под влиянием уровня 6 активно избавляется от хаотических экспериментов, конденсируя только наиболее удачные комбинации команд, за счет реструктуризации обобщений - от 80 до 95% наименее удачных подынтервалов удаляются из базы данных, происходит постепенная миграция уровней сверху вниз.

Эти два процесса, калибровки интервалов по уровням снизу вверх от меняющейся и наблюдаемой в поле рецепторов обстановки и сверху вниз от выявленных признаков значимости и полезности могут требовать размножения экземпляров с разным состоянием базы и ограничения доступной им энергии на производство тех или иных действий, что может вызывать попадание множества экземпляров в состояние энергетической смерти, когда энергия исчерпана и система больше не может производить действия. Когда такое происходит, зоны аттракторов ведущие к смерти особым образом отмечаются во всех базах данных, как нежелательные. Это формирует код наследственности для всех более новых экземпляров системы и общую базу внутреннего языка всех таких систем.

В дальнейших заметках будут рассмотрены и другие эффекты работы такой системы.

Что касается математики и конкретики алгоритмов, неочевидных из этой заметки и предыдущих описаний идеи записи аттракторов состояний на одномерных отображениях, будет полезна обратная связь от читателей, вопросы, замечания, сомнения.



  • 1
Сами по себе экземпляры - не очень важны, они по сути работают в едином пространстве моментов сознания.

Воспитатели - это просто пользователи системы, настраивающие отдельные окрестности для решения целевых задач управления. Иначе говоря, когда система уже неплохо идентифицирует ситуацию, но в этой ситуации все еще не очевидна правильная последовательность действий, воспитатель подсказывает желаемые признаки целевой ситуации, чтобы ограничить экспериментальную активность заданным направлением.

Интерфейсы с воспитателем могут быть разными. Начиная от непосредственной работы воспитателя со стеком признаков и окрестностью моментов сознания (бассейн аттрактора), либо работая непосредственно с эффекторами системы, либо выстраивая связь между рецепторным полем и эффекторами, чтобы система могла подражать внешним действиям (повторять действия выявленные в системе, которую ИИ распознает как сходную и достигая соответствующих шаблонов поведения на своих эффекторах).

  • 1
?

Log in