MGIMONICS.COM

MGI-3: Технология Печать E-mail

Третья в серии фундаментальных статей, посвящённых постановке проблемы проектирования MGI-классификатора. Рассматривается конкретная технологическая реализация ранее изложенных архитектурных принципов.

Пока мы описывали лишь основной принцип формирования классификаций на базе мнемонического «виртуального языка». Выше предполагалось, что все базовые формы могут произвольно комбинироваться, создавая расширенные мнемоники иного значения с требуемой степенью конкретизации. Однако это не так. Произвольное комбинирование базовых мнемоник способно потенциально породить значительное число неосмысленных комбинаций, либо комбинаций, значения которых предельно близки друг другу. Потенциально это способно привести нас к проблеме неконтролируемого роста словаря расширенных мнемоник, что крайне нежелательно. С другой стороны мы хотели бы добиться предельной гибкости в использовании подхода. Как возможно разрешить это противоречие? Должны ли мы заранее руководствоваться какой-либо парадигмой строения схем наследования, заставляя пользователей системы следовать ей, либо следует искать иной путь?

Ответ заключается в том, что мы не знаем, какая парадигма строения классификационной схемы удобнее для пользователя. Но одновременно мы способны и не навязывать пользователю (сообществу) никакой парадигмы, которая может оказаться ошибочной сейчас или в перспективе. Для этого мы должны сделать классификационную схему адаптивной, самообучающейся, контролируемой сообществом.

Схема рекомбинационного наследования

Базисом для реализации такого подхода является представление схем наследования в классификации не в виде дерева или таксономии, разрешающей множественное наследование, а в виде циклического неориентированного графа, виртуальной нейросети, где мы описываем не собственно возможность наследования одним понятием группы других, а оперируем вероятностью такого наследования, весом такой парадигмы его в академической среде или в другом произвольном сообществе пользователей системы.

Фрагмент базового графа: одно из понятий и его связи

При использовании нейросети в качестве базиса для классификационной схемы начальная парадигма классификации является лишь одной из возможных и ни в коем случае не является окончательной. При использовании такой системы некоторым сообществом веса связей между узлами сети непрерывно изменяются в соответствии с реакцией пользователей системы. Обучение системы может проходить как явным образом, с предоставлением возможности дать параллельную конкурентную классификацию ресурса, более релевантную с его точки зрения, так и неявным.

Иерархическая кластерная нейросеть

Явный подход к обучению системы требует отчетливой активности пользователей, их высокой заинтересованности в совершенствовании классификатора. Несомненно, такая возможность должна быть предусмотрена в системе управления знаниями, но невозможно рассчитывать на то, что фокус интереса сообщества равномерно будет распределен по всему спектру классифицируемых ресурсов. Логичнее предположить существование некоторых «активных» зон интереса, где активность сообщества будет повышенной наряду с существованием «холодных» зон, где не только активность пользователей будет низка, но и количество ресурсов, посвященных тематике будет небольшим.

Эволюция отношений в генетической нейросети

Исходя из стремления к равномерному и релевантному развитию системы, мы полагаем наилучшим методом обучения неявный сбор информации. Нейросеть, классификационный граф позволяют нам описывать не только наследуемые смыслы, но и параллельные. Кроме веса связи можно оперировать еще и типом связи. Исходя из этой возможности, логично предположить, что пользователи системы в процессе ее использования будут перемещаться по графу по некоторым приоритетным направлениям, причем наиболее часто используемые направления по ассоциативным связям будут с некоторой вероятностью свидетельствовать об ошибочности выбора классификационной парадигмы в близости этого узла. Анализируя пути перемещения, накоплением статистики можно сделать ряд выводов о потребностях изменения весов и типов связей внутри графа, причем этот процесс легко автоматизируется.

Джойстик «с обратной связью»

Совместное применение явных и неявных способов мутации базового графа (нейросети) позволяет дополнительно накапливать не только данные о желаемом направлении мутации графа. Используя возможности по хранению состояний графа и сравнивая их между собой во временной перспективе, можно получать информацию о трендах в сообществе, которая также может использоваться для разнообразных исследований, в том числе и для обеспечения положительной или отрицательной обратной связи в системе обучения нейросети. Накопление конкурентных классификаций, данных пользователями (прямые методы указания на ошибку) позволяет оперировать дополнительно сравнительными аналитическими данными по участку графа.

Хромосомы ребенка с синдромом Дауна

Из всех требований, выдвинутых в начале разработки мы пока не пришли к удовлетворению нескольких последних, в числе которых требование к модели доверия и обеспечение обратной совместимости.

К сожалению, адекватные методы построения сети доверия возможны только с обязательным привлечением каких-либо административных мер. Сама по себе идея формирования цепочек доверия по принципу, сходному с организацией сети доверия в системах типа PGP является адекватной, но требует обязательного регулярного подтверждения доверия каждым из членов сети. Попытка полностью автоматизировать строение сети доверия на основе рейтингов и других методов, используемых в социальных сетях, блогах и т. п. с некоторой (немалой) вероятностью может привести к взаимному необоснованному повышению рейтинга какой-либо группой пользователей. Поскольку такое необоснованное раздувание рейтингов и цепочек доверия неизбежно понизит релевантность системы, мы предполагаем на текущий момент использование комбинированной системы с непрерывным мониторингом уровней доверия и способов их получения. Очевидным остается лишь то, что вес, который оказывается пользователем на мутацию графа должен находиться в соответствии со степенью доверия ему сообществом. Методы же определения доверия в полностью автоматических схемах нуждаются в дополнительной проработке.

Модель сети доверия

Решение вопроса обратной совместимости предполагается с помощью еще одной параллельной разработки, имеющей отношение к строению системы управления знаниями. Посмотрим еще раз на типичную классифицирующую строку в предлагаемой мнемонической схеме:

phd.politscience.trend_democr.tw

Выше мы говорили о том, что выбор точки в качестве разделителя не случаен. Классификационная строка, разделенная точками сама по себе может являться частью доменного имени, которое строится по тем же принципам. Для актуализации этого доменного имени нам достаточно внести такую запись в записи DNS-сервера и добавить имя хоста справа. Строка, описывающая группу ресурсов после этого приобретает вид полноценной URL:

http://phd.politscience.trend_democr.tw.classification.com

Заметим, что такая строка, несмотря не довольно большую длину легко запоминается любым человеком, знакомым с принципами формирования мнемонической классификации.

На данном этапе мы подходим к осознанию идеи возможности создания «виртуальных доменов» для каждой из предметных областей, типов ресурсов и т. п. Иными словами, мнемоническое представление обретает некоторый дополнительный смысл, поскольку каждая группа ресурсов хранится строго в своем отдельном домене, а конкретизация оперирует виртуальными локациями внутри доменов или на их пересечениях.

Фрагмент базового графа: виртуальный домен области знания

Одним из преимуществ такого представления является «чистота» URL после доменного имени, что позволяет легко дополнять ее в области за слэшем дополнительными уточняющими поисковыми запросами по ключевым словам, идентификаторами сессии, вызовом серверных процедур, установкой переменных и т. п., сохраняя при этом приемлемую длину запроса и его читаемость.

Вторым преимуществом отметим то, что такой адрес сам по себе является сужающим поисковым запросом, что позволяется легко организовывать «ожидание» поступление ресурсов по тематике, комментариев и т. п. просто используя этот адрес в качестве закладки.

Эволюция нейросети

И наконец такой подход позволяет решать проблему совместимости при помощи использования функциональных мнемоник в области доменного имени. Очевидно, что для технической реализации актуализации виртуальных доменов на лету нам в любом случае необходим некоторый парсер доменного имени, который даже в случае отсутствия имени в базе DNS-сервера будет каким-то образом реагировать на него. Несложно сделать такой парсер программируемым.

Строка вида:

Myobject.myfunc ()

…является типичным вызовом метода объекта в точечной нотации объектно-ориентированных языков программирования. Спроецировав ее на нотацию строения доменного имени, мы способны получить некоторое обращение к метаобъекту сервера, предписывающее ему выполнить какую-то операцию из базовой библиотеки. Несомненно, потребуется разработка какого-то формата представления аргументов функции, но эта задача является вполне решаемой (см. например US pat. 6,804,723) и освоена в современных методиках программирования серверных приложений и веб-сервисов.

Таким образом, мы вполне можем представить выборку по любой совместимой классификационной схеме в рамках того же виртуального домена:

http://isbn_145658.classification.com

В данном примере парсер разбирает знаковую строку, начинающуюся с ключевого слова ISBN на метод обработки и параметр. В итоге на выходе производится выборка документа с определенным кодом по каталогу ISBN.

К сожалению, объем статьи не позволяет подробно углубиться в способы технической реализации проекта. В дальнейших публикациях мы надеемся полнее ознакомить читателей с разрабатываемой технологией и аспектами ее применения.

Естественная система управления знаниями (фрагмент)

 
« Пред.   След. »

Rapidshare autocad официальный учебный курс. Rapidshare официальный учебный курс autocad .;Не последнее установить аську(icq) тут isq бесплатно.;сервис установка и монтаж газовых колонок Neva Lux в Москве и МО;кабель АПВПГ;электронные книги рейтинг e-reader