- 12.7. Модели представления знаний
- 12.7.1. Логическая модель представления знаний
- 12.7.2. Сетевая модель представления знаний
- 12.7.2. Сетевая модель представления знаний
- 12.7.3. Фреймовая модель представления знаний
- 7. Сетевые модели представления знаний.
- 8. Представление знаний в виде иерархической структуры фреймов.
- 9.Продукционное правило как форма представления знаний.
12.7. Модели представления знаний
Любая предметная область характеризуется своим набором поняли и связей между ними, своими законами, связывающими между собой объекты данной предметной области, своими процессами, событиями. И конечно, каждая предметная область имеет свои, специфические методы решения задач. Знания о предметной области и способах решения в ней задач весьма разнообразны. Возможны различные классификации этих знаний. Наиболее часто знания подразделяются на декларативные и процедурные.
Процедурные знания описывают последовательности дейст11ий, которые могут использоваться при решении задач. Это, например, программы для ЭВМ, словесные записи алгоритмов, инструкция при сборке некоторого изделия. Декларативные знания – это знания, не являющиеся процедурными, например статьи в толковых словарях и энциклопедиях, формулировки законов в физике, химии и других науках и т.п. В отличие от процедурных знаний, отвечающих на вопрос: , декларативные знания отвечают скорее, на вопросы: или , и т.д..
Интеллектуальные системы — это сложные программно-аппаратные комплексы, обязательно включающие в свой состав
ЭВМ. Чтобы ввести знания о предметной области в ЭВМ, необходимо представить их в такой форме, которая была бы понятна машине. Иными словами, знания надо написать на языке, понятном ЭВМ, как понятны ей записи на языках программирования.
Для это существуют специальные языки представления знаний. Их можно разделить на типы по тем формальным моделям представления знаний, которые лежат в их основе. Таких моделей четыре: логическая, сетевая, фреймовая и продукционная.
12.7.1. Логическая модель представления знаний
Логическая модель представляет собой формальную систему некоторое логическое исчисление. Все знания о предметной области описываются в виде формул этого исчисления или правил вывода.
Языки представлений знаний логического типа широко использовались на ранних стадиях развития интеллектуальных систем, но были вытеснены (или во всяком случае сильно потеснены) языками других типов.
12.7.2. Сетевая модель представления знаний
Наиболее наглядными являются языки, опирающиеся на сетевую модель представления знаний. В основе такой модели лежит идея о том, что любые знания можно представить в виде совокупности объектов и связей между ними.
Известно, что любой текст, описывающий конкретные ситуации в реальном мире, всегда можно представить в виде совокупности взаисвязанных понятий. Причем число базовых отношений не может быть бесконечным; все остальные отношения выражаются через базовые в виде их комбинаций. Эта гипотеза служит основой утверждения о том, что семантические сети являются универсальным средством для представления знаний в интеллектуальных системах.
Семантические сети являются весьма мощным средством представления знаний. Однако для них характерны неоднозначность представлений знаний и неоднородность связей. И при автоматизации процесса использования и представления знаний такая неоднозначность и неоднородность заметно усложняют процессы, протекающие в интеллектуальных системах. Поэтому вполне естественное желание как-то унифицировать форму представления знаний, сделать ее максимально однородной. Одним из способов решения этой задач в искусственном интеллекте послужил переход к специальному представлению вершин в сети и унификация связей между вершинами (фреймами).
12.7.2. Сетевая модель представления знаний
Более наглядными являются языки, опирающиеся на сетевую модель представления знаний. В основе такой модели лежит идея о том, что любые знания можно представить в виде совокупности объектов (понятий) и связей (отношений) между ними. Рассмотрим, например, текст, содержащий некоторые декларативные знания: «Слева от станка расположен приемный бункер. Расстояние до него равно двум метрам. Справа от станка — бункер готовой продукции. Он находится рядом со станком. Робот перемещается параллельно станку и бункерам на расстоянии 1 метр».
На рис. 12.4. показано сетевое представление совокупности знаний (семантическая сеть), зафиксированных в этом объекте. Понятия и объекты, встречающиеся в тексте, представлены в виде сети, а отношения — в виде дуг, связывающих соответствующие вершины.
Известно, что любой текст, описывающий конкретные ситуации в реальном мире, всегда можно представить в виде совокупности взаимосвязанных понятий. Причем число базовых отношений не может быть бесконечным (оно заведомо меньше 300); все остальные отно-
Р и с 124 Пример сетевого представления совокупности знаний
шения выражаются через базовые в виде их комбинаций. Эта гипотеза служит основой утверждения о том, что семантические сети являются универсальным средством для представления знаний в интел-;
Семантические сети являются весьма мощным средством представления знаний. Однако для них характерны неоднозначность-представлений знаний и неоднородность связей. И при автоматизации процесса использования и представления знаний такая неоднозначность и неоднородность заметно усложняют процессы, протекающие в интеллектуальных системах. Поэтому вполне естественно желание как-то унифицировать форму представления знаний, сделать ее максимально однородной. Одним из способов решения этой задачи в искусственном интеллекте послужил переход к специальному представлению вершин в сети и унификация связей между вершинами (фреймами).
12.7.3. Фреймовая модель представления знаний
Фреймы используются в системах искусственного интеллекта (например, в экспертных системах) как одна из распространенных форм представления знаний.
Фрейм — это минимально возможное описание сущности какого-либо явления, события, ситуации, процесса или объекта. (Минимально возможное означает, что при дальнейшем упрощении описания теряется его полнота, оно перестает определять ту единицу знаний, для которой оно предназначено.)
Фрейм имеет почти однородную структуру и состоит из стандартных единиц, называемых слотами. Каждая такая единица — слот — содержит название и свое значение. Изображается фрейм в виде цепочки:
В качестве примера рассмотрим фрейм для понятия «взятие»:
В этом фрейме указаны имена слотов (субъект, объект и т.д.), но вместо их значений стоят переменные (XI, Х2 и т.д.). Такой фрейм называется фреймом-прототипом, или протофреймом.
Протофреймы хранят знания о самом понятии. Например, понятие «взять» связано с наличием слотов с указанными именами. Взятие осуществляет XI в месте ХЗ во время Х4, если выполнено условие Х5. Берет XI нечто, обозначенное как Х2. Подставляя вместо всех переменных конкретные значения, получим конкретный факт-описание:
(Место, Приемный бункер), (Время, Х4);
(Условие, В бункере есть деталь, а у робота ее нет)
В искусственном интеллекте фреймы, в которых обозначены все основные слоты (они каким-либо образом помечаются в описании фрейма), называются фреймами-экземплярами, или экзофреймами. В нашем примере, наверное, основными для фрейма «взятие» можно считать слоты с именами «субъект» и «объект». Поскольку в состав фрейма могут входить слоты с именами действий, фреймы годятся для представления как декларативных, так и процедурных знаний.
Чтобы представить семантическую сеть в виде совокупности фреймов, надо уметь представлять отношения между вершинами сети. Для этого также используются слоты фреймов. Эти слоты могут иметь имена вида «Связь Y» , где Y — имя того отношения (его тип), которое устанавливает данный фрейм-вершина с другим фреймом-вершиной.
В качестве значения слота может выступать новый фрейм, что позволяет на множестве фреймов осуществлять иерархическую классификацию. Это очень удобное свойство фреймов, так как человеческие знания, как правило, упорядочены по общности.
7. Сетевые модели представления знаний.
Наиболее полно (в явном виде) образуют семантику предметной области. С этой формой представления связаны понятие:
Опр.: Семантическая сеть – структура, отображающая совокупность объектов предметной области и отношений между ними (при этом объектам соответствуют узлы сети, а отношениям – дуги между ними). Объектами могут быть: — обобщенные понятия;
— свойства указанных объектов.
Совокупность объектов, включаемых в сеть определяется:
— содержанием предметной области;
— кругом рассматриваемых задач.
Опр.: Однородные сети – сети с одинаковыми отношениями между вершинами.
Опр.: Неоднородные сети – сети, которые могут содержать дуги различных типов, имеющие различный смысл.
Опр.: Сеть иерархического типа – сети, вершины которых могут иметь свою внутреннюю сетевую структуру.
Наиболее распространенные типы отношений:
8. Представление знаний в виде иерархической структуры фреймов.
Опр: Фрейм (М.Минский) – иерархическая структура для описания стереотипной ситуации, состоящей из характеристик этой ситуации (слотов) и значений этих характеристик (заполнители слотов).
- Совокупность фреймов, моделирующая определенную предметную область, имеет иерархическую структуру.
- Каждый фрейм соответствует некоторому объекту предметной области.
- Слоты содержат данные, списывающие этот объект.
- На верхнем уровне иерархии находится фрейм, отражающий наиболее общую информацию, присущую фреймам низшего уровня.
- В качестве заполнителей слотов может указываться:
— одно значение (число, качество, свойство);
— фасет (перечень или диапазон возможных значений);
— правило, согласно которому определяется заполнитель слота;
— имя процедуры, реализующей алгоритм вычисления заполнителя слота.
- Значение характеристик фреймов может передаваться по умолчанию фреймам более низкой ступени иерархии, если те не содержат собственных значений данных характеристик.
- Различают статические и динамические системы фреймов: первые не меняются в процессе решения задачи, вторые – могут изменяться.
- Плюсы сетевых (в том числе фреймовых) моделей представления знаний:
— явное представление иерархических связей (видна семантика предметной области);
— представление значений слотов в единственном экземпляре;
— возможность вычисления значения любого слота (заполнителя) с помощью процедур или эвристик.
Минусы фреймов:
— сложности в реализации фреймов и во внесении изменений в базу знаний.
9.Продукционное правило как форма представления знаний.
Анализ действий экспертов, связанных с диагностикой состояний сложных объектов, систем показывает, что профессионал проводит экспертизу вполне целенаправленно, придерживаясь определенной стратегии. При этом он руководствуется множеством правил, эвристик (то, что вырабатывается опытным путем), которые могут быть представлены в форме продукционного правила (ПП):
< ПОСЫЛКА >– антецедент (первая часть правила);
< ЗАКЛЮЧЕНИЕ >– консеквент (вторая часть правила).
Опр: Антецедент – состоит элементарных предложений (высказываний), соединенных логическими связками «И» и выражающих условия срабатывания правила.
Опр: Консеквент – включает одно или несколько предложений, описывающих выдаваемое правилом решение или ссылку на некоторое действие.
С коэффициентами уверенности могут быть заданы так же конкретные факты (в посылке). При организации базы знаний в виде набора ПП, антецеденты и консеквенты этих ПП могут быть представлены совокупностью пар или троек вида:
Преимущества представления знаний в виде ПП
- Модульность – каждое ПП не зависит от других, чтобы изменить базу знаний не надо «резать по живому» (похоже на реляционную БД);
- Единообразие структуры СОЗ – возможность построения и использования оболочек, настраиваемых через формализм базы знаний на конкретную предметную область;
- Естественность – имитация рассуждений эксперта;
- Гибкость иерархии понятий с точки зрения внесения изменений.
Недостатки представления знаний в виде ПП
- Громоздкость процесса вывода, связанная с проверкой применимости правил;
- Сложность управления процессом вывода;
- Отсутствие наглядности представления иерархии понятий.
Сопоставив ПП с другими формами представления знаний (семантические сети, фреймы) с точки зрения рассмотренных плюсов и минусов, можно сделать выводы:
- Рассмотренные преимущества ПП неоспоримы, хотя создавать и настраивать на конкретные предметные области можно и оболочки СС и фреймов, но это оказывается сложнее с точки зрения программной реализации, а главное, затрудняет процесс формализации конкретных знаний на инфологическом уровне. Так же усложняет процесс наполнения базы знаний конкретными знаниями.
- В ПП для представления знаний на инфологическом уровне удобно используется дерево решений, которое, к тому же, компенсирует недостаток ПП, связанный с отсутствием наглядности представления иерархии понятий.
- Что касается громоздкости процесса вывода на ПП и сложности управления им, то эти проблемы так же решаются, например, путем учета статистики срабатывания правил, организации распределенной структуры базы правил, использования других доступных приемов.
- К сожалению, труднее компенсировать отсутствие у ПП явного компактного представления связей, иерархии понятий и наследования по умолчанию значений слотов путем ссылок на прототипы, характерных для сетевых моделей (СС и фреймов).
- В пользу ПП говорит то, что эта ФПЗ хорошо согласуется с представлением задач в пространстве состояний, характерном для целевого назначения многих ИС.