Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5, 15, 25.doc
Скачиваний:
6
Добавлен:
23.09.2019
Размер:
247.81 Кб
Скачать

Простая база знаний

Теперь, после определения семантики пропозициональной логики, мы можем

сформировать базу знаний для мира вампуса. Для упрощения будем рассматривать

только ямы; случай, в котором рассматривается также сам вампус, оставляем

читателю в качестве упражнения. Мы предоставим агенту достаточный объем знаний,

чтобы он мог сам формировать те логические выводы, которые были описаны

неформально в разделе 7.3.

Вначале необходимо определить словарь пропозициональных символов. Для

каждого i, у.

• допустим, что высказывание Pi j является истинным, если в квадрате [i, j]

имеется яма;

• допустим, что Bi j является истинным, если в квадрате [i,j] чувствуется

ветерок.

База знаний включает перечисленные ниже высказывания, каждому из которых

для удобства присвоено отдельное обозначение.

• В квадрате [1,1] отсутствует яма:

R1: ¬P1,1

• В квадрате чувствуется ветерок тогда и только тогда, когда в соседнем квадрате

имеется яма. Такое высказывание должно быть сформулировано для каждого

квадрата; на данный момент включены в рассмотрение только

непосредственно интересующие нас квадраты:

R2: B1,1 <=> (P1,2 v P2,1)

R3: B2,1 <=> (P1,1 v P2,2 v P3,1)

• Приведенные выше высказывания являются истинными во всех экземплярах

мира вампуса. Теперь включим данные о восприятии ветерка для первых двух

квадратов, которые были посещены агентом в том конкретном мире, где он

находится

R4: ¬B 1,1

R5: B 2,1

Таким образом, база знаний состоит из высказываний R1— R5. Ее можно также

рассматривать как единственное высказывание (как конъюнкцию R1 ^ R2 ^ R3 ^

R4^R5), поскольку она подтверждает, что все отдельно взятые высказывания в ней являются истинными.

5. Проблемная среда

В приведенном выше исследовании рациональности простого агента-пылесоса нам

пришлось определить показатели производительности, среду, а также исполнительные

механизмы и датчики агента. Сгруппируем описание всех этих факторов под

заголовком проблемная среда. PEAS (Performance, Environment, Actuators,

Sensors— производительность, среда, исполнительные механизмы, датчики).

Примеры проблемных сред для различных типов агентов

• ^ Полностью наблюдаемая или частично наблюдаемая

Если датчики агента предоставляют ему доступ к полной информации о

состоянии среды в каждый момент времени, то такая проблемная среда

называется полностью наблюдаемойСреда может оказаться частично наблюдаемой из-за

создающих шум и неточных датчиков или из-за того, что отдельные

характеристики ее состояния просто отсутствуют в информации, полученной от

датчиков

• ^Эк Детерминированная или ^ стохастическая

Если следующее состояние среды полностью определяется текущим

состоянием и действием, выполненным агентом, то такая среда называется

детерминированной; в противном случае она является стохастической.

• ^ Эпизодическая или ^ последовательная

В эпизодических вариантах среды выбор действия в каждом эпизоде зависит только от самого эпизода.Эпизодическими являются многие задачи классификации. Например, агент, который должен распознавать дефектные детали на сборочной линии, формирует

каждое решение применительно к текущей детали, независимо от предыдущих

решений; более того, от текущего решения не зависит то, будет ли определена как

дефектная следующая деталь. С другой стороны, в последовательных вариантах

среды текущее решение может повлиять на все будущие решения.

Последовательными являются такие задачи, как игра в шахматы .

• ^ Статическая или ^ динамическая

Если среда может измениться в ходе того, как агент выбирает очередное

действие, то такая среда называется динамической для данного агента; в

противном случае она является статической..

• ^Эк Дискретная или ^ непрерывная

Различие между дискретными и непрерывными вариантами среды может

относиться к состоянию среды, способу учета времени, а также восприятиям и

действиям агента. Например, такая среда с дискретными состояниями, как

игра в шахматы, имеет конечное количество различимых состояний. Действия по вождению такси также являются непрерывными.

• ^ Одноагентная или ^ мультиагентная

Различие между одноагентными и мультиагентными вариантами среды на

первый взгляд может показаться достаточно простым.

Например, в шахматах соперничающая сущность в пытается максимизировать

свои показатели производительности, а это по правилам шахмат приводит к

минимизации показателей производительности агента А. Таким образом,

шахматы — это ^ конкурентная мультиагентная среда. А в среде вождения такси, с другой стороны, предотвращение столкновений максимизирует показатели производительности всех агентов, поэтому она может служить примером частично ^ кооперативной мультиагентной среды.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]