Простая база знаний
Теперь, после определения семантики пропозициональной логики, мы можем
сформировать базу знаний для мира вампуса. Для упрощения будем рассматривать
только ямы; случай, в котором рассматривается также сам вампус, оставляем
читателю в качестве упражнения. Мы предоставим агенту достаточный объем знаний,
чтобы он мог сам формировать те логические выводы, которые были описаны
неформально в разделе 7.3.
Вначале необходимо определить словарь пропозициональных символов. Для
каждого i, у.
• допустим, что высказывание Pi j является истинным, если в квадрате [i, j]
имеется яма;
• допустим, что Bi j является истинным, если в квадрате [i,j] чувствуется
ветерок.
База знаний включает перечисленные ниже высказывания, каждому из которых
для удобства присвоено отдельное обозначение.
• В квадрате [1,1] отсутствует яма:
R1: ¬P1,1
• В квадрате чувствуется ветерок тогда и только тогда, когда в соседнем квадрате
имеется яма. Такое высказывание должно быть сформулировано для каждого
квадрата; на данный момент включены в рассмотрение только
непосредственно интересующие нас квадраты:
R2: B1,1 <=> (P1,2 v P2,1)
R3: B2,1 <=> (P1,1 v P2,2 v P3,1)
• Приведенные выше высказывания являются истинными во всех экземплярах
мира вампуса. Теперь включим данные о восприятии ветерка для первых двух
квадратов, которые были посещены агентом в том конкретном мире, где он
находится
R4: ¬B 1,1
R5: B 2,1
Таким образом, база знаний состоит из высказываний R1— R5. Ее можно также
рассматривать как единственное высказывание (как конъюнкцию R1 ^ R2 ^ R3 ^
R4^R5), поскольку она подтверждает, что все отдельно взятые высказывания в ней являются истинными.
5. Проблемная среда
В приведенном выше исследовании рациональности простого агента-пылесоса нам
пришлось определить показатели производительности, среду, а также исполнительные
механизмы и датчики агента. Сгруппируем описание всех этих факторов под
заголовком проблемная среда. PEAS (Performance, Environment, Actuators,
Sensors— производительность, среда, исполнительные механизмы, датчики).
Примеры проблемных сред для различных типов агентов
• ^ Полностью наблюдаемая или частично наблюдаемая
Если датчики агента предоставляют ему доступ к полной информации о
состоянии среды в каждый момент времени, то такая проблемная среда
называется полностью наблюдаемойСреда может оказаться частично наблюдаемой из-за
создающих шум и неточных датчиков или из-за того, что отдельные
характеристики ее состояния просто отсутствуют в информации, полученной от
датчиков
• ^Эк Детерминированная или ^ стохастическая
Если следующее состояние среды полностью определяется текущим
состоянием и действием, выполненным агентом, то такая среда называется
детерминированной; в противном случае она является стохастической.
• ^ Эпизодическая или ^ последовательная
В эпизодических вариантах среды выбор действия в каждом эпизоде зависит только от самого эпизода.Эпизодическими являются многие задачи классификации. Например, агент, который должен распознавать дефектные детали на сборочной линии, формирует
каждое решение применительно к текущей детали, независимо от предыдущих
решений; более того, от текущего решения не зависит то, будет ли определена как
дефектная следующая деталь. С другой стороны, в последовательных вариантах
среды текущее решение может повлиять на все будущие решения.
Последовательными являются такие задачи, как игра в шахматы .
• ^ Статическая или ^ динамическая
Если среда может измениться в ходе того, как агент выбирает очередное
действие, то такая среда называется динамической для данного агента; в
противном случае она является статической..
• ^Эк Дискретная или ^ непрерывная
Различие между дискретными и непрерывными вариантами среды может
относиться к состоянию среды, способу учета времени, а также восприятиям и
действиям агента. Например, такая среда с дискретными состояниями, как
игра в шахматы, имеет конечное количество различимых состояний. Действия по вождению такси также являются непрерывными.
• ^ Одноагентная или ^ мультиагентная
Различие между одноагентными и мультиагентными вариантами среды на
первый взгляд может показаться достаточно простым.
Например, в шахматах соперничающая сущность в пытается максимизировать
свои показатели производительности, а это по правилам шахмат приводит к
минимизации показателей производительности агента А. Таким образом,
шахматы — это ^ конкурентная мультиагентная среда. А в среде вождения такси, с другой стороны, предотвращение столкновений максимизирует показатели производительности всех агентов, поэтому она может служить примером частично ^ кооперативной мультиагентной среды.