Ситуационное управление и робототехника - shikardos.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Ситуационное управление и робототехника - страница №1/1



СИТУАЦИОННОЕ УПРАВЛЕНИЕ И РОБОТОТЕХНИКА
Ющенко А.С.

Статья посвящена обсуждению возможностей и перспектив теории ситуационного управления роботами, основанной на разработанной Д.А.Поспеловым и его последователями теории ситуационного управления сложными объектами. Обращается внимание читателя как на аналогии, так и на отличия, связанные с применением принципов ситуационного управления в робототехнике. Приводятся некоторые результаты, полученные в этом направлении, а также ставятся задачи дальнейших исследований.
Введение.

Термин «Робототехника» используется сегодня настолько широко, что нужно вначале определить, что под ним понимается в данной статье. Мы не будем рассматривать вопросы промышленной робототехники, где роботы - манипуляторы и мобильные роботы - робокары встроены в хорошо организованную технологическую среду. Для формального описания таких систем и для управления ими успешно используются методы теории конечных автоматов, сетей Петри и другие представления дискретной математики. Значительно сложнее обстоит дело с роботами, работающими в экстремальных условиях, в условиях неизвестных заранее. Например, при спасательных операциях, при обезвреживании взрывоопасных предметов, при спасательных работах и во время дистанционно выполняемых хирургических операций. Здесь все движения робота задаются непосредственно человеком-оператором. Работа оператора дистанционно-управляемой робототехнической системы требует высокой квалификации. Такая работа, как правило, выполняется в условиях дефицита информации и связана с существенным риском из за возможных ошибок человека. Задача современной робототехники состоит в том, чтобы сделать возможной автономную работу дистанционно управляемых робототехнических систем в неизвестной обстановке. Робот, оснащенный разветвленной сенсорной системой, должен самостоятельно действовать в заранее неопределенных условиях, оценивать окружающую обстановку и принимать решения. решать самостоятельно решать задачи, поставленные человеком, прибегая при необходимости к диалогу с оператором на проблемно-ориентированном языке. Чтобы подчеркнуть специфику такой робототехнической системы, назовем ее интеллектуальной робототехнической системой (ИРТС), не углубляясь в смысл термина «интеллектуальный», что увело бы нас далеко в сторону от обсуждаемых вопросов.

С созданием ИРТС человечество получило технический объект, который в виду своей сложности не может быть достаточно хорошо описан в математической форме, или же это описание настолько сложно, что его практически невозможно использовать. С учетом возможности приобретения собственного, индивидуального опыта, ИРТС – уникальный объект. Это приводит к мысли о применении ситуационного управления, которое было предложено Д.А.Поспеловым именно для управления такими объектами [1]. Вместе с тем, здесь имеется и серьезное отличие от постановки задачи ситуационного управления. Сам термин «управление», подразумевающий наличие как объекта, так и субъекта управления, в данном случае справедлив не в полной мере. Робот, способный к автономной работе, самостоятельно принимающий управленческие решения, по крайней мере, на тактическом уровне, объединяет в себе и объект и субъект управления. Управление же со стороны человека переходит с уровня управления отдельными движениями на более высокий уровень – на уровень постановки задач и указания целей. Робот теперь выступает как полноправный партнер человека, осуществляющий целесообразную деятельность. На наш взгляд, термин «управляемая деятельность» в данном случае лучше отражает существо рассматриваемого процесса, чем термин «управление» [2].

В большинстве случаев, цели, которые должны быть достигнуты с помощью ИРТС, трудно формализуемы, но допускают достаточно простую формулировку на естественном языке (ЕЯ). При этом ИРТС – многофункциональная система, допускающая постановки очень широкого круга задач. Можно, как и при ситуационном управлении, говорить об отсутствии определенного критерия оптимальности. Поскольку цель деятельности робота задается человеком, то и качество оценки ее результатов субъективно. Оно может быть оценено только с использованием лингвистических переменных и естественных пространственно-временных отношений, свойственных мировосприятию человека.

Что же касается собственно понятия ситуации, которое при ситуационном управлении представляет собой текущее состояние объекта управления, в робототехнике ситуация представляет собой текущее состояние внешнего мира, в котором функционирует ИРТС, включая и сам робот.

Обратим внимание на важную мысль Д.А.Поспелова о том, что нельзя построить теорию для таких систем, для которых нельзя определить независимую от семантики модель. Тем не менее, робототехника как техническая теория безусловно существует (назовем, хотя бы серию монографий под ред. академика РАН Е.П.Попова «Научные основы робототехники»). Однако, большая часть работ, объединенных словом «робототехника» посвящена устройству отдельных подсистем, в том числе исполнительной части робота – приводам манипулятора, платформы, динамике манипулятора, системам управления роботом и т.д. Для этих подсистем в полной мере применимы классические методы механики и теории управления. Эти методы, однако, не позволяют описать ИРТС в целом, функционирующую самостоятельно в плохо организованной среде.

Наука о подобных системах, на наш взгляд, имеет право на существование, но она отличается от технических наук, дающих методику расчета системы. По своей структуре она ближе к наукам о человеке (физиологии, анатомии, психологии). Мы можем изучать поведение объекта, выявлять его особенности и явные отклонения от нормы в его функционировании. Можно обеспечить адаптацию робота к условиям применения, или обучать его действовать либо по определенным правилам. В отличие от работы с биологическими объектами, мы можем непосредственно закладывать в память робота требуемые правила и стереотипы поведения и даже можем менять его конструктивные и аппаратные элементы, если это необходимо для лучшего достижения цели. Тем не менее, это все же не управление, а организация целенаправленной деятельности роботов.

Определим состав и структуру ИРТС как инструмента предметной деятельности человека во внешнем мире. Заметим, что особенность этого «инструмента» состоит в том, что он способен функционировать самостоятельно. Поэтому что для ИРТС вполне приемлем термин «деятельность». Деятельность ИРТС обладает всеми основными признаками деятельности человека, тем не менее, ее следует рассматривать совместно c деятельностью человека-оператора, поскольку в процессе работы функции «биологической части» ИРТС могут переходить к его «технической» части и наоборот, причем обе составляющие находятся в постоянном взаимодействии и дополняют друг друга в процессе работы. По существу, следует рассматривать систему «человек-робот», способную взаимодействовать с человеком на всех уровнях, включая уровень постановки целей. Для краткости назовем такую систему эргаматом. Функциональная схема эргамата показана на рис.1. Конечная (стратегическая) цель задается оператором. Частные (тактические) цели, необходимые для достижения конечной цели, определяются самой ИРТС. Робот выступает здесь как технический «ассистент-оператор», взаимодействующий с «человеком-оператором». В этом смысле эргамат можно рассматривать как систему кооперативной деятельности человека-оператора и ассистента-оператора с приоритетом первого.

Интерфейс эргамата включает средства представления информации человеку-оператору и средства управления. Средства представления информации - это совокупность информационных средств, включающая элементы различных сенсорных модальностей – визуальный образ, построенный с использованием телевидения и компьютерной графики, механорецепторную или тактильную обратную связь и, возможно, речевое сопровождение. Эта совокупность информационных устройств должна обеспечить построение в сознании человека образа текущей ситуации.

Устройства управления в робототехнике также многофункциональны; здесь используются не только клавиатура управляющего компьютера и механические органы управления (джойстики), но также средства голосовой связи, сигналы управления, получаемые при движении головы, глаз и т.п.

Функциональная схема эргамата в общем случае имеет несколько уровней, соответствующих различным видам деятельности человека-оператора. Верхний уровень (А) соответствует целеполаганию, следующий уровень (Б) - планированию операций. Уровень (В) соответствует заданию отдельных действий (командное управление). Нижние уровни управления (Г) и (Д) соответствуют управлению движениями. Каждый уровень представляет собой замкнутый цикл, имеющий собственные обратные связи, реализуемые как с использованием технических средств, так и рецепторов человека.

При всей своей универсальности, роботы создаются человеком для решения определенного круга задач. Отсюда следует основной принцип создания ИРТС – обеспечение согласования на каждом из перечисленных уровней. возможностей робота и человека, включенного в процесс деятельности ИРТС. Это согласование относится, прежде всего, к внутреннему (для ИРТС) описанию внешнего мира близкому к человеческому (естественному) восприятию мира. Далее, это описание целей, поставленных оператором, возможных действий и способов поведения ИРТС, направленных на достижение поставленных целей. При выполнении сложных операций ИРТС должна оказать поддержку оператору в их планировании. Наконец, для оперативного взаимодействия ИРТС и человека-оператора должен быть сформирован проблемно-ориентированный язык ИРТС и речевого интерфейс, позволяющий интерпретировать ЕЯ высказывания оператора и организовать диалог между человеком и ИРТС.

Отметим, что перечисленные задачи организации целенаправленной деятельности роботов очень близки к тем задачам, которые Д.А.Поспелов рассмотрел применительно к ситуационному управлению сложными объектами. Обобщая применительно к ИРТС идею Д.А.Поспелова о естественных пространственно-временных отношениях и построенной на их основе естественной (для человека) модели мира, можно говорить также о естественных способах управления, о естественных способах планирования и принятия решений, наконец, о естественном языке диалога робота человека. Впервые в истории техники искусственный объект способен в полной мере реализовать сложную предметную деятельность человека во внешнем мире, становится его полноправным партнером и в ряде случаев может его заменить, становясь субъектом деятельности.
Описание внешнего мира

Принципиальным положением ситуационного управления является вывод Д.А.Поспелова о том, что уникальность объекта управления требует для его описания специальных языковых средств, отличных от формальных математических моделей. При этом большая часть информации может быть выражена средствами ЕЯ и переведена на формальный язык семиотической модели, специально разработанной для ситуационного управления. Таким образом, в основе представления внешнего мира в ИРТС лежит его представление в сознании человека. Одной из особенностей этого представления является его структурированность, т.е. представление мира в виде совокупности объектов, имеющих определенные имена, между которыми установлены отношения. Д.А.Поспелов указывает 11 таких отношений (включая пространственные, временные, количественные, каузальные и прочие) [3]. В ряде задач робототехники описание внешнего мира ЭМС на базе нечетких представлений включает в себя описание объектов рабочей сцены и пространственно-временных отношений между ними. Как известно, человек оценивает эти отношения с помощью психофизиологических шкал, обусловленных объективными свойствами соответствующих рецепторов. Поэтому наиболее адекватным аппаратом для описания пространственно-временных отношений является аппарат лингвистических переменных.

Следуя логике пространства, разработанной Д.А.Поспеловым и его последователями, введем лингвистическую переменную dj, j = 1,2,…,M - «дистанция между объектами а и б» со значениями j = 6- «очень очень далеко», j = 5- «очень далеко», j = 4- «далеко», j= 3- «недалеко - неблизко», j = 2 «близко», j = 1«очень близко», j = 0- «вплотную». Теперь можно получить и следующие производные отношения: (а1 dj а2) & (а1 di а3) & (j=i+1) , что соответствует утверждению: а2 дальше от а1, чем а3 от а1. Аналогично получим: (а1 dj а2) & (а1 di а3) & (j=i-1) - а2 ближе к а1, чем а3. Наконец, условие (а1 dj а2) & (а1 di а3) & (j > i+1) можно интерпретировать как а2 значительно дальше от а1, чем а3.

Аналогично введем лингвистическую переменную fi, i=1,2,…N - «направление от объекта а к объекту б» со значениями: f1 - впереди, f2- впереди слева, f3 - слева, f4 - сзади слева, f5 - сзади, f6- сзади справа, f7 - справа, f8 - впереди справа. Например, (a1f2 a2) – а2 впереди слева, (a1f8 a2) – а2 – впереди и справа.

Теперь мы можем определить взаимное пространственное положение двух объектов на плоскости, одним из которых может быть сам робот. Например, условие (a1 d4 a2)&(a1 f7 a2) = (a1 d4 f7 a2) означает, что а2 далеко, и справа от а1.

Следуя работам Д.А.Поспелова, можно определить и нечеткую логику пространственных отношений. Если известно расстояние между объектами а1,а2, а также а2,а3, то расстояние между объектами а1, а3 определяется соотношением: (а1 dj а2) & (а2 di а3) → (а1 dm а3), где dm = max (di ,dj ), если |i-j|>1 и dm = max (di ,dj )+1, если |i-j|=1.

В общем случае взаимное положение включает как дистанцию, так и ориентацию объектов. Пусть задано взаимное нечеткое положение на плоскости объектов а1, а2, а также а2, а3, т.е. для каждой пары объектов задано отношение положения и ориентации. Тогда для каждого взаимного отношения дистанции между а1, а2, а также между а2, а3 взаимное положение определяется таблицей отношений ориентации. Пример такого отношения для случая когда а2 дальше от а1, чем а3 от а2 приведен ниже в виде таблицы 1. Обозначено fi - нечеткое значение расстояния от а1 до а2, fk – нечеткое расстояние от а2 до а3, в таблице содержатся значения fm – нечеткие расстояния от а1 до а3. Например, (а1 dj, f1 а2) & (а2 di f3 а3) & (j=i+1) → (а1 dj f2 а3), т.е. если объект а2 дальше от а1, чем а3 от а2 и при этом а2 впереди а1, а а3 слева от а2, то а3 находится на «нечетком расстоянии» dj и впереди слева от а1 (см. рис.2).

Заметим, что единственным обоснованием таблицы 1 является ее соответствие психофизиологическим шкалам соответствующих пространственных отношений, воспринимаемых человеком. Д.А.Поспелов приводит гистограммы оценки расстояния между объектами группой операторов-экспертов. Такой же подход следует применять и при определении пространственной ориентации в общем случае.

Пусть теперь имеется «нечеткая карта» местности, содержащая ориентиры и взаимное нечеткое положение каждой пары объектов. Заметим, что это соответствует словесному описанию местности, когда определяется нечеткое взаимное положение известных заранее объектов. Роботу поставлена цель: выйти к месту расположения одного из этих объектов. Тогда, используя представленную логику пространства, робот уже из начального положения может определить требуемое направление движения к цели, или, во всяком случае, существенно сократить путь. Заметим, впрочем, что этого недостаточно для достижения цели, поскольку структурирование пространства с помощью лингвистических переменных является довольно грубым. Робот, используя такое описание, способен лишь приблизительно выйти в окрестность цели. Если отсутствует более «тонкий» уровень управления, он может совершать незатухающие колебания в окрестности цели [4].

Нетрудно по аналогии с рассмотренным ввести и пространственную модель рабочей сцены, добавляя к отношениям на плоскости отношения, относящиеся к третьему измерению, например, выше, на одном уровне, ниже, под, над. Используя логические произведения нечетких отношений по высоте и ранее введенных отношений дистанции и ориентации на плоскости, можно определить нечеткое взаимное положение объектов в трехмерном пространстве. Например, а1 далеко, впереди справа и немного выше а2. Таким образом, мы получаем систему нечетких отношений между объектами пространственной сцены, аналогичную сферической системе координат.

Отношения рассмотренного типа Д.А.Поспелов относит к экстенциональным. Для завершения пространственной модели сцены необходимо ввести интенциональные отношения между объектами. В [3] предлагается два унарных отношения– R00 -быть горизонтальным и R01 - быть вертикальным и 28 элементарных бинарных отношений. Например, для описания пространственной сцены могут быть использованы следующие бинарные отношения: R1 - соприкасаться; R2 - быть внутри; R3 - быть вне; R4 - быть в центре; R5 - быть на одной прямой; R6 - быть на одной плоскости; R7 - иметь ненулевую проекцию, R8 - стоять на поверхности.. Заметим, что отношения R1, R5 и R6 симметричны, а R2 и R3 транзитивны. Перечень отношений можно расширить в зависимости от конкретных задач.

Для введенных отношений пространственного положения можно установить производные отношения с помощью соответствующих правил. Например, отношение R8 : а2 стоит на а1, соприкасаясь по поверхности S образуется путем конъюнкции из отношений находиться выше, соприкасаться по плоскости и быть горизонтальным.

Используя введенные интенциональные и экстенциональные отношения, можно описывать достаточно сложную рабочую сцену. Заметим, что в описание сцены входит и «наблюдатель», в качестве которого может быть сам робот. Например, сложное отношение а1 стоит на плоскости S далеко справа можно записать как (a1 R8 S)&(a0 d5 f7 a1), где а0 - наблюдатель, относительно которого сформулированы отношения дистанции и ориентации.

Данные о внешнем мире в ИРТС поступают с информационных устройств робота (дальномеров, датчиков угла, скорости и т.п.) в виде сигналов, имеющих конкретные значения. Поэтому для того, чтобы воспользоваться процедурами нечеткой логики пространства, необходимо вначале сопоставить значениям измеренных физических величин нечеткие значения соответствующих лингвистических переменных, т.е. выполнить их фаззификацию. Полученная нечеткая пространственная модель мира может использоваться не только дл управления ИРТС, но и для организации диалога между роботом и оператором. Например, оператору со стороны робота могут быть сообщены сведения такого характера: «вдали, справа виден объект А, а прямо передо мной близко препятствие Б». В ряде случаев такие сведения имеют важное значение для оператора, например, в тех случаях, когда визуальное наблюдение затруднено.

Совокупность заданных объектов в пространстве рабочей сцены, отношений между ними и правил преобразования составляют формальный язык описания ситуации, близкий к естественному языку. Описание ситуации на этом языке при этом допускают формальное представление с использованием логики пространственно-временных отношений. Подчеркнем отличие понятия ситуации в рассматриваемой задаче от аналогичного понятия в методе ситуационного управления, когда в описание ситуации включается и действие. Здесь ситуация представляет собой описание внешнего мира, включая сам робот. Поскольку внешний мир непрерывно изменяется как за счет движения наблюдаемых объектов, так и за счет движения самого робота, то и описание ситуации изменяется во времени. Это обстоятельство требует учета в общем случае не только пространственных, но и временных отношений во внешнем мире, таких как быть одновременно, быть раньше, следовать за и т.п.

Так же, как и при ситуационном управлении, формальный язык представления ситуации должен быть преобразован в язык представления знаний (ЯПЗ). Несмотря на то, что работы по ситуационному управлению относятся к середине 80-х г.г., рассмотренное впервые в этих работах, использование вложенных фреймов в качестве ЯПЗ для описания ситуаций по прежнему актуально. Фрейм ситуации может быть представлен следующим образом: <имя наблюдателя> <положение наблюдателя> < имя объекта а1 относительно набюдателя> < имя объекта а2 и его положение >…< имя объекта аn и его положение>. В качестве наблюдателя выступает либо робот, либо наблюдатель, расположенный в другой системе координат и наблюдающий сцену, содержащую и сам робот (например, при наблюдении за перемещением робота по карте местности). Если объекты не являются малыми (условно говоря, точечными), то расстоянием до объекта считается минимальное расстояние от наблюдателя.

Следуя терминологии Д.А.Поспелова, введенный фрейм ситуации – это фрейм - прототип, который конкретизируется с помощью введенных пространственных отношений. Например, <R > <a0 d10 f20 R> < R d11 f11 а1 >< R а2 >…<R d1n f1n аn >.

Отметим, что описанная выше логика пространства позволяет переходить от абсолютной системы координат (точки зрения неподвижного наблюдателя) к относительной системе координат (к «точке зрения» робота). Это необходимо, в частности, для правильной интерпретации команд оператора роботом.

При управлении роботом возможны два различных пути заполнения слотов фрейма ситуации. Первый – со стороны робота-наблюдателя, который исследует ситуацию с помощью информационно - сенсорной системы и путем последующей фаззификации результатов измерений заполняет слоты фрейма-прототипа. В этом случае робот должен совершать специальные движения, например, осматривать объект с разных ракурсов для определения его типа и его свойств, измерять расстояние и угловое положение различных объектов рабочей сцены. Иными словами, анализ рабочей сцены составляет когнитивную деятельность ИРТС, предшествующую выполнению иных операций во внешнем мире. Ее результатом является конкретный фрейм ситуации, который может быть представлен оператору в словесной форме.

Второй путь заполнения фрейма ситуации – со стороны оператора, определяющего нечеткое положение объектов – целей и объектов – реперов на рабочей сцене, а также иные их характеристики, необходимые в дальнейшем. В этом случае для перехода от ЕЯ-сообщений оператора на язык фреймов необходим лингвистический процессор, который осуществляет синтаксический разбор предложения и заполняет слоты ситуационного фрейма нечеткими отношениями, которые далее формализуются. Целесообразно использовать проблемно ориентированный язык описания ситуаций, который, будучи достаточно близким к ЕЯ – представлению, тем не менее максимально облегчил бы работу лингвистического процессора. Во время реальной работы эти два способа представления информации могут чередоваться, образуя диалог между человеком и ИРТС на этапе определения ситуации и ее уточнения.

В заключение этого раздела отметим проблемно-ориентированный характер описания ситуации. Структура фрейма – прототипа для описания ситуации зависит от характера задачи решаемой роботом. Так в случае, когда задача имеет кинематический характер (см. ниже), представленного описания недостаточно. В структуру фрейма следует ввести данные о текущих скоростях, а возможно и ускорениях объектов аn относительно наблюдателя. Для операций динамического типа потребуется также информация о силах и моментах.
Описание и выполнение рабочих операций и их выполнение

Описание внешнего мира позволяет перейти и к описанию рабочих операций в нем [5]. Мы предполагаем, что сложные операции, выполняемые роботом, представляются в виде последовательности относительно небольшого числа типовых операций, взаимно согласованных между собой. Эти операции заранее определены и содержатся в базе знаний ИРТС в виде фреймов типовых операций. Такой фрейм содержит описание с помощью лингвистических переменных целей операции, начальной ситуации и предусловий, при которых операция может быть выполнена. Эти последние могут зависеть от ситуации, от возможностей робота и от свойств объекта работы. Таким образом, структура фрейма типовой операции такова: < имя операции > < исходная ситуация > < целевая ситуация > < предусловия > <дополнительные обстоятельства выполнения операции>. Например:


< Перенести объект А > < на А Б > < на А С > < свободен А > <установить объект без удара>. Имя операции соответствует одной из типовых операций, имеющихся в базе данных. Ее описание может включать ряд этапов. Например, в данном случае операция Перенести объект включает в себя следующие этапы: захватить объект → перенести объект → установить объект в заданное положение. Эти этапы будем называть элементарными операциями, поскольку они состоят только из одного действия. Каждая элементарная операция описывается фреймом такой же структуры, как и фрейм типовой операции.

Второй слот < на А Б > содержит условие, которое означает, что в исходном состоянии объект А находится на объекте Б, третий слот содержит описание целевой ситуации – объект А должен находиться на поверхности С. Предусловие свободен А означает, что на объекте А ничего не находится и отсутствуют иные препятствия к его захвату и последующему переносу. Последний слот содержит обстоятельство, связанное с дополнительным требованием, наложенным на выполнение операции.

Особенностью рассматриваемого описания операции является наличие предусловий. В общем случае предусловия могут быть, по крайней мере, трех типов: а) ситуационные, например, на объекте А не находится любой другой объект, или требуемые для захвата объекта положение и ориентация схвата манипулятора являются допустимыми; б) определяемые возможностями робота: робот имеет захват, соответствующий типу объекта и его размерам; вес объекта не превышает грузоподъемности робота и в) связанные с особенностями объекта работы: объект является твердым телом и может выдержать без разрушения усилие, развиваемое при захвате.

Описание типовых операций расширяет язык описания ситуаций, о котором говорилось выше. Это расширение делает рассматриваемый язык аналогом языка ситуационного управления применительно к рассматриваемой задаче управления роботами.

Оператор может управлять робототехнической системой, непосредственно задавая на проблемно-ориентированном языке имена и цели типовых операций; например, ‹перенести объект А на плоскость С› вставить вал А в отверстие О›. Такое управление можно назвать командным управлением, хотя, как мы видели, фактически оно является интерактивным и может потребовать диалога ИРТС с оператором для уточнения целей, предусловий и дополнительных обстоятельств. Оператор, задавая цель, определяет имя операции и целевую ситуацию. Исходная ситуация может быть не задана оператором. Тогда она определяется роботом с использованием его сенсорной системы. Что же касается предусловий, то они содержатся в предварительно сформированной базе элементарных операций и также должны проверяться ИРТС с использованием наблюдений и описания внешнего мира. Заметим, что и это описание может быть не полным в том смысле, что некоторые из предусловий не определены. Например, неизвестно, есть ли свободное место на плоскости С, куда следует перенести объект А. Тогда формируется запрос к базе когнитивных операций и выбирается операция осмотра плоскости С, дающая возможность заполнения пустого слота. Система может формировать запросы и к оператору в тех случаях, когда когнитивные действия не дают результатов и неопределенность сохраняется.

Обратим внимание на тот факт, что при управлении РТС цель и предусловия операции задаются в форме высказывания на языке описания мира, а реальная ситуация определяется по показаниям приборов. Однако выше мы уже упомянули, что использование нечеткой логики позволяет описать результаты наблюдения на универсальном языке описания мира. Теперь задача сравнения может быть решена на лингвистическом уровне. Пусть, например, рабочая сцена задана как совокупность нечетких дистанций и ориентации объектов а1,а2,а3, …аn по отношению к роботу R: (R d 11, f11 а1) & (R d12 f12 а2) &…&(R d1n, f1n аn). Можно условно назвать эту совокупность нечетким вектором ситуации. Если предположить, что желаемая ситуация содержит те же объекты (некоторые из них, впрочем могут и отсутствовать), то ее можно описать другим - желаемым вектором ситуации. Сравнивая нечеткие векторы S и S*, можно убедиться в их нечетком совпадении, или отличии. Во втором случае возникают противоречия в описании компонент S и S*, последовательно разрешая которые можно эти противоречия устранить (здесь могут быть использованы различные стратегии). Тем самым, будет найден путь, который должен пройти робот, чтобы из исходной ситуации попасть в желаемую (если такой путь существует).

Введенное выше описание типовой операции определяет ее цель и корректность задания (выполнимость). Оно, однако, не содержит требований кинематического, или динамического характера к ее выполнению. Эти требования, тем не менее, могут быть существенны выполнения операции. Помимо операций терминального характера, которые, по существу заключаются в преобразовании одной статической ситуации в другую, могут рассматриваться операции, в которых ситуация описывается как зависящая от времени, а цель и условия выполнения зависят от скоростей и ускорений относительного движения робота и объектов сцены. Примером может служить, например, такая операция: Преследовать объект А с сохранением заданной дистанции и ориентации, или Обеспечить захват движущегося объекта А. Подобные операции мы относим к операциям кинематического типа. В ряде случаев при постановке задачи операции определяются также требования к силам и моментам, приложенным со стороны робота (манипулятора) к объекту работы. Например: Установить А на С без удара, или: Перемещать рабочий инструмент А по заданной траектории Т с заданной силой прижима F.

Заметим, что введение в фрейм-прототип операции данных о скоростях, ускорениях, силах и моментах требует использования соответствующих датчиков и средств обработки информации в исполнительной системе управления ИРТС. Таким образом, постановка задачи порождает структуру технической системы, требуемую для выполнения задачи. Это обстоятельство вновь позволяет провести аналогию с предметной деятельностью человека, когда цель деятельности определяет ее внутреннюю структуру [6].

Структура исполнительной системы показана на рис. 3. Она включает подвижную платформу робота, манипуляторы, возможно, системы управления сенсорами ИРТС и вспомогательными устройствами. Задание типовой (или элементарной) операции вызывает из базы данных систему нечетких правил, определяющих алгоритм управления системой. Таким образом, задание имени операции порождает действие.

Экспериментальным путем можно определить систему нечетких продукционных правил, которыми пользуется оператор при управлении роботом. Эти правила обычно носят кинематический характер и связывают ситуацию, определяемую с помощью сенсорной системы робота, и соответствующее ситуации управление. Они обычно довольно просты и очевидны, т.е. имеют характер «естественных» правил для оператора. Например, (а) если цель далеко, то двигаться быстро, (б) если цель близко, то двигаться медленно, (в) если цель немного справа, то немного правее (г) если цель справа, то резко направо и т.д. Используя известные алгоритмы нечеткого принятия решений (чаще всего используются алгоритмы Мамдани, Сугено, Цукамото, Ларсена, и др.), можно определить «четкое» управление роботом, соответствующее сложившейся ситуации. Например, обеспечить движение мобильного робота, обеспечивающее относительно плавное приближение к цели. Подбирая параметры функций принадлежности, соответствующих входным переменным (значениям лингвистических переменных, определяющих расстояние и ориентацию объектов рабочей сцены относительно робота), и выходным – управляемым переменным (угловой и линейной скорости), можно добиться достаточно хороших переходных процессов, зависящих от динамики робота и условий его работы [7].

Управление роботом путем задания типовых операций соответствует одношаговому принятию решений, т.е. управлению, определяемому простыми продукционными правилами, заранее сформулированными оператором. Возможности такого управления ограничены. При выполнении сложных, многошаговых операций возникает необходимость их предварительного планирования. Эта задача представляет известные трудности для оператора, поскольку необходимо учитывать как реальную обстановку, так и объективные возможности системы. Поэтому ИРТС должна содержать уровень интеллектуального планирования, в качестве системы поддержки решений оператора.
Выполнение сложных операций.

К сложным мы относим такие операции, которые могут быть представлены последовательностью согласованных между собой типовых операций, приводящих к достижению поставленной цели. Согласование же состоит в том, что ситуация, полученная в результате выполнения n–ой операции, удовлетворяет предусловиям n+1 – ой операции. Если в результате фактического выполнения n–ой операции условие согласования не выполнено, то процесс планирования повторяется, причем реально сложившаяся ситуация принимается за исходную. Особенностью процедуры планирования в робототехнике, по сравнению с многочисленными методами интеллектуального планирования (AI – планирования), разработанными к настоящему времени, является возможность постоянного сравнения результатов фактического наблюдения за ситуацией и заданных в процедуре планирования условий. Сравнение может проводиться как сравнение лингвистических описаний наблюдаемой и предполагаемой (существующей только в качестве высказывания) ситуации. Возникающее противоречие порождает план действий, направленных на устранение противоречий и, как следствие, на реализацию желаемой ситуации. Таким образом, цель и имя каждой отдельной типовой операции не задаются человеком, а генерируются самой системой исходя из сопоставления реальных и предполагаемых ситуаций.

Принцип разрешения противоречий, достаточно близок к когнитивной деятельности человека при планировании действий, в основе которой также лежит сравнение оперативного образа ситуации и образа цели [6] . Этот принцип дополняет те методы принятия решений, которые были описаны Д.А.Поспеловым как естественные для человеческого мышления. Использование принципа разрешения противоречий требует дальнейшего расширения языка управления ИРТС. Помимо «словаря» типовых операций теперь требуется и «словарь» для разрешения ситуационных противоречий путем выполнения типовых операций. Если пространственные отношения интенциональные, то каждый тип противоречий порождает свою типовую операцию для своего разрешения.

Например: если цель: (a1 R8 S), т.е. объект a1 стоит на поверхности S , а реально (a1R8 S), то противоречие порождает типовую операцию перенести а1 на S . Если цель определяется как (a1 R 2 С), т.е. вал a1 находится внутри втулки С, а по результатам наблюдений выполняется (a1R 2 С), то порождается типовая операция: вставить a1 в С. Если для выполнения последующих действий требуется выполнение условия: свободен a1, а реально выполняется: (a2 R8 a1), т.е. на a2 стоит a1, то порождается типовая операция убрать a2 с a1 . Нетрудно продолжить этот список действий, разрешающих противоречия интенционального характера.

Если отношения экстенциональные, то специального словаря соответствия между ситуацией и требуемой типовой операцией не требуется. Противоречие может быть разрешено путем выполнения типовой операции, целью которой является отношение, заданное в ее условии. Если мобильный робот R должен находиться относительно наблюдателя N в положении (R d1 f1 N), а реально выполняется другое условие: (R d2, f2 N), то требуемая операция определяется в форме: переместить робот R из положения (R d2 f2 N) в положение (R d1 f1 N).

При планировании сложных операций возникает многошаговая процедура разрешения противоречий. Сначала сопоставляются целевая и фактическая ситуации. Если они не совпадают, то выявляются противоречия и определяются действия, разрешающие эти противоречия. Далее проверяются предусловия разрешающих действий, которые также могут находиться в противоречии с фактической ситуацией. Они генерируют новые действия и т.д. до тех пор, пока, по крайней мере для одной из разрешающих операций, предусловия не окажутся выполненными. Тогда эта операция выполняется (пока на уровне планирования), возникает новая ситуация, которая анализируется аналогичным способом и т.д. Эту процедуру можно представить в виде направленного графа, корнем которого является целевая ситуация [8].

Рассмотрим планирование методом разрешения противоречий на примере, показанном на рис. 4. Задача определяется следующим образом: перенести объект В на плоскость С2. Исходная ситуация определяется с использованием сенсорной системы робота и формализуется следующим образом: < В R8 С1 & Б R8 В & А R8 В >. Из описания типовой операции следует целевая ситуация < В R8 С2 > и предусловия ее выполнения: <свободен В & есть свободное место на С2>.

Для облегчения решения задачи предположим, что последнее из предусловий удовлетворяется, о чем ИРТС получает информацию от системы технического зрения робота (возможно, для этого требовалась когнитивная операция осмотра поверхности С2), или непосредственно от оператора. Типовая операция <перенести В на С2 > включает ряд этапов - элементарных операций, первой из которых является <захватить В>. Предусловия этой элементарной операции: <свободен В & манипулятор имеет необходимый схват & грузоподъемность манипулятора позволяет захватить В >. Будем считать, что два последних предусловия также выполняются. Однако, первое предусловие приходит в противоречие с текущей ситуацией. В соответствии со словарем разрешения противоречий генерируются последовательно операции <убрать Б> и <убрать А>. Каждая из этих типовых операций в качестве начального этапа также содержит элементарные операции <захватить Б > и <захватить А>. На этот раз предусловия операций выполняются и они могут быть выполнены манипулятором в любой последовательности. После этого выполнятся и предусловия операции <захватить В>, а также и остальных элементарных операций, необходимых для переноса и установки объекта В на плоскости С2. Таким образом, мы получаем последовательность согласованных типовых операций, т.е. план сложной операции, выполняющей поставленную оператором задачу. План предъявляется оператору и при его согласии выполняется роботом.

Предполагается, что результаты каждой элементарной операции контролируются сенсорной системой робота. Это необходимо из за того, что внешний мир робота обладает собственной динамикой и может изменяться в процессе работы. Например, в рассмотренной выше задаче после переноса объектов А и Б на объекте В может появиться новый объект Д, или возникнуть препятствие для установки на плоскости С2. Не исключены ошибки и в работе самой ИРТС при выполнении промежуточных операций. Если ситуация оказывается отличной от расчетной, то процедура планирования повторяется; причем реально сложившаяся ситуация принимается за исходную.

Итак, при управлении роботом с использованием «интеллектуального» планирования операций, оператор задает цель в качестве желаемой ситуации. Это задание сопоставляется с текущей ситуацией и порождает последовательность согласованных типовых операций, приводящих к достижению поставленных целей. Имеется в виду, что при возникающих затруднениях оператор может перейти на уровень одношагового управления, непосредственно задавая типовые операции. В качестве нештатного, аварийного варианта необходимо предусмотреть и прямое управление со стороны оператора движениями робота (см. схему на рис. 1).

Ограничение рассмотренного способа управления состоит в том, что оператор должен заранее определить правила работы системы в тех или иных ситуациях, причем и сами эти ситуации заранее известны. И то, и другое положение в реальности может не выполняться. Здесь надо различать два случая – когда оператор может успешно управлять системой, но не в состоянии сформулировать правила своей работы. Второй случай – когда отсутствует возможность заранее определить как возможные ситуации, так и способы работы.

Первый случай часто встречается, когда оператор опытным путем вырабатывает сложные сенсомоторные навыки управления роботом, но не может сформулировать правила работы. Предполагается, что возможные ситуации, для которых эти навыки выработаны, заранее известны. В этом случае решением проблемы может служить использование гибридных (нечетких) нейронных сетей, которые позволяют реализовать процедуру обучения ИРТС «с учителем». Такая процедура использовалась, например, для обучения мобильного робота «Богомол», разработанного в ИФТП (рис.5) и способного преодолевать препятствия различного типа [9].


Рис. 5. Манипуляционный мобильный робот «Богомол»


При этом управление движением робота требует согласованного управления углами поворота четырех гусениц платформы. Такое управление достаточно сложно для оператора; его целесообразно автоматизировать. Результаты работы опытного оператора и соответствующие движения робота использовались в качестве обучающей выборки для нечеткой сети типа ANFIS (adaptive network based fuzzy inference system). Обучение сети проводилось для ряда характерных ситуаций, возможных при движении робота. Например таких, как преодоление барьера, спуск овраг и т.п. Настройка параметров сети производилась наиболее распространенным методом обратного распространения ошибки (back propagation). После определенного числа циклов обучения система была способна вырабатывать управляющие сигналы близкие к тем, которые вырабатывал оператор.

Одной из проблем при разработке таких систем является проблема распознавания типовых ситуаций, которая присутствует и в методе ситуационного управления. В рассматриваемой задаче ситуации распознавались методами кластерного анализа в пространстве входных параметров ситуации, получаемых с датчиков робота. Это были параметры ориентации подвижной платформы в абсолютной системе координат и развиваемые двигателями моменты. Выходными, управляемыми параметрами были углы поворота гусениц робота и скорость его движения.

Наиболее сложной является ситуация, когда неизвестны и возможные ситуации, причем робот должен самостоятельно выработать правила поведения. Единственно возможным вариантом в этом случае является обучение робота без учителя, на собственном опыте. В таком случае в ИРТС необходимо заранее заложить показатель результативности своей деятельности, зависящий от ее содержания. Например, при обходе неизвестного помещения с многочисленными препятствиями, показателем результативности может служить уменьшение числа столкновений с препятствиями. По мере обучения это число должно уменьшаться. Новые многообещающие результаты получены в этом направлении в работах, выполненных в ИСП РАН под руководством А.А.Жданова [10]. Одним из методов решения рассматриваемой задачи является использование самообучаемых нейронных сетей специального вида, дополненных блоком оценки результатов собственных действий, который авторы назвали блоком эмоций ИРТС. Показано, что такая система при полном отсутствии априорной информации может обучиться преодолевать пространство с препятствиями без столкновения с ними. Другой подход к решению той же задачи заключается в обработке накопленного системой опыта в форме «ситуация – действие – результат» с оценкой результата [11]. Первоначально в обоих случаях необученная система ведет себя случайным образом. Накапливая опыт и отбрасывая неудачные решения, она постепенно улучшает свою стратегию.
Заключение.

Несмотря на то, что основы метода ситуационного управления относятся к середине 80-х годов, этот метод не потерял своей актуальности и сегодня. Он находит все новые приложения, одним из которых является современная робототехника. По существу, это новый подход, который объективно соответствует новому этапу технического прогресса, когда старый, классический аппарат математики уже не позволяет описать вновь проектируемые технические системы. Интеллектуальные робототехнические системы в полной мере относятся к этому классу технических систем. ИРТС все шире включаются не только в профессиональную деятельность, но и в другие сферы жизни человека. Использование в робототехнике принципов ситуационного управления, предложенных Д.А.Поспеловым и его последователями, позволяют сформировать основы нового направления, которое можно было бы назвать теорией деятельности робототехнических систем.


ЛИТЕРАТУРА
1. Поспелов Д.А. Ситуационное управление: теория и практика – М.: Наука – Физ.мат.лит., 1986

2. . Ющенко А.С. К теории деятельности эргатических мехатронных систем. – Мехатроника, 2000, №3,с.2-11.

3. Кандрашина Е.Ю., Литвинцева Л.В., Поспелов Д.А. Представление знаний о времени и пространстве в интеллектуальных системах. – М., Наука, ФМ,1989. .

4. Ющенко А.С. Маршрутизация движения мобильного робота в условиях неопределенности. – Мехатроника, автоматизация и управление, 2004, № 1.

5. Ющенко А.С. Дистанционное управление роботами с использованием нечетких представлений. - Искусственный интеллект, 2002, №4, Изд. НАН Украины, с.388 – 396.

6. Гордеева Н.Д. Экспериментальная психология исполнительного действия.- М., Тривола, 1995.

7. Ющенко А.С., Киселев Д.В. Нечеткое управление поведением мобильных роботов. – Вестник МГТУ, Приборостроение, 2001, - №1 ,с.86-89.

8. Ющенко А.С. Интеллектуальное планирование в деятельности роботов.–Мехатроника,2005,№3, с.5-18.

9. Вечканов В.В., Киселев Д.В., Ющенко А.С. Адаптивная система нечеткого управления мобильным роботом. – Мехатроника, 2002, №1,с.20-26.

10. Жданов А.А. Бионический метод автономного адаптивного управления. – От моделей поведения к искусственному интеллекту. (Науки об искусственном)/ Под ред. В.Г.Редько. – М.: УРСС, 2006, с.343 – 385

11. Караваев М.В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды ИСП РАН, т.7. / Под ред. А.А.Жданова. – М.: ИСП РАН, 2004, с.41-53.


База знаний:
-внешний мир

-возможности системы

-элементарные операции

-правила работы (технологии)

-алгоритмы управления


Исполнительные

устройства



Интерпретация действий

Устройства

управления


Интерпретация показаний датчиков.

Представление

информации

о текущей ситуации на рабочей сцене

Выбор решений

Задание действий

Управление исполнительными устройствами




Управление движением объекта


Система управления



Г

Д0



Датчики внешней информации

Таблица 1.

Направления fm от а1 к а3

f k , k = 1 2 3 4 5 6 7 8 f k = 3

fj ,

i = 1 m= 1 1 2 2 1 8 8 1

2 2 2 2 3 3 2 1 1

3 2 3 3 3 4 4 3 2

4 3 3 4 4 4 5 5 4 fj = 1

5 5 4 4 3 3 3 6 6 f m = 2

6 7 6 5 5 6 6 6 7

7 8 8 7 6 6 7 7 7

8 8 1 1 8 7 7 8 8

Рис. 2. К определению нечетких направлений на плоскости







Б

А
В С1
С2
Рис. 4. К задаче планирования операций


Формирование управления приводами робота

Приводы робота

Платформа, исполнительные механизмы