Обзор приложений символического искусственного интеллекта

Некоторыми типичными приложениями, использующие элементы ИИ, являются: [1]

  • • понимание естественного языка и машинный перевод;
  • • интеллектуальные базы данных и вопрос-ответные системы;
  • • экспертные системы и автоматическое доказательство теорем;
  • • планирование действий робота и распознавание образов;
  • • интеллектуальные игры.

Данный список не является ни исчерпывающим, ни ортогональным. Это просто набор наших излюбленных примеров.

Понимание естественного языка и машинный перевод

Процесс понимания естественного языка — э го процесс передачи знаний от одного носителя языка к другому.

Несмотря на всю свою кажущуюся простоту и привычность, этот процесс чрезвычайно сложен. Он подразумевает наличие общей области знаний у обоих партнеров и согласованных механизмов представления знаний в виде данных, а также наличие обратного механизма извлечения знаний из данных.

Для компьютерной реализации процесса понимания естественного языка требуются мощные вычислительные ресурсы, управляемые нетривиальными (интеллектуальными) программными комплексами. Рассмотрим, в чем здесь состоит проблема. Пусть у нас есть два интеллектуальных агента, для начала пусть это будут два человека. Первый является источником знаний, назовем его Л, а второй — приемником знаний, назовем его В. В процессе понимания задействованы два механизма. Во-первых, у А есть алгоритм, позволяющий преобразовывать гипотетические знания в данные, сигнал (текст, речь или другие формы выражения естественного языка[2]) — механизм представления знаний. Во-вторых, у В есть механизм, который позволяет преобразовывать получаемый сигнал обратно в знания, — механизм извлечения знаний. Если принять, что эти механизмы реализуются алгоритмами [3], то становится понятно, что у каждого из них есть область определения и область значений, вход и выход. Понимание происходит тогда, когда выход алгоритма представления знаний и вход алгоритма извлечения знаний, по меньшей мере, пересекаются на общей интерпретации; а полное понимание достигается тогда, когда эти области совпадают.

Приведем несколько примеров. Пусть автор — это агент Л, читатель — агент В. Следующая фраза: «овелан аварпс ёе иласипаз отсорп ым» — вызовет у вас, скорее всего, недоумение и непонимание в первое мгновение. Здесь агент Л использует нестандартный способ представления знаний, и это создает затруднения при извлечении знаний агентом В. Еще пример. Если Л использует язык, которым В не владеет (скажем, если бы текст этого абзаца прочел бы по-китайски для вас вслух китаец, знающий русский, при условии, что вы не знаете китайского), то происходит следующее: механизм представления знаний работает, механизм извлечения работает, но должного понимания нс происходит. Русскоговорящий агент В смог бы оценить, например, музыкальность речи, необычность звукосочетаний и, в конце концов, прийти к выводу, что он, агент В, ничего (!) не понял, т.е. имеет место пустая общая интерпретация.

Приведем пример «ортогональной»1 общей интерпретации. Русская девушка спрашивает своего парня (болгарина): «Ты меня любишь?» Тот в ответ качает головой (от плеча к плечу). Девушка рыдает от горя, хотя должна бы безмерно радоваться! Дело в том, что у болгар наш подтверждающий кивок является жестом отрицания, а покачивание головой из стороны в сторону означает подтверждение, а, например, в Индии жест покачивания головой может означать и согласие, и отрицание в зависимости от контекста.

Мудрецу достаточно сказать одно слово для того, чтобы другой мудрец его понял. Иными словами, для мудрецов общий объем передаваемых данных может быть значительно меньше, чем у среднестатистических людей, за счет более мощных механизмов представления и извлечения знаний.

Общая интерпретация — это одинаково трактуемый обеими сторонами набор семантических правил, связывающих языковые конструкции с их смысловой нагрузкой.

Обратимся теперь к компьютерам. В них механизмы представления знаний и извлечение знаний тривиальны, понимание сводится к передаче данных. Поэтому если компьютеры соединены каналом связи и форматы данных согласованы, то понимание достигается легко, а в противном случае понимания нельзя достичь никоим образом. Критическим случаем, находящимся в фокусе нашего внимания, является взаимопонимание человека и компьютера. Существует два принципиально разных способа общения человека с компьютером (рис. 1.1). Первый из них — когда человек способен понимать компьютер. Это не заслуга компьютера, а способность человека, которого все окружающие называют программистом. Второй — когда компьютер способен понимать человека. Такой компьютер обязательно должен обладать элементами ИИ. Поскольку в аппаратном обеспечении обычного[4] [5] компьютера трудно разместить интеллект, даже искусственный, ясно, что понимание должно обеспечиваться программно. Такие программы были созданы уже сравнительно давно, хотя все они без исключения весьма ограничены в понимании естественного языка или даже какого-либо более-менее широкого фрагмента языка.

Общий контекст понимания

Рис. 1.1. Общий контекст понимания

Прекрасная ELIZA, которая говорит по-английски

Одной из первых прикладных систем ИИ, понимающих естественный язык, является программа ELIZA, созданная в 1966 г. Джозефом Вейценбаумом.

Позднее Терри Виноград (Terry Winograd) написал книгу1, описывающую программу ELIZA. Структура программы ELIZA была чрезвычайно проста и включала в себя всего несколько десятков эвристических правил, предназначенных для распознавания грамматических конструкций (путем простого сравнения с образцом) и преобразования поступающих вопросов в «естественные» ответы. В результате эта программа могла вести вполне правдоподобный диалог, нередко при этом отвечая вопросом на вопрос.

Пример диалога с программой ELIZA:

  • ELIZA, ты компьютерная программа.
  • — Почему Вы думаете, что я компьютерная программа?
  • — Потому что тебя составил Вейценбаум.
  • — Расскажите мне о Вейценбауме.

Несмотря на всю свою простоту, эта программа нашла применение в психотерапии. Разговор психотерапевта с пациентом может продолжаться довольно длительное время, прежде чем достигается терапевтический эффект. ELIZA успешно имитировала диалог с роджерианским психологом[6] [7] в течение многих часов (суть этого метода заключается в том, что терапевт выслушивает пациента и задает наводящие вопросы, в результате чего психическое состояние последнего улучшается... или не улучшается). Многие пациенты отмечали, что эти сеансы оказались крайне полезны для них, и отказывались верить, что с ними разговаривала компьютерная программа, а не профессиональный психолог-человек.

Сам Вейценбаум, шокированный поведением своего детища, вскоре пришел к выводу, что «основная идеология развития искусственного интеллекта — искусственный разум — безнравственна».

Джозеф Вейценбаум (Joseph Weizenbaum), 1923—2008 — известный деятель в области искусственного интеллекта, заслуженный профессор Массачусетского технологического института.

Основатель организации «Компьютерные профессионалы за социальную ответственность». За свои взгляды на ответственность ученых-программистов перед человечеством снискал в среде специалистов по информатике репутацию диссидента и еретика.

« Существуют задачи, выполнение которых не следует поручать вычислительным маши нам, независимо от того, можно ли добиться, чтобы вычислительные машины их решали».

В последнее время распространение получили продвинутые версии подобных программ, которые называются искусственные разговорные существа, или чат-боты. Чат-бот может дать достаточно адекватный ответ на вопрос, сформулированный на правильном естественном языке, работа с которым поддерживается. Такие боты часто применяются для сообщения прогноза погоды, результатов спортивных соревнований, курсов валют, биржевых котировок и т.п.

Женя Густман, прошедший тест Тьюринга?

С начала этого века регулярно проводятся различные конкурсы и испытания чат-ботов. Правила испытаний постоянно меняются, поэтому сравнение результатов довольно субъективно.

Например, чат-бот, разработка которого была начата группой программистов еще в 2001 г. в Санкт-Петербурге, по утверждению организаторов конкурса, в июне 2014 г. впервые в истории смог пройти тест Тыоринга (см. вставку «Тест Тыоринга и Китайская комната» в п. 1.3.2). Суть достижения состоит в том, что, обмениваясь текстовыми сообщениями с чат-ботом определенное время (5 мин), более 30% участвующих в испытаниях экспертов ошиблись и идентифицировали собеседника как человека, а не как программу. Данное событие признается как значительное достижение, поскольку, во-первых, было проведено достаточно большое количество испытаний, чтобы исключить случайное «везение», и, во-вторых, темы диалогов заранее не ограничивались.

В чем же особенности этого чат-бота?

Чат-бот представляется как подросток 13 лет из Одессы, Евгений Густман. Это один из заложенных в программу приемов скрытого управления диалогом, поскольку персонификация очень важна для успешной коммуникации эксперта- человека. Хорошо известно, что люди но-разному ведут диалог, в зависимости от того, кто их собеседник. Подросток в очках, похожий на Гарри Поттера, вызывает симпатию, и ему многое прощается. Еще одно важное преимущество, которое использовали разработчики, это попытка сделать чат-бот не только умным, но и веселым. Один из разработчиков, родом из Одессы, передал Евгению свои познания в одесском юморе.

Понимает ли Евгений Густман естественный язык? Пожалуй, нет. Является ли эта разработка полезной? Несомненно, да!

Машинный перевод является частным случаем проблемы понимания естественного языка. «Частность» определяется, главным образом, режимом обмена информацией — монолог вместо диалога. Хотя проблема перевода является частной, системы автоматического перевода текстов с одного естественного языка на другой образуют важный класс программных комплексов с элементами искусственного интеллекта ввиду явной практической востребованности этой задачи.

Перевод с одного естественного языка на другой, несомненно, является интеллектуальной задачей. Автоматический машинный перевод привлек внимание исследователей едва ли не раньше других предметных областей.

Важно, что, как и в других случаях ИИ, в классе систем машинного перевода выделяется целый ряд категорий всевозрастающей сложности:

  • • электронный словарь;
  • • подстрочник технических текстов;
  • • художественный перевод поэзии;
  • • синхронный перевод живой речи.

Ясно, что эти задачи не могут быть решены единообразно, а значит, их решения появляются в разное время и опираются на различные технологии.

Для каждой новой области применения ИИ наблюдается одна и та же характерная картина (рис. 1.2), которую мы проиллюстрируем на примере истории развития машинного перевода. После появления новой идеи к ней проявляется повышенный интерес, возникают завышенные ожидания, пользователи ждут «чуда». Но чуда не происходит — методы ИИ трудоемки, сложны, и их развитие требует немалого естественного интеллекта. Наступает разочарование, новое направление уходит из сферы ажиотажного интереса и иногда подвергается даже необоснованной обструкции. Если идея была плодотворна, то, несмотря на падения интереса в средствах массовой информации, подспудная кропотливая работа в академических кругах продолжается и через некоторое время (не сразу!) начинает давать практические результаты. Интерес вновь появляется, но уже не праздный, а деловой и обоснованный.

История популярности машинного перевода

Рис. 1.2. История популярности машинного перевода

Уоррен Уивер (Warren Weaver), 1894—1978 — американский ученый-математик. Изложил принципы современного машинного перевода в 1947 г.

«Уменя перед глазами текст, написанный по-русски, по я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно — это взломать коду чтобы извлечь информацию, заключенную в тексте».

В марте 1947 г. У. Уивер, директор отделения естественных наук Рокфеллеровского фонда, в переписке с Эндрю Бутом (Andrew D. Booth) и Норбертом Винером (Norbert Wiener) впервые сформулировал концепцию машинного перевода, которую несколько позже (в 1949 г.) развил в своем меморандуме, адресованном фонду.

В 1952 г. состоялась первая конференция по машинному переводу в Массачусетском технологическом институте, а в 1954 г в Ныо-Йорке была представлена первая система машинного перевода — IBM Mark II, разработанная компанией IBM совместно с Джоржтаунским университетом (это событие вошло в историю как «Джорджтаунский эксперимент»). Была представлена очень ограниченная в своих возможностях программа (она имела словарь в 250 единиц и шесть грамматических правил), осуществлявшая перевод с русского языка на английский. После этого подобные разработки получили широкое распространение в Италии, Франции, Англии, Японии, а также был создан международный специализированный журнал.

В 1959 г. философ Й. Бар-Хиллел (Yohoshua Bar-Hillel) выступил с утверждением, что высококачественный полностью автоматический машинный перевод не может быть достигнут в принципе. Это выступление самым неблагоприятным образом отразилось на развитии машинного перевода в США. В 1966 г. был отмечен мощный спад, связанный с отчетом специально созданной Национальной Академией наук США комиссией ALPAC (.Automatic Language Processing Advisory Committee — Консультативный комитет по автоматизированной обработке в языке). Комиссия пришла к заключению, что машинный перевод нерентабелен: соотношение стоимости и качества машинного перевода было явно не в пользу последнего, а для нужд перевода технических и научных текстов человеческих ресурсов было достаточно. Поэтому Министерство обороны США решило прекратить финансирование такого рода проектов. Тема перестала быть модной, и работу продолжили только квалифицированные энтузиасты и профессионалы.

С развитием вычислительной техники в конце 1970-х гг. (появление микрокомпьютеров, развитие сетей, увеличение ресурсов памяти) машинный перевод вошел в эпоху «ренессанса». При этом несколько сместились акценты: исследователи теперь ставили целью развитие «реалистических» систем машинного перевода, предполагавших участие человека на различных стадиях процесса перевода. В результате в 1980-х гг. на рынке появились первые промышленные системы машинного перевода, ориентированные на массовое использование.

В 1990 г., когда системы машинного перевода снова стали одним из приоритетных направлений развития компьютерной отрасли и вышли на новый качественный уровень, пройдя непростой этап переосмысления и взаимной интеграции, Ларри Чайлдс (Larry Childs) предложил их классификацию. Он разделил все «электронные переводчики» на три группы:

  • FAMT {Fully-automated machine translation) — инструменты полностью автоматизированного машинного перевода: входной текст —> анализ / синтез текста —» выходной текст;
  • НАМТ {Human-assisted machine translation) — приложения для автоматизированного машинного перевода текстов, выполняемого при участии человека: входной текст —» редактор —> анализ / синтез текста —» редактор —> выходной текст;
  • МАНТ {Machine-assisted human translation) — вспомогательные средства для выполнения перевода человеком с использованием компьютера: входной текст —> переводчик —» подстрочник —> редактор —> выходной текст.

Однако жизненная практика свидетельствует о том, что для успешного использования всех существующих на сегодняшний день систем машинного перевода в большей или меньшей степени необходимо участие чело- века-редактора.

Концептуально система машинного перевода имеет следующую структуру (рис. 1.3, слева): текст на исходном языке сначала анализируется, т.е. производится интерпретация данных с целью «понимания смысла», а затем понятый смысл представляется в виде текста на целевом языке. В идеале анализ производится «до полного понимания», когда весь смысл исходного текста выражается на некотором гипотетическом универсальном метаязыке. Традиционно этот универсальный метаязык называют interlingua.

Следует отметить, что к настоящему времени идеал так и не достигнут. Современные системы машинного перевода имеют трехслойную архитектуру (рис. 1.3, справа). Сначала проводится анализ входного языка до достижения некоторого уровня понимания, и это понимание выражается в построении различных структур над исходным текстом, часто специфических для определенного языка. Затем, используя эвристические алгоритмы, производится преобразование частично понятых структур одного языка в частично понимаемые структуры другого языка. Набор этих алгоритмов традиционно называется переносом (от англ, transfer). Правила переноса имеют большой объем, используют огромные информационные ресурсы и весьма изощренные алгоритмы. Наконец, по перенесенным структурам целевого языка (они вовсе не обязательно изоморфны структурам исходного языка) синтезируется текст на целевом языке. Разумеется, этап переноса является самым сложным, важным и наукоемким.

Впрочем, мечты, с которыми человечество взялось более полувека тому назад за задачу машинного перевода, в значительной мере остаются мечтами — высококачественный («художественный») перевод текстов широкой тематики но-прежнему недостижим. Однако несомненным является ускорение работы переводчика и повышение качества при использовании систем машинного перевода.

Структура системы машинного перевода

Рис. 1.3. Структура системы машинного перевода

По мере появления все новых и новых алгоритмов, методик и программных решений, нацеленных на компьютерный перевод текстовой информации, достоверными фактами является наличие у таких систем целого ряда преимуществ перед обычным «рукотворным» переводом:

  • • высокая скорость перевода (использование машинного перевода позволяет значительно сократить время, требуемое для перевода больших объемов текста, по современным оценкам на 50—70%);
  • • снижение стоимости перевода (с помощью машинного перевода можно сэкономить на оплате услуг профессиональных переводчиков и при переводе относительно простых текстов отказаться от них вовсе);
  • • конфиденциальность переводимой информации (участие компьютера в обработке конфиденциальных документов в гораздо большей степени гарантирует нераспространение их содержания, чем участие переводчика);
  • • универсализацию процесса перевода (даже самый квалифицированный переводчик, как правило, специализируется в определенных областях знаний и тематических направлениях, тогда как системы машинного перевода достаточно универсальны, и их работа зависит только от проведения необходимых настроек — подключения нужных электронных словарей и т.п.).

В настоящее время существует множество коммерческих проектов машинного перевода: Systran, IBM, L&H (Lemout & Hauspie), Language Engineering Corporation, Atril, Trados, Caterpillar Co., LingoWare. В России большой вклад в развитие машинного перевода внесла группа под руководством проф. Р. Г. Пиотровского (Российский государственный педагогический университет им. Герцена, Санкт-Петербург). Сейчас заслуженное признание получил автоматический переводчик, разработанный компанией ПРОМТ (PROMT, PROgrammer’s Machine Translation), который удовлетворяет ожиданиям большинства пользователей. В последнее время ряд крупных компаний (Яндекс, Google) предоставляют онлайн сервисы машинного перевода. Конечно, нельзя сказать, что эти сервисы переводят безупречно, но зато они работают быстро и бесплатно.

  • [1] Мы вставили в наше определение нейтральное слово «элементы», чтобы подчеркнуть,что программа решает некоторые задачи в определенной области и не претендует на универсальную «способность мышления, рационального познания». Менее осторожные или болеесамонадеянные авторы употребляют оборот «прикладные системы с искусственным интеллектом». Мы также употребляем этот оборот, например, в названии первой главы, но оговариваем, что понимаем его в осторожном и минимальном смысле.
  • [2] 2 Язык жестов — это также естественный язык.
  • [3] Например, дар «говорить языками», который апостолы получили в день Пятидесятницы после сошествия на них Святого Духа (Деян. 2:3-11), явно неалгоритмической природы.
  • [4] Пересечение не пусто, но смысл конструкций прямо противоположен.
  • [5] В этой книге термин «компьютер» большей частью означает универсальную цифровуюэлектронную вычислительную машину общего назначения. Специализированные информационные машины, имеющие отношение к ИИ, например, нейрокомпьютеры, бегло рассматриваются в п. 1.1.4.
  • [6] Виноград Т. Программа, понимающая естественный язык. М.: Мир, 1976.
  • [7] Клиснт-цснтрированная психотерапия — метод психотерапии, предложенный КарломРоджерсом в качестве альтернативы психоанализу и бихевиоральной психотерапии. Главную роль в своем подходе Роджерс отводил взаимоотношениям между терапевтом и пациентом, как важнейшее условие эффективного лечения.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >