Реферат: Искусственный интеллект

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Обеспечение взаимодействия с ЭВМ наестественном языке (ЕЯ) является важнейшей задачей исследований поискусственному интеллекту (ИИ). Базы данных, пакеты прикладных программ иэкспертные системы, основанные на ИИ, требуют оснащения их гибким интерфейсом длямногочисленных пользователей, не желающих общаться с компьютером наискусственном языке. В то время как многие фундаментальные проблемы в областиобработки ЕЯ

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">(Natural Language Processing, NLP)<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> еще не решены, прикладные системымогут оснащаться интерфейсом, понимающем ЕЯ при определенных ограничениях.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Существуютдва вида и, следовательно, две концепции обработки естественного языка:

·<span Times New Roman""> 

·<span Times New Roman""> 

Природа обработки естественногоязыка

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Обработкаестественного языка — это формулирование и исследование компьютерно-эффективныхмеханизмов для обеспечения коммуникации с ЭВМ на ЕЯ. Объектами исследованийявляются:

·<span Times New Roman""> 

·<span Times New Roman""> 

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Задача исследований — созданиекомпьютерно-эффективных моделей коммуникации на ЕЯ. Именно такая постановказадачи отличает

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">от задач традиционной лингвистики и других дисциплин, изучающих ЕЯ, и позволяетотнести ее к области ИИ. Проблемой <span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> занимаются две дисциплины: лингвистика и когнитивнаяпсихология.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Традиционно лингвисты занималисьсозданием формальных, общих, структурных моделей ЕЯ, и поэтому отдавалипредпочтение тем из них, которые позволяли извлекать как можно больше языковыхзакономерностей и делать обобщения. Практически никакого внимания не уделялосьвопросу о пригодности моделей с точки зрения компьютерной эффективности ихприменения. Таким образом, оказалось, что лингвистические модели, характеризуясобственно язык, не рассматривали механизмы его порождения и распознавания.Хорошим примером тому служит порождающая грамматика Хомского, которая оказаласьабсолютно непригодной на практике в качестве основы для компьютерногораспознавания ЕЯ.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Задачей же когнитивной психологииявляется моделирование не структуры языка, а его использования. Специалисты вэтой области также не придавали большого значения вопросу о компьютерной эффективности.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Различаются общая и прикладная

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">. Задачей общей <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> является разработка моделей использованияязыка человеком, являющихся при этом компьютерно-эффективными. Основой дляэтого является общее понимание текстов, как это подразумевается в работахЧарняка, Шенка, Карбонелла и др. Несомненно, общая <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> требует огромных знаний о реальноммире, и большая часть работ сосредоточена на представлении таких знаний и ихприменении при распознавании поступающего сообщения на ЕЯ. На сегодняшний деньИИ еще не достиг того уровня развития, когда для решения подобных задач вбольшом объеме использовались бы знания о реальном мире, и существующие системыможно называть лишь экспериментальными, поскольку они работают с ограниченнымколичеством тщательно отобранных шаблонов на ЕЯ.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Прикладная

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> занимается обычно не моделированием, анепосредственно возможностью коммуникации человека с ЭВМ на ЕЯ. В этом случаене так важно, как введенная фраза будет понята с точки зрения знаний о реальноммире, а важно извлечение информации о том, чем и как ЭВМ может быть полезнойпользователю (примером может служить интерфейс экспертных систем). Кромепонимания ЕЯ, в таких системах важно также и распознавание ошибок и ихкоррекция.

Основная проблема обработки естественногоязыка

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Основнойпроблемой

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">является языковая неоднозначность. Существуют разные виды неоднозначности:

·<span Times New Roman""> 

Time flies like an arrow для ЭВМ неясно, идет ли речь овремени, которое летит, или о насекомых, т.е. является ли слово flies глаголом или существительным.

·<span Times New Roman""> 

The man went to the bank to get some money and jumped inслово bank может означать как банк,так и берег.

·<span Times New Roman""> 

in в предложениях He ran the mile in four minutes/Heran the mile in the Olympics обозначает либо время, либо место, т.е.представлены совершенно различные отношения.

·<span Times New Roman""> 

table или cake — соотносится местоимение it во фразе I took the cake fromthe table and ate it.

·<span Times New Roman""> 

Literalness): в диалоге Can you open the door? — I feel coldни просьба, ни ответ выражены нестандартным способом. В других обстоятельствахна вопрос может быть получен прямой ответ yes/no, но в данномслучае в вопросе имплицитно выражена просьба открыть дверь.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Центральная проблема как для общей, таки для прикладной

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">- разрешение такого рода неоднозначностей — решается с помощью переводавнешнего представления на ЕЯ в некую внутреннюю структуру. Для общей <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> такое превращение требует наборазнаний о реальном мире. Так, для анализа фразы <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">Jack took the bread from the supermarket shelf, paidfor it, and left<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">и для корректного ответа на такие вопросы, как <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">What did Jack pay for?<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">, What did Jack leave?<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> и <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">Did Jack have the bread with him when he left<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">?<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> необходимы знания о супермаркетах,процессах покупки и продажи и некоторые другие.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Прикладные системы

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> имеют преимущество перед общими, т.к.работают в узких предметных областях. К примеру, системе, используемойпродавцами в магазинах по продаже компьютеров, не нужно ”раздумывать” наднеоднозначностью слова <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">terminals<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> в <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">вопросе How many terminals are there in the order<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">?<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Тем не менее, создание систем, имеющихвозможность общения на ЕЯ в широких областях, возможно, хотя пока результатыдалеки от удовлетворительных.

Технологии анализа естественного языка

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Под технологией анализа ЕЯподразумевается перевод некоторого выражения на ЕЯ во внутреннее представление.Фактически все системы анализа ЕЯ могут быть распределены на следующиекатегории: подбор шаблона

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">(Pattern Matching<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">), синтаксический анализ, семантическиеграмматики, анализ с помощью падежных фреймов, “жди и смотри” (<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">Wait And See<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">), словарный экспертный (<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">Word Expert<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">), коннекционистский, “скользящий” (<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">Skimming<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">) анализ. Ниже пойдет речь о некоторыхнаиболее распространенных методах, описанных в статье.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Подборшаблона.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Сущностьданного подхода состоит в интерпретации ввода в целом, а не в интерпретациисмысла и структуры его отдельных составляющих на более низком уровне. Прииспользовании этого метода происходит сравнение уже имеющихся в системешаблонов-образцов с текстом, поступившим на вход. Обычно шаблоны представлены ввиде простого списка соответствий между классами высказываний иинтерпретациями. Иногда они дополнены семантическими элементами или другимикомпонентами более высокого уровня. По такому принципу работает система Элиза, имитирующая диалог с психотерапевтом.В действительности система ничего не понимает, а лишь поддерживает диалог, сравниваяреплики пациента с шаблонами и присвоенными им соответствующими ответнымирепликами, такими, как:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">X всегда Y:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Вы можете привести какой-нибудь пример?

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Когда?

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Действительно, всегда?

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">X Вы Y меня:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Почему Вы думаете, что я Y Вас?

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Вам нравится думать, что я Y Вас, не правда ли?

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Представьте, что я Y Вас. Что Вы об этом думаете?

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">В результате Элиза способна вести такой диалог:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Пац.:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Люди всегда пристально смотрят на меня.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">подбор по 1-му шаблону с учетом всегда

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Эл.:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Вы можете привести какой-нибудь пример?

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">первый ответ по 1-му шаблону

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Пац.:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Например, сейчас ты смотришь на меня.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">подбор по 2-му шаблону, Y=смотреть

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Эл.:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Почему Вы думаете, что я смотрю на Вас?

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">первый ответ по 2-му шаблону

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Пац.:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Потому что ты ненавидишь меня.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">подбор по 2-му шаблону, Y=ненавидеть

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Эл.:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Вам нравится думать, что я ненавижу Вас, не правда ли?                                 и т.д.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">второй ответ по 2-му шаблону

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">Синтаксический анализ

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">.<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> При использовании синтаксическогоанализа происходит интерпретация отдельных частей высказывания, а не всеговысказывания в целом. Обычно сначала производится полный синтаксический анализ,а затем строится внутренне представление введенного текста, либо производитсяинтерпретация.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Деревья анализа исвободно-контекстные грамматики

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">.<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Большинство способов синтаксического анализа реализовано в виде деревьев. Однаиз простейших разновидностей — свободно-контекстная грамматика, состоящая изправил типа <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">S=NP+VP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> или <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">VP=V+NP<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> и полагающая, что левая часть правила может быть замененана правую без учета контекста. Свободно-контекстная грамматика широко используетсяв машинных языках, и с ее помощью созданы высокоэффективные методы анализа.Недостаток этого метода — отсутствие запрета на грамматически неправильныефразы, где, например, подлежащее не согласовано со сказуемым в числе. Длярешения этой проблемы необходимо наличие двух отдельных, параллельно работающихграмматик: одной — для единственного, другой — для множественного числа. Крометого, необходима своя грамматика для пассивных предложений и т.д. Семантическинеправильное предложение может породить огромное количество вариантов разбора,из которых один будет превращен в семантическую запись. Всё это делаетколичество правил огромным и, в свою очередь, свободно-контекстные грамматикинепригодными для <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Трансформационнаяграмматика

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">.<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Трансформационнаяграмматика была создана с учетом упомянутых выше недостатков и болеерационального использования правил ЕЯ, но оказалась непригодной для <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">. Трансформационная грамматикасоздавалась Хомским как порождающая, что, следовательно, делало оченьзатруднительным обратное действие, т.е. анализ.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Расширенная сетьпереходов

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">.<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> Расширенная сеть переходов быларазработана Бобровым (<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">Bobrow<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">), Фрейзером (<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">Fraser<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">) и во многом Вудсом (<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">Woods<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">) как продолжение идей синтаксическогоанализа и свободно-контекстных грамматик в частности. Она представляет собойузлы и направленные стрелки, “расширенные” (т.е. дополненные) рядом тестов(правил), на основании которых выбирается путь для дальнейшего анализа.Промежуточные результаты записываются в ячейки (регистры). Ниже приводитсяпример такой сети, позволяющей анализировать простые предложения всех типов(включая пассив), состоящие из подлежащего, сказуемого и прямого дополнения,таких, <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">как The rabbitnibbles the carrot<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> (Кролик грызет морковь)<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">. Обозначения у стрелок означают номертеста, а также либо признаки, аналогичные применяемым в свободно-контекстныхграмматиках (<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">NP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">), либо конкретные слова (<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">by<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">). Тесты написаны на языке <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">LISP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> и представляют собой правила типа если условие=истина, то присвоить анализируемомуслову признак <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">Х<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">и записать его в соответствующую ячейку.<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"><img src="/cache/referats/11380/image002.jpg" v:shapes="_x0000_i1025">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Разберем алгоритм работы сети навышеприведенном примере. Анализ начинается слева, т. е. с первого слова впредложении. Словосочетание

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">the rabbit<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> проходит тест, который выясняет, чтооно не является вспомогательным глаголом (<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">Aux<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">, стрелка 1), но является именной группой (<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">NP<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">, стрелка 2). Поэтому <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">the rabbit<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> кладется в ячейку <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">Subj,<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> и предложение получает признак <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">TypeDeclarative<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">, т.е. повествовательное,и система переходит ко второму узлу. Здесь дополнительный тест не требуется,поскольку он отсутствует в списке тестов, записанных на <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">LISP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">. Следовательно, слово, стоящее после <span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">the rabbit<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> — т. е. <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">nibbles<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> — глагол-сказуемое (обозначение <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">V<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">на стрелке), и <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">nibbles<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> записывается в ячейку с именем <span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">V<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">. Перечеркнутый узел означает, что в нем анализ предложенияможет в принципе закончиться. Но в нашем примере имеется еще и дополнение <span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">the carrot<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">, так что анализ продолжается пострелке 6 (выбор между стрелками 5 и 6 осуществляется снова с помощьюспециального теста), и словосочетание <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">the carrot<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> кладется в ячейку с именем <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">Obj<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">.<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> На этом анализ заканчивается (последний узел был быиспользован в случае анализа такого пассивного предложения, как <span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">The carrot was nibbled by the rabbit<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">). Таким образом, в результатезаполнены регистры (ячейки) <span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">Subj<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">, Type, V<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> и <span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">Obj<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">,<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> используя которые, можно получитькакое-либо представление (например, дерево).

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Расширеннаясеть переходов имеет свои недостатки:

·<span Times New Roman""> 

·<span Times New Roman""> 

·<span Times New Roman""> 

·<span Times New Roman""> 

·<span Times New Roman""> 

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Семантические грамматики

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">.<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Анализ ЕЯ,основанный на использовании семантических грамматик, очень похож насинтаксический, с той разницей, что вместо синтаксических категорий используютсясемантические. Естественно, семантические грамматики работают в узкихпредметных областях. Примером служит система <span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB">Ladder<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">, встроенная в базу данных американских судов. Ее грамматикасодержит записи типа:<span Arial",«sans-serif»; mso-fareast-font-family:«Times New Roman»;mso-bidi-font-family:«Times New Roman»; mso-ansi-language:EN-GB;mso-fareast-language:RU;mso-bidi-language:AR-SA">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">S

®<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">the of

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">®<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»;mso-ansi-language: EN-GB">what is|[can you] tell me

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">®<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">the|class ship

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Такая грамматика позволяетанализировать такие запросы,

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">как Can you tell me the class of the Enterprise? (Enterprise<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">- название корабля). В данной системе анализатор составляет на основе запросапользователя запрос на языке базы данных.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Недостатки семантических грамматиксостоят в том, что, во-первых, необходима разработка отдельной грамматики длякаждой предметной области, а во-вторых, они очень быстро увеличиваются в размерах.Способы исправления этих недостатков — использование синтаксического анализаперед семантическим, применение семантических грамматик только в рамкахреляционных баз данных с абстрагированием от общеязыковых проблем и комбинациянескольких методов (включая собственно семантическую грамматику).

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">Анализ с помощью падежных фреймов

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">.<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> С созданием падежных фреймов связанбольшой скачок в развитии <span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">. Они приобрели популярность после работы Филлмора “Дело опадеже”. На сегодняшний день падежные фреймы — один из наиболее частоиспользуемых методов <span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">, т.к. он является наиболее компьютерно-эффективным прианализе как снизу вверх (от составляющих к целому), так и сверху вниз (отцелого к составляющим).

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Падежный фрейм состоит из заголовка инабора ролей (падежей), связанных определенным образом с заголовком. Фрейм длякомпьютерного анализа отличается от обычного фрейма тем, что отношения междузаголовком и ролями определяется семантически, а не синтаксически, т.к. впринципе одному и то же слово может приписываться разные роли, например,существительное может быть как инструментом действия, так и его объектом.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Общаяструктура фрейма такова:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">[Заголовочный глагол

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">[падежный фрейм

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">агент:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> <активныйагент, совершающий действие>

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">объект:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> <объект, надкоторым совершается действие>

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">инструмент:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><инструмент, используемый при совершении действия>

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">реципиент:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><получатель действия — часто косвенное дополнение>

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">направление:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><цель (обычно физического) действия>

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">место:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> <место, гдесовершается действие>

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">бенефициант:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><сущность, в интересах которой совершается действие>

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">коагент:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> <второй агент,помогающий совершать действие>

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">]]

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Например,для фразы Иван дал мяч Кате падежныйфрейм выглядит так:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">[Давать

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">[падежный фрейм

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">агент:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> Иван

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">объект:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> мяч

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">реципиент:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> Катя]

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">[грам

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">время:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> прош

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">залог:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"> акт]

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">]

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Существуют обязательные, необязательныеи запрещенные падежи. Так, для глагола разбитьобязательным будет падеж объект — безнего высказывание будет незаконченным. Местои коагент будут в данном примеренеобязательными падежами, а направлениеи реципиент — запрещенными.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Часто в

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">NLP<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»"> бывает полезным использоватьсемантическое представление в как можно более канонической форме. Наиболееизвестным способом такой репрезентации являются метод концептуальных зависимостей, разработанный Шенком для глаголовдействия. Он заключается в том, что каждое действие представлено в виде одногоили более простейших действий.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Например,для предложений Иван дал мяч Кате (1) иКатя взяла мяч у Ивана (2), различающихсясинтаксически, но оба обозначающих акт передачи, могут быть построены следующиерепрезентации с использованием простейшего действия Atrans, применяющегося в грамматике концептуальных зависимостей:

<span Times New Roman",«serif»;mso-fareast-font-family:«Times New Roman»; mso-ansi-language:DE;mso-fareast-language:RU;mso-bidi-language:AR-SA">
<span Times New Roman",«serif»; mso-fareast-font-family:«Times New Roman»;mso-ansi-language:DE;mso-fareast-language: RU;mso-bidi-language:AR-SA">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">(1)

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">(2)

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">[Atrans

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">[Atrans

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">отн:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> обладание

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">отн:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> обладание

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">агент:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> Иван

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">агент:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> Катя

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">объект:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> мяч

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">объект:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> мяч

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">источник:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> Иван

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">источник:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> Иван

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">реципиент:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> Катя]

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">реципиент:

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"> Катя]

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">С помощью такого представления легковыявляются сходства и различия фраз.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Для облегчения анализа такжеиспользуется деление роли на лексический маркер и заполнитель. Так, для роли объект может быть установлен маркер прямое дополнение, для роли источник — маркер вида <маркер-из>=из|от|...

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Вобщем анализ текста с помощью падежных фреймов состоит из следующих  шагов:

·<span Times New Roman""> 

·<span Times New Roman""> 

·<span Times New Roman""> 

·<span Times New Roman""> 

·<span Times New Roman""> 

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Преимуществаиспользования падежных фреймов таковы:

·<span Times New Roman""> 

·<span Times New Roman""> 

·<span Times New Roman""> 

Устойчивость анализа

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Определенную трудность при анализепредставляет вариативность одного и того же запроса. Например, на вход системы,управляющей зачислением и перераспределением учащихся на курсах разных специальностей,может поступить запрос типа ПереведитеПетрова, если это возможно, с математики на, скажем, экономику.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Наиболее легко такие трудностипреодолеваются при использовании падежных фреймов. Правило, сформулированноеКарбонеллом и Хейзом, гласит: “Следует пропускать неизвестные введенные элементыдо тех пор, пока не будет найден падежный маркер; пропущенные элементы следуетанализировать с учетом незаполненных падежей, используя только семантику”.

Диалог

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Нарядус проблемой распознавания текста существует и проблема поддержанияинтерактивного диалога. При этом возникают дополнительные особенности,характерные для диалогов, а именно:

·<span Times New Roman""> 

·<span Times New Roman""> 

·<span Times New Roman""> 

·<span Times New Roman""> 

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Кроме того, пользователи систем сестественно-языковым интерфейсом стараются выражаться как можно короче, что вряде случаев также затрудняет анализ.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Использование падежных фреймов, аименно слияние текущего фрейма с предыдущим, обеспечивает восстановлениеэллипсиса.

Заключение

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Таким образом, процесс разработкисистем, обеспечивающих понимание ЕЯ, требует создание механизмов, отличных оттрадиционных способов представлений ЕЯ, а системы с естественно-языковыми интерфейсамиприменяются только в узких предметных областях.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-ansi-language:EN-GB">Encyclopaediaof Artificial Intelligence. Entry NaturalLanguage Understanding, pp. 660-677

еще рефераты
Еще работы по компьютерам и переферийным устройствам