Метка ‘предложения’

Пропозиционализация

Все это рассуждение потребовалось нам для того, чтобы подвести к утверждению, что пропозиционализация заключается отчасти в выделении из события (или ситуации) предметов, в нем участвующих. Предположим, например, что я думаю об определенном событии. Я могу вербализовать мое знание этого события в виде "Потом я съел сандвич", выбрав для вербализации два предмета — себя и сандвич. То же самое исходное событие я могу вербализовать как "Потом я поел", с выделением только субъекта, себя, или, возможно, как "Потом я съел салями в сандвиче", где салями включено в качестве третьего предмета. Обычно существуют несколько различных способов, с помощью которых объекты могут быть выделены из события, это и есть один из аспектов интерпретации события говорящим.
В некоторой степени описанный здесь процесс аналогичен процессу разбиения больших эпизодов на меньшие эпизоды, но между ними есть два различия. Во-первых, объекты, выделяемые из события,— это явления иного рода, чем само событие. Во-вторых, само событие не теряется при этом процессе. В конечной вербализации событие обычно представлено глаголом, например словом "съел" в предложениях, приведенных выше. Таким образом, если рассуждать в терминах последовательных подстановок, то при расчленении эпизодов больший эпизод заменяется сочетанием меньших эпизодов, а при пропозиционализации эпизод заменяется сущностью иного рода: структурой, состоящей из события (или ситуации) плюс — в качестве отдельных элементов — предметы, которые говорящий выбрал для вербализации в качестве участников события. Подобная структура примерно соответствует тому, что традиционно называется суждением (proposition), и мы можем представить ее, например, как „съел (я, сандвич)" или другими эквивалентными способами нотации.
Но это еще не все, что можно сказать о подобной структуре. Важно отметить, что каждый из предметов, выбранных для отдельной вербализации, играет свою особую роль в событии или ситуации. Главный вклад так называемой падежной грамматики заключается в осознании существования и значения этих ролей. Так, предложение "Потом я съел сандвич" содержит не только вычлененные из целостного события идеи "меня" и "сандвича", но также и решение рассматривать "меня" как "агенса" события, а "сандвич" — как "пациенса". Имена, которые мы даем этим ролям, не являются предметом обсуждения настоящей статьи; единственно, что хочется заметить, это то, что предметы, ассоциируемые с событием, участвуют в нем по-разному. Стандартная нотация, принятая для суждений, является неполной, потому что не дает фиксированного способа указания на эти роли. Я не буду больше говорить здесь о том, какие бывают конкретные роли или каким способом их лучше всего обозначать. Я полагаю, что необходим новый способ выделения падежных ролей, но тот факт, что они существуют и важны для вербализации, не подлежит сомнению.

Неполные входы

Если пользователь только что задал вопрос What is the salary of Eric Johnson? 'Каково жалованье Эрика Джонсона?', а затем желает узнать его служебное положение и дату поступления на работу, гораздо удобнее и естественнее спросить: POSITION AND DATE HIRED 'Должность и дата поступления на работу', чем педантично печатать WHAT IS THE POSITION AND DATE HIRED OF ERIC JOHNSON. Учет склонности человека сокращать входной текст — важный фактор разработки прикладных систем. Хотя некоторые системы позволяют определить грамматику так, что она допускает неполные предложения в качестве "полных" входов 5, в LIFER это не является необходимым, так как система автоматически выводит возможные эллиптические (то есть неполные) структуры на основе грамматик, определенных для полных конструкций. (См. выше диалог 2).
Сначала LIFER пытается проанализировать входной текст как полное предложение 6. Только в случае, если такой анализ не срабатывает, система включает программу эллиптического разбора. Для уведомления пользователя об этой смене программ LIFER печатает сообщение TRYING ELLIPSIS 'попытка использования программы эллипсиса', когда запускается программа разбора эллипсиса. Если разбор неполного предложения прошел успешно, система снабжает пользователя дополнительной информацией, печатая после слов TRYING ELLIPSIS полный вариант неполного входного текста, который замещает сообщение PARSED! (печатаемое в случае полного входного текста). Входы 2—5 — различные неполные варианты одной и той же структуры входного предложения, а именно входа 1. Вход 2 вызывает замену атрибутов. Во входах 3—5 меняются лица, о которых запрашиваются сведения. Следует отметить, что во входе 5 запрашиваются сведения о положении и дате зачисления целой группы людей.

Реализация программы обработки эллипса

Механизм обработки эллиптических входных сообщений системы LIFER пользуется тем, что спецификации языков прикладных систем имеют тенденцию в синтаксических категориях кодировать значительное количество семантической информации. Так, сходные синтаксические конструкции обычно близки семантически. Обработка эллипсисов в LIFER основывается на этом понятии схожести. В процессе разбора эллипсиса LIFER допускает любую цепочку слов, которая синтаксически сходна с любой подцепочкой смежных слов в последнем входном сообщении. (Если последнее входное сообщение было неполным, используется его расширение до полного предложения.) При поиске аналогии LIFER обращается к синтаксическому дереву последнего входного предложения, которое было успешно проанализировано системой. Для любой подцепочки смежных слов в последнем входном предложении может быть определен "образец аналогии" с помощью программы абстрагирования, работающей над старым синтаксическим деревом от слов подцепочки к корню дерева. Как только синтаксическое дерево показывает, что часть подцепочки является полным расширением некоторой синтаксической категории, данная часть замещается именем категории. Образец аналогии — это конечный результат всех таких замен.Механизм перифразирования в LIFER также использует семантически, ориентированные синтаксические категории и синтаксические деревья. В типичном случае механизму перифразирования дается модель предложения, которое система уже может понять, и перифраза. Общая стратегия механизма перифразирования — проанализировать предложение-модель и затем найти похожие структуры в перифразе.

Реализация системы перифразирования

В частности, механизм перифразирования побуждает анализатор построить синтаксическое дерево предложения-модели. Используя это дерево, механизм перифразирования определяет все правильные подфразы модели, то есть все подцепочки, являющиеся полным расширением одной из синтаксических категорий, имеющихся в дереве. Предполагается, что любая из этих подфраз предложения-модели, которые также имеются в перифразовой цепочке, играет ту же роль в перифразе, что и в самой модели. Так, семантически ориентированные синтаксические категории, которые объясняют эти подфразы в модели, вновь используются для объяснения соответствующих подфраз перифразы. Более того, отношения между синтаксическими категориями, которые имеются в синтаксическом дереве модели, формируют основу для установления отношений между соответствующими синтаксическими единицами, выведенными и для перифразы.Для нахождения соответствия между моделью и перифразой, подфразы модели прежде всего классифицируются. Более длинные фразы предпочтительнее более коротких, а из двух фраз одной и той же длины первой берется левая крайняя.Начиная с первой (наиболее длинной) подфразы, подфразы сопоставляются с последовательностями в перифразо-вой цепочке. (Если некоторая подфраза совмещается с двумя последовательностями слов, используется только крайнее левое совмещение.) Более длинным подфразам отдается предпочтение, так как их совмещения приведут к обобщениям, включающим совмещение для более коротких содержащихся в них фраз. Как только найдено некоторое совмещение, совпавшая последовательность слов в перифразе замещается синтаксической категорией, связанной с соответствующей подфразой. Этот процесс продолжается до тех пор, пока сопоставления не будут испробованы для всех подфраз.

Определение функции ответа для правила порождения перифразы

Новая семантическая функция, указывающая, как отвечать на входы, подходящие к данному правилу порождения, программируется автоматически на основе информации, содержащейся в синтаксическом дереве предложения-модели. В частности, синтаксическое дерево указывает, какие правила порождения использовались в модели для расширения различных синтаксических категорий. С каждым из этих правил связана функция, которая вычисляет интерпретацию соответствующих подфраз, исходя из их составляющих. Механизм перифразирования вновь использует выбранные функции модели для создания новой функции для правила порождения перифразы. Как это происходит, лучше всего показать на примере.Синтаксическое дерево указывает, что расширение для (PRESENT) не зависит от расширений (EMPLOYEE) и (ATTRIBUTE). Поэтому механизм перифразирования принимает, что при вычислении функции FN значение #(PRESENT) является константой. Другими словами, значение (PRESENT), используемое в модели, всегда будет использоваться как значение (PRESENT) при вычислении функции FN в терминах функции FI.
Напротив, (ITEM), как показывает синтаксическое дерево, включает и (EMPLOYEE) и (ATTRIBUTE). Следовательно, оба эти параметра в FN могут повлиять на значение #(1ТЕМ).

Обзор анализаторов

На протяжении последних десяти лет исследователи, работающие в рамках нашего проекта, разработали и запрограммировали большое число анализаторов. Задача этих анализаторов состояла в преобразовании исходных выражений естественного языка в некоторое внутреннее представление. (Заметим, что первая фаза процесса понимания традиционно соотносится с выявлением синтаксической формы входного сообщения.) Однако термин "анализ" (parsing) с не меньшим основанием может быть применен к первой фазе понимания в любом ее истолковании. В этой статье мы рассмотрим некоторые из проблем, возникших в ходе создания наших анализаторов, и представим новую теорию анализа, моделирующую реальный процесс понимания, как он осуществляется в ходе обычного чтения текста; опишем программу, которая реализует эту теорию и понимает газетные сообщения на тему о терроризме.Все наши анализаторы были программами, которые преобразовывали английские предложения в представления их значений в рамках теории концептуальных зависимостей (КЗ). В основе их построения всегда лежало методологическое допущение о том, что используемый алгоритм анализа должен быть как можно более адекватным в психологическом плане. Таким образом, наши анализаторы предназначены для моделирования того способа анализа, которым, как мы полагаем, пользуются люди. Это методологическое допущение повлекло за собой операционный принцип, соблюдавшийся, за одним исключением, во всех случаях (которые мы обсудим ниже), а именно, что алгоритм анализа движется по тексту слева направо и осуществляет его просмотр один раз, не допуская возврата. Эти анализаторы не были рассчитаны на обработку предложений, похожих на настоящие "садовые тропинки", когда в процессе понимания людям приходится осуществлять возврат назад.
Первый анализатор, который мы разработали (Schank and Т е s 1 е г, 1969), использовал так называемые "правила реализации" и преобразовывал английские синтаксические структуры в КЗ. (Этот термин, взятый из Lamb, 1966, означал, что мы соотносили один языковой уровень с другим.) Главный недостаток этого анализатора состоял в том, что он нарушал нашу методологическую установку на моделирование процессов, осуществляемых человеком. Для многих английских предложений, которые были неоднозначными, применявшийся нами алгоритм не мог определять предпочтительность одной интерпретации по сравнению с другой, хотя люди явно владеют такого рода предпочтениями.
В работе S с h a n k et al., 1970 мы предложили некоторое решение для устранения этого недостатка и реализовали новые принципы при построении нового анализатора, который мы назвали SPINOZA II. SPINOZA II должен был для управления ходом анализа использовать само представление КЗ. Это значит, что в процессе анализа значение любого понятого сегмента (от начала предложения) должно помогать при определении значения остальной части предложения.

Анализатор SPINOZA-II

Анализатор SPINOZA-II был закончен лишь отчасти, когда мы вынуждены были от него отказаться по соображениям не академического порядка. Было предпринято несколько попыток продолжить разработку этого анализатоpa, пока Крис Ризбек не создал анализатор, который был похож на SPINOZA-II по идее, но отличался по форме (см. R i е s b е с к, 1975). Программа этого анализатора была основана на так называемых запросах, представлявших собой особую форму проверки выполнения заданных условий (см. Newell, 1973). Запросы активизиррвались каждый раз, когда могли быть выдвинуты ожидания о некоторой синтаксической или семантической информации, и выполнялись, если включенные в них ожидания оказывались истинными. Таким образом, анализ направлялся посредством ожиданий, что делало систему Ризбека, позже названную ELI, сильно ориентированной на анализ "сверху вниз" (см. R i е s b е с k and Schank, 1976).
ELI была использована в роли "приставки" к системе SAM, нашей системе понимания, основанной на сценариях (Schank et al., 1975; С u 1 1 i n g f о г d, 1978), и была объединена с работой Гершмана (G е г s h m a n, 1977) по именным группам, что привело к созданию анализатора, который мог обрабатывать очень сложные по структуре предложения.
Одним из главных недостатков ELI является ее "негибкость". Грейнджер (Granger, 1977) создал для ELI дополнительный компонент — FOUL-UP, который определяет значение неизвестных слов в контексте, и это придало системе некоторый запас прочности. Но в повседневной практике исследователи приходили к выводу, что проще создавать особые анализаторы, предназначенные для специальных целей и построенные по типу ELI, которые являются менее громоздкими и более удобными при пользовании. Например, программа POLITICS Карбонелля (С а г-b о n е 1 1, 1979) — модель субъективного понимания политических событий — использует анализатор, сходный с ELI, но построенный самим Карбонеллем.
Может быть, самый важный итог работы Карбонелля состоит в том, что она выявила для всех нас основную ошибку, характерную для наших рассуждений о построении больших понимающих систем. Мы всегда склонялись к принципу модульности в проектировании наших программ как потому, что это всегда рассматривалось как хороший стиль в программировании, так и потому, что, поскольку наши системы являются очень большими, каждый отдельный модуль часто составлял тему работы отдельного человека.

Модуальность

Однако эта модульность явилась причиной целого ряда трудностей. При таком подходе система, которую мы строим, должна, например, в идеале, использовать ELI на первом этапе анализа (в качестве "приставки"). Но на практике ELI оказывается очень большой и громоздкой программой. Далее, возникает еще одна практическая проблема, а именно: словарь для любой новой области, в которой должна работать создаваемая система, является, скорее всего, новым для ELI. Поскольку в ELI определения слов являются в известном смысле сами программами, всякая новая система в любом случае потребует написания большой части соответствующей анализирующей программы с самого начала. Эта практическая проблема приводит, далее, к гораздо более интересному вопросу. Подобно тому как несколько лет назад мы осознали, что для построения более интегрированной анализирующей системы важно воспользоваться силой имевшихся у нас представлений КЗ, точно так же любой новый анализатор, разрабатываемый для новой системы, должен в принципе пользоваться результатами, полученными на более высоких уровнях понимания, которые являются частью новой системы. Так, система POLITICS может проводить анализ более эффективно, если она использует не только частично построенное представление КЗ для того фрагмента текста, который она уже поняла, но также и его место в идеологии, которую использует эта программа, его общую значимость и т. д. С этой точки зрения модульность оказывается весьма серьезным недостатком. Почему не извлекать выгоду из всего, что имеется в нашем распоряжении и может помочь в процессе анализа? Тот факт, что для осуществления анализа люди используют только синтаксис и некоторые конкретные семантические признаки (именно эти, а не другие), является не более вероятным, чем то, что они используют только чистый синтаксис. Понимание является в полном смысле этого слова интегральным процессом. Приверженность принципу построения модульных систем помешала прогрессу в автоматизации анализа, потому что эта задача требует использования наших знаний в полном объеме; это, очевидно, необходимо и для разрешения неоднозначности предложения, и для выявления подходящих смыслов слова, и, что не менее важно (как мы увидим ниже в этой статье), для принятия решений о том, что в тексте следует игнорировать.

Время обработки в ходе анализа

Одним из главных факторов, которые необходимо учитывать, на наш взгляд, при рассмотрении устройства анализатора, является скорость, с которой люди могут читать текст. Если учесть вывод умозаключений, а также обращение к фоновому знанию и другие проблемы, с которыми человеку приходится иметь дело в ходе чтения или слушания предложения, то следует заключить, что люди решают задачу понимания очень быстро. Они заканчивают понимание большей частью в тот момент, когда перестает звучать то предложение, которое они слушают. Отсюда следует, что время, которым они располагают для вывода умозаключений и применения знаний, не может растягиваться до конца предложения и продолжаться после того, как закончится анализ. Наоборот, такие дополнительные процессы должны осуществляться в то же самое время, когда осуществляется анализ. Это подтверждается психологическими данными; см., например, работу Marslen — Wilson, 1975. В указанной работе исследуются ошибки в повторении предложений и показывается, что на протяжении всего времени чтения предложения должна происходить обработка информации на высших уровнях. Такое заключение, несомненно, придает гораздо больший вес той гипотезе, которую мы сформулировали выше. Из нее следует, что процессы, происходящие у человека, носят в высокой степени интегральный характер. Иначе говоря, люди должны выводить умозаключения из ранних частей предложения до того, как они услышат его последующие части. Если это так, то отсюда также следует, что люди будут использовать все, что им удастся обнаружить; тем самым проблемы установления смысла слов и другие оказываются под влиянием процессов высших уровней. Таким образом, с точки зрения моделирования процессов обработки информации человеком, проекты анализаторов, которые сначала полностью осуществляют свою работу, а затем отсылают свои результаты в блоки логического вывода, не имеют смысла.
Из сказанного вытекает также и еще одно следствие. Мы должны задаться вопросом: когда происходит этот тип обработки, не направленной непосредственно на анализ? Существуют два возможных ответа. Либо люди используют параллельные процессы, и все это происходит буквально в одно и то же время, либо (если обработка является последовательной) для указанного типа обработки должно быть сэкономлено время за счет чего-то другого. Этим "чем-то другим" является, вероятно, полная обработка каждого воспринимаемого слова.

Последовательная организация обработки

Итак, последовательная организация обработки предполагает такую модель анализа, при которой он осуществляется местами неполно. Как мы указывали в другой работе (Schank, 1975), процесс осуществления полного анализа чрезвычайно сложен. Несколько упрощая, можно сказать, что прочтение слова занимает п миллисекунд, а полная обработка слова — m миллисекунд. Поскольку весьма вероятно, что в случае обычной речи и чтения m намного больше, чем п, и поскольку при обычной речи и чтении слова поступают в виде непрерывного потока, то очевидно, что люди не в состоянии полностью обрабатывать каждое слово, которое они слышат. Более вероятной представляется такая организация этих процессов, при которой они решают, на что в ходе анализа обратить серьезное внимание, а к чему отнестись небрежно. Такие решения можно объяснить многими факторами. Один из наиболее очевидных — это интерес. Иначе говоря, люди склонны обращать внимание на то, что им интересно (именно этому посвящая отведенное на обработку время). Мы обсуждали понятие интереса и его разновидности применительно к проблеме вывода умозаключений (Schank, 1978). Главный наш постулат состоял в том, что вывод умозаключений управляется интересом. Вероятно, аналогичный постулат справедлив и по отношению к излагаемой пересмотренной концепции процесса анализа, потому что теперь мы рассматриваем весь процесс понимания как интегральный феномен.Интуитивно ясно, что некоторые части этого предложения более интересны, чем другие. Более того, согласно высказанным выше соображениям о количестве времени обработки, которым мы располагаем, чрезвычайно существенно, что обработка некоторых слов должна занимать меньше времени, чем время, требуемое для того, чтобы прочитать или услышать их. Правда, на первый взгляд это может показаться несколько странным. Каким образом слово может обрабатываться за меньший промежуток времени, чем то время, которое требуется, чтобы прочитать или услышать его, если само прочтение или восприятие его на слух является частью этой обработки? Тем не менее мы находимся именно в такой парадоксальной ситуации, если, конечно, мы придерживаемся того взгляда, что обработка любого отдельного слова в предложении может потребовать больше времени, чем нужно для его прочтения или восприятия на слух; при этом обработка предложения в целом занимает не больше времени, чем требуется для восприятия его на слух, и к тому же разные слова поступают с такой скоростью, что между ними нет временных интервалов, которые могли бы использоваться для обработки. (Дело обстоит, очевидно, именно таким образом, ибо простое нахождение словесных границ в предложении является очень сложной задачей, потому что речевой поток непрерывен.)