Программирование на языке пролог
Шрифт:
5.3. Ввод предложений
Вэтом разделе мы представим программу, которая вводит предложение с терминала и преобразует его в список атомов языка Пролог. В программе определяется предикат ввести,имеющий один аргумент. Программа должна уметь определять, где заканчивается одно вводимое слово и начинается следующее. Поэтому предположим, что слово состоит из нескольких букв, цифр или специальных литер. Буквы и цифры уже были представлены в разд. 2.1. Мы будем рассматривать одиночную кавычку ''' и дефис '-' как специальные литеры. Литеры
, ; : ? ! .
будут рассматриваться как отдельные слова. Все другие литеры являются разделителями между словами. Предложение считается законченным, когда встречается одно из слов '.', '!'
?- ввести(S).
The man, who is very rich, saw John's watch.
S = [the,man,',',who,is,very,rich,',',saw,'John's',watch,'.']
В действительности мы вставили в представление предложения дополнительные одинарные кавычки, чтобы выделить некоторые атомы.
Программа использует предикат get0для ввода литер с терминала. Затруднение, связанное с предикатом get0, состоит в том, что если литера прочитана с терминала этим предикатом, то она «ушла навсегда» и никакое другое целевое утверждение get0или попытка вновь доказать целевое утверждение get0не позволит получить доступ к этой литере вновь. Поэтому следует избегать возврата за точку использования get0, если мы хотим избежать «потери» литеры, которую он читает. Например, следующая программа, которая должна вводить литеры и печатать их снова, заменяя литеры ана b(код литеры 97на код 98), не будет работать:
выполнить:- заменить_литеру, выполнить.
заменить_литеру:- get0(X) = 97,!, put(98).
заменить_литеру:- get0(X), put(X).
Приведенную программу в любом случае нельзя считать хорошей, потому что она будет работать вечно. Однако рассмотрим эффект попытки доказать согласованность целевого утверждения заме-нить_литеру.Если первое правило определения предиката заме-нить_литеру используется для чтения литеры, код которой отличен от 97, то возврат приведет к тому, что будет сделана попытка воспользоваться вместо него вторым правилом. Однако согласование целевого утверждения get0(X)во втором правиле приведет к тому, что X будет конкретизирована следующейлитерой. Это объясняется тем, что доказательство исходного целевого утверждения get0было необратимымпроцессом. Таким образом, эта программа в действительности не печатала бы все литеры. Она даже иногда печатала бы литеры а.
Как же программа ввестипреодолеет проблемы возврата при вводе? Ответ заключается в том, что программа конструируется таким образом, что она вводит литеры с опережением на одну литеру, а проверки литеры выполняются правилом, отличным от правила, в котором эта литера была прочитана. Если литера введена в каком-то месте программы и не может быть здесь же использована, то она возвращается обратно для возможного использования другими правилами. В соответствии со сказанным предикат для ввода одного слова читать_слово в действительности имеет три аргумента. Первый предназначен для литеры, которая была получена при последнем выполнении get0где-либо в программе, но которую оказалось невозможным использовать в месте ее получения. Второй предназначен для атома, который будет создан для прочитанного слова. Последний аргумент предназначен для литеры, следующей во вводимом предложении сразу за прочитанным словом. Для того чтобы определить, где кончается слово, необходимо ввести литеру, следующую непосредственно за словом. Эта литера должна быть сохранена, потому что она может оказаться первой литерой другого слова.
Здесь приведен текст программы:
/* Прочитать предложение */
ввести([Сл|Слс]):- get0(C), читать_слово(С,Сл,С1), остаток_предложения(Сл, С1, Слс).
/* Дано слово и литера после него, ввести остаток предложения */
остаток_предложения (Сл,_,П):-
остаток_предложения(Сл,С,[Сл1|Слс]):- читать_слово(С, Сл, С1), остаток_предложения(Сл1,С1,Слс).
/* Ввести одно слово, имея начальную литеру и запомнив, какая литера идет после слова */
читать_слово(С,Сл,С1):- литера(С),!, name(Сл,С), get0(C1).
читать_слово(С,Сл,С2):- слово(С, Нс),!,get0(Cl),
остаток_слова(С1,Сс,С2),name(Сл,[Нс|Сс]).
читать_слово(С,Сл,С2):-get0(Cl), читать_слово (С1, Сл,С2).
остаток_слова(С,[Нс|Сс],С2):-слово(С,Нс),!,get0(Cl),остаток_слова (С1, Сс, С2 ).остаток_слова(С, [],С).
/* Эти литеры образуют отдельные слова */
литера(44) /*, */
литера(59) /*; */
литера(58) /*: */
литера(63) /*? */
литера(ЗЗ) /*! */
литера(46) /*. */
/* Следующие литеры могут встретиться внутри слова */
/* Второй факт для предиката словопреобразует прописные литеры в строчные
слово(С,С):- С › 96, С ‹ 123. /* a b… */
слово(С,М):- С › 64, С ‹ 91, M is С+ 32. /*А В… */
слово(С,С):- С › 47, С ‹ 58 /* 1 2… 9*/
слово(39,39). /* ' */
слово(45,45) /* – */
/* Следующие слова заканчивают предложение */
последнее_слово('.').
последнее_слово('!').
последнее_слово('?').
Упражнение 5.1.Объясните, для чего используется каждая переменная в приведенной программе.
Упражнение 5.2.Напишите программу, которая читает неограниченную последовательность литер и печатает ее, предварительно заменяя вхождения литеры алитерой b.
5.4. Чтение файлов и запись в файлы
Предикаты, обсуждавшиеся в этой главе ранее, использовались для ввода (чтения) и вывода (записи) данных при обмене лишь с терминалом, но они могут быть использованы и в более общих ситуациях. В Пролог-системе определяется текущий входной поток данных,из которого производится чтение всех вводимых данных. Все выводимые данные записываются в текущий выходной поток данных.В обычном состоянии текущий входной поток данных поступает с клавиатуры терминала, а текущий выходной поток данных направляется на дисплей терминала. Часто оказывается удобно выполнять операции чтения и записи данных над файлами,которые представляют последовательность литер во вторичной внешней памяти. Конкретный вид этой памяти зависит от используемой ЭВМ, но сейчас файлы обычно хранятся на магнитных дисках. Предполагается, что каждый файл имеет собственное имя(имя файла),используемое для идентификации файла. Для того чтобы содержание этой главы было понятно, читателю следует познакомиться с правилами организации и способом задания имен файлов в той операционной обстановке, в которой он работает. В Прологе имена файлов представляются атомами, но мы не можем исключить возможность каких-либо ограничений на синтаксис имен файлов, накладываемых конкретной обстановкой, в которой работает Пролог-система.
Файлы имеют определенную длину. Это означает, что они содержат определенное количество литер. В конце файла имеется специальный маркер, называемый маркером конца файла.Мы не обсуждали маркер конца файла до сих пор, так как выход на конец файла является более обычным делом для файлов, расположенных во внешней памяти, чем при обмене с терминалом. Если программа производит чтение файла, то маркер конца файла может быть обнаружен и в случае, когда программа читает термы и когда читаются отдельные литеры. Если при выполнении get0(X)встречается конец файла, то Xбудет конкретизирована некоторой управляющей литерой, обычно имеющей код 26 в таблице кодов ASCII. Если конец файла встречается при выполнении read(X), то Xбудет конкретизирована некоторым специальным термом, значение которого зависит от конкретной Пролог-системы. При попытке прочитать файл далее маркера конца возникает ошибка.