О чём не пишут в книгах по Delphi, Григорьев Антон Борисович

О чём не пишут в книгах по Delphi

на обложку

Григорьев Антон Борисович

Шрифт:

OpSymb := S[P];

Inc(P);

case OpSymb of

'+': Result := Result + Number(S, P);

'-': Result := Result - Number(S, P);

'*': Result := Result * Number(S, P);

'/': Result := Result / Number(S, P);

end;

if P <= Length(S) then

raise ESyntaxError.Create(

'Heкорректный символ в позиции ' + IntToStr(Р));

end;

Код приведен практически без комментариев, т.к. он очень

простой, и все моменты, заслуживающие упоминания, мы уже разобрали в тексте. На прилагаемом компакт-диске находится программа SimpleCalcSample, которая демонстрирует работу нашего калькулятора. Калькулятор выполняет действия над числами слева направо, без учета приоритета операций, т.е. вычисление выражения "2+2*2" даст 8.

Грамматика выражения является простой для разбора, т.к. разбор выражения идет слева направо, и для соотнесения очередной части строки с тем или иным нетерминальным символом на любом этапе анализа достаточно знать только следующий символ. Такие грамматики называются LR(1)-грамматиками (в более общем случае требуется не один символ, а одна лексема). Класс этих грамматик был исследован Кнутом.

Грамматика Паскаля не относится к классу LR(1)-грамматик из-за уже упоминавшейся проблемы отнесения

else

к тому или иному

. Чтобы решить эту проблему, приходится вводить два нетерминальных символа — завершенной формы оператора

(с

else

) и незавершенной (без

else

). Таким образом, встретив в тексте программы лексему

, синтаксический анализатор не может сразу отнести ее к одному из этих символов, пока не продвинется вперед и не натолкнется на наличие или отсутствие

else

. А поскольку оператор

может быть оператором в циклах

for

while

или в операторе

with

, для них также приходится вводить завершенную и незавершенную форму. Именно из-за этой проблемы Вирт (разработчик Паскаля) отказался от идеи составного оператора и модифицировал синтаксис в своем новом языке Оберон таким образом, чтобы проблема

else

не возникала.

Другое достоинство нашей простой грамматики — ее однозначность. Любая синтаксически верная строка не допускает неоднозначной трактовки. Неоднозначность могла бы возникнуть, например), если бы какая-то операция обозначалась символом "." (точка). Тогда было бы непонятно, должно ли выражение "1.5" трактоваться как число "одна целая пять десятых" или как выполнение операции над числами 1 и 5. Этот пример выглядит несколько надуманным, но неоднозначные грамматики, тем не менее, иногда встречаются на практике. Например, если запятая служит для отделения дробной части числа от целой и для разделения значений в списке параметров функций, то выражение

f(1,5)

может, с одной стороны, трактоваться как вызов функции

с одним аргументом 1.5, а с другой — как вызов ее с двумя аргументами 1 и 5. Правила решения неоднозначных ситуаций не описываются в виде БНФ, их приходится объяснять "на словах", что затрудняет разбор соответствующих выражений. Другой пример неоднозначной грамматики — грамматика языков C/C++. В них оператор инкремента, записывающийся как

"++",

имеет две формы записи — префиксную (перед увеличиваемой переменной) и постфиксную (после переменной). Кроме того, этот оператор возвращает значение, поэтому его можно использовать в выражениях. Синтаксически допустимо, например, выражение

а+++b

, но грамматика не дает ответа, следует ли это трактовать как

(а++)+b

или как

а+(++b)

. Кроме того, т.к. существует операция "унарный плюс", возможно и третье толкование —

а+(+(+b))

4.5. Учет приоритета операторов

Следующим нашим шагом станет модификация калькулятора таким образом, чтобы он учитывал приоритет операций, т. е. чтобы умножение и деление выполнялись раньше сложения и умножения.

Дня примера рассмотрим выражение "2*4+3*8/6". Наш синтаксис должен как-то отразить то, что аргументами операции сложения в

данном случае являются не числа 4 и 3, а "2*4" и "3*8/6". В общем случае это означает, что выражение — это последовательность из одного или нескольких слагаемых, между которыми стоят знаки "+" или "-". А слагаемые — это, в свою очередь, последовательности из одного или нескольких чисел, разделенных знаками "*" и "/". А теперь запишем то же самое на языке БНФ (листинг 4.4).

Листинг 4.4. Грамматика выражения с учетом приоритета операций

<Expr> ::= <Term> {<Operator1> <Term>}

<Term> ::= <Number> {<Operator2> <Number>}

<Operator1> ::= '+' | '-'

<Operator2> ::= '*' | '/'

Примечание

Определение символа

совпадает с определением введенного ранее символа

<Sign>

. Но использовать

<Sign>

в определении

<Expr>

было бы неправильно, т.к., в принципе, в выражении могут существовать и другие операции, имеющие тот же приоритет (как, например, операции арифметического или и арифметического исключающего или в Delphi"), и тогда определение

будет расширено. Но это не должно затронуть определение символа

, в которое входит

<Sign>

Чтобы приспособить калькулятор к новым правилам, нужно заменить функцию

Operator

на

Operator1

Operator2

, добавить функцию

Term

(слагаемое) и внести изменения в

Expr