В нашей грамматике переменной будет называться отдельно стоящий идентификатор, функцией — идентификатор, после которого в скобках записан аргумент, в качестве которого может выступать любое допустимое выражение (для простоты мы будем рассматривать только функции с одним аргументом, т.к. обобщение грамматики на большее число аргументов очевидно). Другими словами, определение будет выглядеть так:
<Variable> ::= <Identifier>
<Function> ::= <Identifier> ' (' <Expr> ')'
Из приведенных определений видно, что грамматика, основанная на них, не относится к классу LR(1)-грамматик, т.к. обнаружив
в выражении идентификатор, анализатор не может сразу решить, является ли этот идентификатор переменной или именем функции, это выяснится только при проверке следующего символа — скобка это или нет. Тем не менее реализация такой грамматики достаточно проста, и это не будет доставлять нам существенных неудобств.
Переменные и функции, так же, как и выражения, заключенные в скобки, выступают в роли множителей. Соответственно, их появление в грамматике учитывается расширением смысла символа
<Factor>
.
<Factor> ::= <UnaryOp> <Factor> |
<Variable> |
<Function> |
<Number> |
'(' <Expr> ')'
Теперь рассмотрим свойства оператора возведения в степень. Во-первых, его приоритет выше, чем у операций сложения и деления, т.е. выражение
a*b^c
трактуется как
a*(b^c)
, а
a^b*c
— как
(a^b)*c
. Во-вторых, он правоассоциативен, т.е.
a^b^c
означает
a^(b^c)
, а не
(a^b)^c
. В-третьих, его приоритет выше, чем приоритет унарных операций, т.е.
– a^b
означает
– (a^b)
, а не
(-а)^b
. Тем не менее,
a^-b
означает
a^(-b)
.
Таким образом, мы видим, что показателем степени может быть любой отдельно взятый множитель, а основанием — число, переменная, функция или выражение в скобках, т.е. любой множитель, за исключением начинающегося с унарного оператора. Запишем это в виде БНФ.
Правая ассоциативность также заложена в этих определениях. Рассмотрим, как будет разбираться выражение
a^b^c
. Сначала функция
Factor
(через вызов функции
Base
) выделит и вычислит множитель а, а потом вызовет саму себя для вычисления остатка
b^c
. Таким образом, а будет возведено в степень
b^c
, как это и требуют правила правой ассоциативности. Вообще, вопросы правой и левой ассоциативности операторов, которые мы здесь опустили, оказывают влияние на то, как определяется грамматика языка. Более подробно об этом написано в [5].
Так как определения символов
<Expr>
и
<Term>
в нашей новой грамматике не изменились, не изменятся и соответствующие функции. Для реализации нового синтаксиса нам потребуется изменить функцию
Factor
и ввести новые функции
Base
,
Identifier
и
Func
(примем такое сокращение, т.к.
function
в Delphi является зарезервированным
словом). Идентификаторы будем полагать нечувствительными к регистру символов.
Для простоты обойдемся тремя функциями:
sin
,
cos
и
ln
. Увеличение количества функций, допустимых в выражении, — простая техническая задача, не представляющая особого интереса.
Если у нас появились переменные, то мы должны как-то хранить их значения, чтобы при вычислении выражения использовать их. В нашем примере мы будем хранить их в объекте типа
TStrings
, получая доступ через свойство
Values
. С точки зрения производительности, этот способ — один из самых худших, поэтому при создании реального калькулятора лучше придумать что-нибудь другое. Мы здесь выбрали этот способ исключительно из соображений наглядности. Получившийся в итоге код показан в листинге 4.9.
Листинг 4.9. Реализация полноценного калькулятора
// вычисление функции, имя которой передается через FuncName
function Func(const FuncName, S: string; var Integer): Extended;
var
Arg: Extended;
begin
// Вычисляем аргумент
Arg := Expr(S, P);
// Сравниваем имя функции с одним из допустимых
if AnsiCompareText(FuncName, 'sin') = 0 then
Result := Sin(Arg)
else if AnsiCompareText(FuncName, 'соs') = 0 then
Result := Cos(Arg)
else if AnsiCompareText(FuncName, 'ln') = 0 then
Result := Ln(Arg)
else
raise ESyntaxError.Create('Неизвестная функция ' + FuncName);
end;
// Выделение из строки идентификатора и определение,
// является ли он переменной или функцией
function Identifier(const S: string: var P: Integer): Extended;
var
InitP: Integer;
IDStr, VarValue: string;
begin
// Запоминаем начало идентификатора
InitP := P;
// Первый символ был проверен ещё в функции Base.
// Сразу переходим к следующему
Inc(P);
while (P <= Length(S)) and
(S[P] in ('A'..'Z', 'a'..'z', '_', '0'..'9']) do
Inc(P);
// Выделяем идентификатор из строки
IDStr := Copy(S, InitP, P - InitP);
// Если за ним стоит открываемая скобка — это функция