(т.е. в буфере нет лексем), нам придется иметь дело с символами. В данном случае считываем символ и соответствующим образом обрабатываем его. Мы распознаем скобки, операторы и числа. Любой другой символ становится причиной вызова функции
error
, которая прекращает выполнение программы.
default:
error("Неправильная лексема");
Функция
error
описана в разделе 5.6.3 и находится в заголовочном файле
std_lib_facilities.h
.
Необходимо
решить, как представлять разные виды лексем, т.е. выбрать значения, идентифицирующие вид члена. Для простоты отладки мы решили обозначать скобки и операторы соответствующими им символами.
Это позволяет чрезвычайно просто обрабатывать скобки и операторы.
case '(': case ')': case '+': case '–': case '*': case '/':
return Token(ch); // пусть каждый символ представляет себя сам
Честно говоря, мы “забыли” точку с запятой,
';'
, для вывода и букву
q
в первой версии. Мы не будем добавлять их, пока в них не возникнет потребность во второй версии.
6.8.3. Считывание чисел
Осталось обработать числа. На самом деле это не просто. Действительно, как узнать значения числа
123
? Хорошо, оно равно
100+20+3
. А что вы скажете о числе
12.34
? Следует ли принять научную систему обозначения, такую как
12.34е5
? Мы могли бы провести часы и дни, решая эту задачу, но, к счастью, это не обязательно. Потоки ввода в языке С++ распознают литералы и сами умеют переводить их в тип
double
. Все, что нам нужно, — как-то заставить поток
cin
сделать это в функции
get
.
case '.':
case '0': case '1': case '2': case '3': case '4': case '5':
case '6': case '7':
case '8': case '9':
{ cin.putback(ch); // возвращаем цифру в поток ввода
double val;
cin >> val; // считываем число с плавающей точкой
return Token('8',val); // пусть символ '8' обозначает "число"
}
Мы в некотором смысле произвольно решили, что символ
'8'
будет представлять число в классе
Token
. Как узнать, что на вход поступило число? Хорошо, зная по опыту или изучая справочник по языку С++ (например, в приложении А), можно установить, что числовой литерал должен начинаться с цифры или символа
'.'
(десятичной точки). Итак, этот факт следует проверить. Далее, мы хотим, чтобы поток
cin
считывал число, но мы уже считали первый символ (цифру или десятичную точку), поэтому пропуск оставшейся части лексемы приведет к ошибке. Можно попытаться скомбинировать значение первого символа со значением оставшейся части; например, если некто ввел число
123
, можем взять число
1
, а поток
cin
считает число
23
, и нам останется лишь сложить
100
и
23
. Это тривиальный случай.
К счастью (и не случайно), поток
cin
работает точно так же, как поток
Token_stream
, в том смысле, что мы можем вернуть в него символ обратно. Итак, вместо того чтобы выполнять сложные арифметические действия, мы возвращаем первый символ обратно в поток
cin
и позволяем ему считать все число.
Пожалуйста, обратите внимание на то, как мы снова и снова избегаем сложностей и вместо этого находим простые решения, часто полагаясь на библиотеки. В этом заключается смысл программирования: постоянно искать простые решения. Иногда в шутку говорят: “Хороший программист — ленивый программист”. Это означает, что мы должны быть ленивыми (в хорошем смысле): зачем писать длинную программу, если можно написать короткую?
6.9. Структура программы
Как утверждает пословица, за деревьями трудно увидеть лес. Аналогично, легко потерять смысл программы, просматривая все ее функции, классы и т.д. Давайте рассмотрим программу, пропуская ее детали.
Token_stream ts; // содержит функции get и putback
double expression; // объявление, позволяющее функции primary
// вызывать функцию expression
double primary {/* ... */} // обрабатывает числа и скобки
double term {/* ... */} // обрабатывает операции * и /
double expression {/* ... */} // обрабатывает операции + и –
int main {/* ... */} // основной цикл и обработка ошибок
Порядок следования объявлений важен. Мы не можем использовать имя, пока оно не объявлено, поэтому объект ts должен быть объявлен до того, как будет вызвана функция
ts.get
, а функция
error
должна быть объявлена до функций грамматического анализа, поскольку они используют ее. В графе вызовов существует интересный цикл: функция
expression
вызывает функцию
term
, которая вызывает функцию
primary
, которая вызывает функцию
expression
.
Эту ситуацию можно проиллюстрировать графически (удалив вызовы функции
error
).
Это значит, что мы не можем просто определить эти три функции: не существует такого порядка их следования, при котором вызываемая функция была бы определена заранее. Таким образом, необходимо объявление, которое не было бы определением. Мы решили объявить “наперед” функции
expression
.
Работает ли эта программа? Работает, если придать этому слову определенный смысл. Она компилируется, запускается, правильно вычисляет выражения и выдает осмысленные сообщения об ошибках. Но работает ли она так, как мы от нее ожидаем? Не удивительно, что на самом деле она работает не совсем так, как надо. Мы испытали первую версию в разделе 6.6 и удалили серьезные ошибки. Однако вторая версия (см. раздел 6.7) не намного лучше, хотя в этом нет ничего страшного (это было вполне предсказуемо). Программа вполне успешно выполняет свою основную задачу и позволяет проверить основные идеи. В этом смысле она вполне успешна, но как только вы станете работать с ней, получите массу проблем.