'2': case '3': case '4':
case '5': case '6': case '7': case '8': case '9':
{ cin.putback(ch); // возвращаем цифру обратно в поток ввода
double val;
cin >> val; // считываем число с плавающей точкой
return Token('8',val); // пусть символ '8' означает "число"
}
default:
error("Неправильная лексема");
}
}
Детально рассмотрим функцию get(). Сначала проверим, есть ли в буфере объект класса Token. Если есть, то мы просто вернем его.
if (full) { // если в буфере есть лексема,
// удаляем ее оттуда
full=false;
return buffer;
}
Только если переменная full равна false (т.е. в буфере нет лексем), нам придется иметь дело с символами. В данном случае считываем символ и соответствующим образом обрабатываем его. Мы распознаем скобки, операторы и числа. Любой другой символ становится причиной вызова функции error(), которая прекращает выполнение программы.
default:
error("Неправильная лексема");
Функция error() описана в разделе 5.6.3 и находится в заголовочном файле std_lib_facilities.h.
Необходимо решить, как представлять разные виды лексем, т.е. выбрать значения, идентифицирующие вид члена. Для простоты отладки мы решили обозначать скобки и операторы соответствующими им символами.
Это позволяет чрезвычайно просто обрабатывать скобки и операторы.
case '(': case ')': case '+': case '–': case '*': case '/':
return Token(ch); // пусть каждый символ представляет себя сам
Честно говоря, мы “забыли” точку с запятой, ';', для вывода и букву q в первой версии. Мы не будем добавлять их, пока в них не возникнет потребность во второй версии.
6.8.3. Считывание чисел
Осталось обработать числа. На самом деле это не просто. Действительно, как узнать значения числа 123? Хорошо, оно равно 100+20+3. А что вы скажете о числе 12.34? Следует ли принять научную систему обозначения, такую как 12.34е5? Мы могли бы провести часы и дни, решая эту задачу, но, к счастью, это не обязательно. Потоки ввода в языке С++ распознают литералы и сами умеют переводить их в тип double. Все, что нам нужно, — как-то заставить поток cin сделать это в функции get().
case '.':
case '0': case '1': case '2': case '3': case '4': case '5':
case '6': case '7':
case '8': case '9':
{ cin.putback(ch); // возвращаем цифру в поток ввода
double val;
cin >> val; // считываем число с плавающей точкой
return Token('8',val); // пусть символ '8' обозначает "число"
}
Мы в некотором смысле произвольно решили, что символ '8' будет представлять число в классе Token. Как узнать, что на вход поступило число? Хорошо, зная по опыту или изучая справочник по языку С++ (например, в приложении А), можно установить, что числовой литерал должен начинаться с цифры или символа '.' (десятичной точки). Итак, этот факт следует проверить. Далее, мы хотим, чтобы поток cin считывал число, но мы уже считали первый символ (цифру или десятичную точку), поэтому пропуск оставшейся части лексемы приведет к ошибке. Можно попытаться скомбинировать значение первого символа со значением оставшейся части; например, если некто ввел число 123, можем взять число 1, а поток cin считает число 23, и нам останется лишь сложить 100 и 23. Это тривиальный случай.
К счастью (и не случайно), поток cin работает точно так же, как поток Token_stream, в том смысле, что мы можем вернуть в него символ обратно. Итак, вместо того чтобы выполнять сложные арифметические действия, мы возвращаем первый символ обратно в поток cin и позволяем ему считать все число.
Пожалуйста, обратите внимание на то, как мы снова и снова избегаем сложностей и вместо этого находим простые решения, часто полагаясь на библиотеки. В этом заключается смысл программирования: постоянно искать простые решения. Иногда в шутку говорят: “Хороший программист — ленивый программист”. Это означает, что мы должны быть ленивыми (в хорошем смысле): зачем писать длинную программу, если можно написать короткую?
6.9. Структура программы
Как утверждает пословица, за деревьями трудно увидеть лес. Аналогично, легко потерять смысл программы, просматривая все ее функции, классы и т.д. Давайте рассмотрим программу, пропуская ее детали.
#include "std_lib_facilities.h"
class Token {/* ... */};
class Token_stream {/* ... */};
Token_stream::Token_stream():full(false), buffer(0) {/* ... */}
void Token_stream::putback(Token t) {/* ... */}
Token Token_stream::get() {/* ... */}
Token_stream ts; // содержит функции get() и putback()
double expression(); // объявление, позволяющее функции primary()
// вызывать функцию expression()
double primary() {/* ... */} // обрабатывает числа и скобки
double term() {/* ... */} // обрабатывает операции * и /
double expression() {/* ... */} // обрабатывает операции + и –
int main() {/* ... */} // основной цикл и обработка ошибок
Порядок следования объявлений важен. Мы не можем использовать имя, пока оно не объявлено, поэтому объект ts должен быть объявлен до того, как будет вызвана функция ts.get(), а функция error() должна быть объявлена до функций грамматического анализа, поскольку они используют ее. В графе вызовов существует интересный цикл: функция expression() вызывает функцию term(), которая вызывает функцию primary(), которая вызывает функцию expression().
Эту ситуацию можно проиллюстрировать графически (удалив вызовы функции error()).
Это значит, что мы не можем просто определить эти три функции: не существует такого порядка их следования, при котором вызываемая функция была бы определена заранее. Таким образом, необходимо объявление, которое не было бы определением. Мы решили объявить “наперед” функции expression().
Работает ли эта программа? Работает, если придать этому слову определенный смысл. Она компилируется, запускается, правильно вычисляет выражения и выдает осмысленные сообщения об ошибках. Но работает ли она так, как мы от нее ожидаем? Не удивительно, что на самом деле она работает не совсем