class="code">term().
double term()
{
double left = primary();
Token t = ts.get(); // получаем следующую лексему
// из потока лексем
while(true) {
switch (t.kind) {
case '*':
left *= primary();
t = ts.get();
break;
case '/':
{
double d = primary();
if (d == 0) error("деление на нуль");
left /= d;
t = ts.get();
break;
}
default:
ts.putback(t); // помещаем объект t обратно в поток лексем
return left;
}
}
}
Для последней функции программы грамматического анализа primary() достаточно заменить функцию get_token() функцией ts.get(); функция primary() использует каждую лексему, которую она считывает.
6.7. Испытание второй версии
Итак, мы готовы к испытанию второй версии. Введем число 2 и символ перехода на новую строку. Нет ответа. Попробуйте ввести еще один символ перехода на новую строку, чтобы убедиться, что компьютер не завис. По-прежнему нет ответа. Введите число 3 и символ перехода на новую строку. Ответ равен 2. Попробуйте ввести выражение 2+2 и символ перехода на новую строку. Ответ равен 3. Экран выглядит следующим образом:
2
3
=2
2+2
=3
Хм... Может быть, наша функция putback() и ее использование в функции expression() и term() не решает проблему. Попробуем другой тест.
2 3 4 2+3 2*3
= 2
= 3
= 4
= 5
Да! Это правильные ответы! Но последний ответ (6) пропущен. Проблема следующей лексемы не решена. Однако на этот раз она заключается не в том, что наш программный код “съедает” символы, а в том, что он вообще не получает информации, пока не будет введено следующее выражение. Результат вычисления выражения не выводится на экран немедленно; он откладывается до тех пор, пока программа не увидит первую лексему следующего выражения. К сожалению, программа не видит эту лексему, пока мы не нажмем клавишу <Enter> после следующего выражения. Эта программа на самом деле не настолько плоха, она просто немного медленно реагирует.
Как исправить этот недостаток? Очевидное решение — потребовать немедленно выполнить вывод. Договоримся считать, что каждое выражение завершается точкой с запятой, которая одновременно служит триггером вывода. Кроме того, добавим в программу команду выхода. Для этого подходит символ q (первая буква слова quit (выход)). Функция main() содержит инструкцию
while (cin) cout << "=" << expression() << 'n'; // version 1
Заменим ее более запутанной, но более полезной инструкцией.
double val = 0;
while (cin) {
Token t = ts.get();
if (t.kind == 'q') break; // 'q' для выхода
if (t.kind == ';') // ';' для команды "печатать немедленно"
cout << "=" << val << 'n';
else
ts.putback(t);
val = expression();
}
Теперь калькулятор действительно можно использовать. Рассмотрим пример.
2;
= 2
2+3;
= 5
3+4*5;
= 23
q
В данный момент мы имеем хорошую начальную версию калькулятора. Она делает еще не совсем то, что мы хотели, но на ее основе программу можно усовершенствовать. Следует отметить, что теперь мы можем устранять недостатки один за другим, сохраняя работоспособность программы.
6.8. Потоки лексем
Прежде чем далее улучшать наш калькулятор, продемонстрируем реализацию класса Token_Stream. В конце концов, программа никогда не сможет правильно работать, если данные вводятся некорректно. Несмотря на то что мы реализуем класс Token_Stream в первую очередь, нам не хотелось бы далеко отклоняться от основной темы, пока не сможем получить минимальное решение задачи.
Входной информацией для нашего калькулятора является последовательность лексем, как было показано выше на примере выражения (1.5+4)*11 (см. раздел 6.3.3). Нам лишь нужна функция, считывающая символы из стандартного потока cin и вводящая в программу следующую лексему по запросу. Кроме того, мы видели, что наша программа часто считывает слишком много лексем, поэтому необходимо как-то возвращать их обратно, чтобы использовать в дальнейшем. Эта ситуация очень типична. Допустим, мы считываем выражение 1.5+4 слева направо. Как убедиться, что число 1.5 считано полностью, а символ + — нет. Пока мы не увидим символ +, можем считывать число 1.55555. Таким образом, нам нужен поток, порождающий лексему при вызове функции get(), и возможность возвращать лексему обратно в поток при вызове функции putback(). Все сущности в языке С++ имеют тип, поэтому необходимо определить тип Token_stream.
Возможно, вы заметили ключевое слово public в определении класса Token, приведенном в разделе 6.3.3. В том случае для его использования не было очевидных причин. Однако при определении класса Token_stream мы должны применить его и объяснить его предназначение. В языке С++ тип, определенный пользователем, часто состоит из двух частей: открытого интерфейса (помеченного как public:) и реализации деталей типа (помеченной как private:). Идея заключается в том, чтобы отделить то, что пользователю необходимо для удобства, от деталей реализации типа, в которые пользователю вникать не обязательно.
class Token_stream {
public:
// пользовательский интерфейс
private:
// детали реализации
// (скрывается от пользователей класса Token_stream)
};
Очевидно, что пользователи и разработчики исполняют разные роли, но разделение (открытого) интерфейса, предназначенного для пользователей, от (закрытых) деталей реализации, используемых только разработчиками, представляет собой мощное средство структурирования программного кода. Открытый интерфейс должен содержать только средства, необходимые пользователю, включая конструкторы для инициализации объектов. Закрытая реализация содержит только то, что необходимо для реализации открытых функций, как правило, данные и функции, связанные с массой деталей, о которых пользователю незачем знать, поскольку он их не использует непосредственно.
Приступим к разработке типа Token_stream. Что пользователь ждет от него? Очевидно, что нам нужны функции get() и putback() — именно поэтому мы ввели понятие потока