представления о списке (например, список дел, товаров или расписание) является последовательность, а большинство последовательностей лучше всего представлять с помощью класса vector.
20.6.1. Строки
Как решить, что такое строка в нашем документе? Есть три очевидные альтернативы.
1. Полагаться на индикаторы новых строк (например, 'n') в строке ввода.
2. Каким-то образом разделить документ и использовать обычную пунктуацию (например, .).
3. Разделить строку, длина которой превышает некий порог (например, 50 символов), на две.
Кроме этого, несомненно, существуют менее очевидные варианты. Для простоты выберем первую альтернативу.
Представим документ в нашем редакторе в виде объекта класса Document. Схематически наш тип должен выглядеть примерно так:
typedef vector<char> Line; // строка — это вектор символов
struct Document {
list<Line> line; // документ — список строк
Document() { line.push_back(Line()); }
};
Каждый объект класса Document начинается с пустой строки: конструктор класса Document сначала создает пустую строку, а затем заполняет список строка за строкой.
Чтение и разделение на строки можно выполнить следующим образом:
istream& operator>>(istream& is, Document& d)
{
char ch;
while (is.get(ch)) {
d.line.back().push_back(ch); // добавляем символ
if (ch=='n')
d.line.push_back(Line()); // добавляем новую строку
}
if (d.line.back().size())
d.line.push_back(Line()); // добавляем пустую строку
return is;
}
Классы vector и list имеют функцию-член back(), возвращающую ссылку на последний элемент. Для ее использования вы должны быть уверены, что она действительно ссылается на последний элемент, — функцию back() нельзя применять к пустому контейнеру. Вот почему в соответствии с определением каждый объект класса Document должен содержать пустой объект класса Line. Обратите внимание на то, что мы храним каждый введенный символ, даже символы перехода на новую строку ('n'). Хранение символов перехода на новую строку сильно упрощает дело, но при подсчете символов следует быть осторожным (простой подсчет символов будет учитывать пробелы и символы перехода на новую строку).
20.6.2. Итерация
Если бы документ хранился как объект класса vector<char>, перемещаться по нему было бы просто. Как перемещать итератор по списку строк? Очевидно, что перемещаться по списку можно с помощью класса list<Line>::iterator. Однако, что, если мы хотим пройтись по символам один за другим, не беспокоясь о разбиении строки? Мы могли бы использовать итератор, специально разработанный для нашего класса Document.
class Text_iterator { // отслеживает позицию символа в строке
list<Line>::iterator ln;
Line::iterator pos;
public:
// устанавливает итератор на позицию pp в ll-й строке
Text_iterator(list<Line>::iterator ll, Line::iterator pp)
:ln(ll), pos(pp) { }
char& operator*() { return *pos; }
Text_iterator& operator++();
bool operator==(const Text_iterator& other) const
{ return ln==other.ln && pos==other.pos; }
bool operator!=(const Text_iterator& other) const
{ return !(*this==other); }
};
Text_iterator& Text_iterator::operator++()
{
if (pos==(*ln).end()) {
++ln; // переход на новую строку
pos = (*ln).begin();
}
++pos; // переход на новый символ
return *this;
}
Для того чтобы класс Text_iterator стал полезным, необходимо снабдить класс Document традиционными функциями begin() и end().
struct Document {
list<Line> line;
Text_iterator begin() // первый символ первой строки
{ return Text_iterator(line.begin(),
(*line.begin()).begin()); }
Text_iterator end() // за последним символом последней строки
{ return(line.end(), (*line.end()).end));}
};
Мы использовали любопытную конструкцию (*line.begin()).begin(), потому что хотим начинать перемещение итератора с позиции, на которую ссылается итератор line.begin(); в качестве альтернативы можно было бы использовать функцию line.begin()–>begin(), так как стандартные итераторы поддерживают операцию –>.
Теперь можем перемещаться по символам документа.
void print(Document& d)
{
for (Text_iterator p = d.begin();
p!=d.end(); ++p) cout << *p;
}
print(my_doc);
Представление документа в виде последовательности символов полезно по многим причинам, но обычно мы перемещаемся по документам, просматривая более специфичную информацию, чем символ. Например, рассмотрим фрагмент кода, удаляющий строку n.
void erase_line(Document& d, int n)
{
if (n<0 || d.line.size()<=n) return; // игнорируем строки,
// находящиеся
// за пределами диапазона
d.line.erase(advance(d.line.begin(), n));
}
Вызов advance(p,n) перемещает итератор p на n элементов вперед; функция advance() — это стандартная функция, но мы можем сами написать подобный код.
template<class Iter> Iter advance(Iter p, int n)
{
while (n>0) { ++p; ––n; } // перемещение вперед
return p;
}
Обратите внимание на то, что функцию advance() можно использовать для имитации индексирования. Фактически для объекта класса vector с именем v выражение *advance(v.begin(),n) почти эквивалентно конструкции v[n]. Здесь слово “почти” означает, что функция advance() старательно проходит по каждому из первых n–1 элементов шаг за шагом, в то время как операция индексирования сразу обращается к n-му элементу. Для класса list мы вынуждены использовать этот неэффективный метод. Это цена, которую мы должны заплатить за гибкость списка.
Если итератор может перемещаться вперед и назад, например в классе list, то отрицательный аргумент стандартной библиотечной функции advance() означает перемещение назад. Если итератор допускает индексирование, например в классе vector, стандартная библиотечная функция advance() сразу установит его на правильный элемент и не будет медленно перемещаться по всем элементам с помощью оператора ++. Очевидно, что стандартная функция advance() немного “умнее” нашей. Это стоит отметить: как правило, стандартные средства создаются более тщательно, и на них затрачивается больше времени, чем мы могли бы затратить на самостоятельную разработку, поэтому мы отдаем предпочтение стандартным инструментам, а не “кустарным”.
ПОПРОБУЙТЕ
Перепишите нашу функцию advance() так, чтобы, получив отрицательный аргумент, она выполняла перемещение назад.
Вероятно, поиск — это самый очевидный вид итерации. Мы ищем отдельные слова (например, milkshake или Gavin), последовательности букв (например, secretnhomestead — т.е. строка, заканчивающаяся словом secret, за которым следует строка, начинающаяся словом homestead),