мы просуммировали все элементы в первой строке, затем добавили элементы из второй строки (снова перебрав все элементы из первой строки), потом все элементы из третьей строки (перебрав все элементы из первой и второй строк) и т.д. Если вы считаете этот пример неудачным, посмотрите, что произойдет, если функция row_sum() обратится к базе данных за данными. Чтение данных с диска во много тысяч раз медленнее, чем чтение из оперативной памяти.
Вы можете возразить: “Никто никогда не сможет сделать нечто настолько глупое!” Извините, но мы видели вещи и похуже, и, как правило, плохой (с точки зрения производительности) алгоритм очень нелегко выявить, если он глубоко скрыт в коде приложения. Заметили ли вы проблемы с производительностью, когда в первый раз увидели этот код? Проблему бывает трудно выявить, если не искать ее целенаправленно. Рассмотрим простой реальный пример, найденный на одном сервере.
for (int i=0; i<strlen(s); ++i) { /* что-то делаем с s[i] */ }
Часто переменная s представляет собой строку размером примерно 20 K.
Не все проблемы, связанные с производительностью программы, объясняются плохим алгоритмом. Фактически (как мы указывали в разделе 26.3.3) большую часть кода, который мы пишем, нельзя квалифицировать как плохой алгоритм.
Такие “неалгоритмические” проблемы обычно связаны с неправильным проектированием. Перечислим некоторые из них.
• Повторяющееся перевычисление информации (как, например, в приведенном выше примере).
• Повторяющаяся проверка одного и того же факта (например, проверка того, что индекс не выходит за пределы допустимого диапазона при каждом его использовании в теле цикла, или повторяющаяся проверка аргумента, который передается от одной функции другой без каких-либо изменений).
• Повторяющиеся обращения к диску (или к сети).
Обратите внимание на слово “повторяющиеся”. Очевидно, что мы имеем в виду “напрасно повторяющееся”, поскольку на производительность оказывают влияние лишь те действия, которые выполняются много раз. Мы являемся горячими сторонниками строгой проверки аргументов функций и переменных циклов, но если мы миллионы раз проверяем одну и ту же переменную, то такие излишние проверки могут нанести ущерб производительности программы. Если в результате измерений выяснится, что производительность упала, мы должны изыскать возможность удалить повторяющиеся действия. Не делайте этого, пока не убедитесь, что производительность программы действительно стала неприемлемо низкой. Дело в том, что преждевременная оптимизация часто является источником многих ошибок и занимает много времени.
26.6.1. Измерение времени
Как понять, достаточно ли быстро работает фрагмент кода? Как узнать, насколько быстро работает данная операция? Во многих ситуациях, связанных с измерением времени, можете просто посмотреть на часы (секундомер, стенные или наручные часы). Это не научно и не точно, но, если не произойдет чего-то непредвиденного, вы можете прийти к выводу, что программа работает достаточно быстро. Тем не менее этот подход неприемлем для тех, кого беспокоят вопросы производительности программ.
Если вам необходимо измерять более мелкие интервалы времени или вы не хотите сидеть с секундомером, вам следует научиться использовать возможности компьютера, так как он знает, как измерить время. Например, в системе Unix достаточно просто поставить перед командой слово time, чтобы система вывела продолжительность ее выполнения. Можете также использовать команду time, чтобы выяснить, сколько времени заняла компиляция исходного файла x.cpp. Обычно компиляция выполняется по команде
g++ x.cpp
Для того чтобы измерить продолжительность компиляции, поставьте перед ней слово time.
time g++ x.cpp
Система откомпилирует файл x.cpp и выведет на экран затраченное время. Это простой и эффективный способ измерения продолжительности работы небольших программ. Не забудьте выполнить измерения несколько раз, потому что на продолжительность выполнения программы могут влиять другие действия, выполняемые на вашем компьютере. Если вы получите примерно три одинаковых ответа, то можете им доверять.
А что, если вы хотите измерить интервал времени, длящийся всего несколько миллисекунд? Что, если вы хотите выполнить свои собственные, более подробные измерения, связанные с работой части вашей программы? Продемонстрируем использование функции clock() из стандартной библиотеки, позволяющей измерить продолжительность выполнения функции do_something().
#include <ctime>
#include <iostream>
using namespace std;
int main()
{
int n = 10000000; // повторяем do_something() n раз
clock_t t1 = clock(); // начало отсчета
if (t1 == clock_t(–1)) { // clock_t(–1) значит "clock()
// не работает"
cerr << "Извините, таймер не работает n";
exit(1);
}
for (int i = 0; i<n; i++) do_something(); // цикл измерений
clock_t t2 = clock(); // конец отсчета
if (t2 == clock_t(–1)) {
cerr << "Извините, таймер переполнен n";
exit(2);
}
cout << "do_something() " << n << " раз занимает "
<< double(t2–t1)/CLOCKS_PER_SEC << " сек "
<< " (точность измерений: "
<< CLOCKS_PER_SEC << " сек)n";
}
Функция clock() возвращает результат типа clock_t. Явное преобразование double(t2–t1) перед делением необходимо, поскольку тип clock_t может быть целым число. Точный момент запуска функции clock() зависит от реализации; функция clock() предназначена для измерения интервалов времени в пределах одного сеанса выполнения программы. При значениях t1 и t2, возвращаемых функцией clock(), число double(t2–t1)/CLOCKS_PER_SEC является наилучшим приближением времени, прошедшего между двумя вызовами функции clock() и измеренного в секундах. Макрос CLOCKS_PER_SEC (тактов в секунду) описан в заголовке <ctime>.
Если функция clock() для процессора не предусмотрена или временной интервал слишком длинный, функция clock() возвращает значение clock_t(–1). Функция clock() предназначена для измерения временных интервалов, длящихся от доли секунды до нескольких секунд. Например, если (что бывает довольно часто) тип clock_t представляет собой 32-битовый тип int со знаком и параметр CLOCKS_PER_SEC равен 1000000, мы можем использовать функцию clock() для измерения интервалов времени продолжительностью от 0 до 2000 секунд (около половины часа), выраженных в микросекундах.
Напоминаем: нельзя доверять любым измерениям времени, которые нельзя повторить, получив примерно одинаковые результаты. Что значит “примерно одинаковые результаты”? Примерно 10%. Как мы уже говорили, современные компьютеры являются быстрыми: они выполняют миллиард инструкций в секунду. Это значит, что вы не можете измерить продолжительность ни одной операции, если она не повторяется десятки тысяч раз или