ПРИЛОЖЕНИЕ А
Измерение производительности
А.1. Введение
В основной части книги мы перечислили шесть средств передачи сообщений:
■ неименованные каналы (pipes);
■ именованные каналы (FIFO);
■ очереди сообщений Posix;
■ очереди сообщений System V;
■ двери;
■ SunRPC.
Кроме того, мы указали пять типов средств синхронизации:
■ взаимные исключения и условные переменные;
■ блокировки чтения-записи;
■ блокировка записей fcntl;
■ семафоры Posix;
■ семафоры System V.
В этом приложении мы разработаем набор простых программ для измерения производительности этих видов IPC, чтобы иметь возможность аргументировать свой выбор одного из этих средств для конкретной задачи.
При сравнении средств передачи сообщений нас интересуют два параметра:
1. Полоса пропускания (bandwidth) — скорость передачи данных по каналу IPC. Для измерения этого параметра мы передаем огромное количество данных (миллионы байтов) от одного процесса другому. Этот параметр измеряется для различных объемов данных на операцию (например, write и read для каналов), и мы ожидаем, что полоса пропускания будет увеличиваться вместе с увеличением количества передаваемых за одну операцию данных.
2. Задержка (latency) определяется как время, которое требуется небольшому сообщению, чтобы проделать путь по каналу IPC от одного процесса к другому и обратно. Мы измеряем время задержки для сообщения размером 1 байт.
В реальности величина полосы пропускания говорит нам о том, сколько времени будет потрачено на передачу блока данных по каналу IPC, но IPC также используется и для передачи небольших управляющих сообщений. Задержка определяет время, необходимое для передачи этих сообщений. Важными оказываются обе величины.
Чтобы измерить скорость работы средств синхронизации, мы изменим программу, увеличивающую значение счетчика в разделяемой памяти. Поскольку увеличение — элементарная операция, время будет тратиться в основном на работу средств синхронизации.
ПРИМЕЧАНИЕ
Программы этого приложения, используемые для измерения производительности средств IPC, основаны на пакете lmbench [15]. Этот пакет содержит набор тестов, измеряющих множество параметров системы (скорость переключения контекста и т. п.), а не только производительность средств IPC. Исходный код пакета доступен по адресу http://www.bitmover.com/lmbench.
Величины, приведенные в этом приложении, дают нам возможность сравнить методы, описанные в книге. Заодно мы хотели показать, как просто измерить эти величины. Прежде чем останавливать свой выбор на одном из средств IPC, нелишне было бы получить эти значения в вашей собственной системе. К сожалению, насколько легко измерить величины, настолько же трудно объяснить аномальное их поведение в отсутствие доступа к исходному коду ядра и библиотек.
А.2. Результаты
Сведем вместе результаты, полученные в этом приложении. Данный раздел может использоваться как справочник при чтении книги.
Для проведения измерений использовались две системы: SparcStation 4/110 под управлением Solaris 2.6 и Digital Alpha (DEC 3000 model 300, Pelican) под управлением Digital Unix 4.0В. В файл /etc/system системы Solaris 2.6 были добавлены следующие строки:
set msgsys:msginfo_msgmax = 16384
set msgsys:msginfo_msgmnb = 32768
set msgsys:msginfo_msgseg = 4096
Это дает возможность отправлять сообщения размером 16384 байт в очередь сообщений System V (табл. А.2). Те же изменения осуществляются в Digital Unix 4.0B введением следующих строк с помощью программы sysconfig:
ipc:
msg-max = 16384
msg-mnb = 32768
Результаты измерения полосы пропускания сообщений
В табл. А.2 приведены результаты измерений на компьютере Sparc под управлением Solaris 2.6, а на рис. А.1 — график этих результатов.
Как мы и предполагали, полоса пропускания увеличивается с размером сообщения. Поскольку во многих реализациях очередей сообщений System V ограничение на размер сообщения, установленное в ядре, достаточно мало (раздел 3.8), максимальный размер сообщения в нашей программе имеет значение 16384 байт.
Уменьшение полосы для сообщений размером около 4096 байт в Solaris 2.6, возможно, связано с настройкой внутренних ограничений ядра. Для сравнения с [24] мы приводим результаты аналогичных измерений для сокета TCP и доменного сокета Unix. Эти две величины были получены с помощью программ пакета lmbench для сообщений размером 65536 байт. При измерении быстродействия сокета TCP оба процесса выполнялись на одном узле.
Результаты измерения задержки
В табл. А.1 приведены значения задержки в Solaris 2.6 и Digital Unix 4.0B.
Таблица А.1. Задержка при передаче сообщения размером 1 байт (в микросекундах)
Канал Очередь сообщений Posix Очередь сообщений System V Двери Sun RPC TCP Sun RPC UDP Сокет TCP Сокет UDP Доменный сокет Solaris 2.6 324 584 260 121 1891 1677 798 755 465 DUnix 4.0B 574 995 625 1648 1373 848 639 289
Рис. А.1. Полоса пропускания средств передачи сообщений в Solaris 2.6.
В разделе A.4 мы приведем листинги программ, использованных для получения первых четырех величин, а оставшиеся три получены с помощью пакета lmbench. При измерении скорости работы TCP и UDP оба процесса находились на одном узле.
Таблица А.2. Полоса пропускания для разных типов сообщений в Solaris 2.6 (Мбайт/с)
Размер сообщения Канал Очередь сообщений Posix Очередь сообщений System V Двери Sun RPC TCP Sun RPC UDP Сокет TCP Доменный сокет 1024 6,3 3,7 4,9 6,3 0,5 0,5 2048 8,7 5,3 6,3 10,0 0,9 1,0 4096 9,8 8,4 6,6 12,6 1,6 2,8 8192 12,7 10,2 5,8 14,4 2,4 2,8 16384 13,1 11,6 6,1 16,8 3,2 3,4 32768 13,2 13,4 11,4 3,5 4,3 65536 13,7 14,4 12,2 3,7 13,2 11,3
Рис. А.2. Полоса пропускания для различных средств передачи сообщений (Digital Unix 4.0B)
Таблица А.З. Полоса пропускания для различных типов сообщения в Digital Unix 4.0B (Мбайт/с)
Размер сообщения Канал Очередь сообщений Posix Очередь сообщений System V Sun RPC TCP Sun RPC UDP Сокет TCP Доменный сокет 1024 9,9 1,8 12,7 0,6 0,6 2048 15,2 3,5 15,0 0,8 1,0 4096 17,1 5,9 21,1 1,3 1,8 8192 16,5 8,6 17,1 1,8 2,5 16384 17,3 11,7 17,3 2,3 32768 15,9 14,0 2,6 65536 14,2 9,4 2,8 4,6 18,0
Результаты синхронизации потоков