новые функции могут использоваться как в системах с поддержкой потоков, так и в тех, где потоки не поддерживаются, но все приложения, вызывающие функцию
readline
, должны быть изменены.
3. Реструктуризация интерфейса для исключения статических переменных и обеспечения безопасности функции в многопоточной среде. Для
readline
это будет означать отказ от увеличения быстродействия, достигнутого в листинге 3.12, и возвращение к более старой версии, представленной в листинге 3.11. Поскольку мы назвали старую версию «ужасно медленной», это решение не всегда пригодно на практике.
Использование собственных данных потоков — это распространенный способ сделать существующую функцию безопасной в многопоточной среде. Прежде чем описывать функции Pthread, работающие с такими данными, мы опишем саму концепцию и возможный способ реализации, так как эти функции кажутся более сложными, чем являются на самом деле.
Частично осложнения возникают по той причине, что во всех книгах, где идет речь о потоках, описание собственных данных потоков дается по образцу стандарта Pthreads. Пары ключ-значение и ключи рассматриваются в них как непрозрачные объекты. Мы описываем собственные данные потоков в терминах индексов и указателей, так как обычно в реализациях в качестве ключей используются небольшие положительные целые числа (индексы), а значение, ассоциированное с ключом, — это просто указатель на область памяти, выделяемую потоку с помощью функции
malloc
.
В каждой системе поддерживается ограниченное количество объектов собственных данных потоков. В POSIX требуется, чтобы этот предел не превышал 128 (на каждый процесс), и в следующем примере мы используем именно это значение. Система (вероятно, библиотека потоков) поддерживает один массив структур (которые мы называем структурами
Key
) для каждого процесса, как показано на рис. 26.2.
Рис. 26.2. Возможная реализация собственных данных потока
Флаг в структуре
Key
указывает, используется ли в настоящий момент данный элемент массива. Все флаги инициализируются как указывающие на то, что элемент не используется. Когда поток вызывает функцию
pthread_key_create
для создания нового элемента собственных данных потока, система отыскивает в массиве структур
Key
первую структуру, не используемую в настоящий момент. Индекс этой структуры, который может иметь значение от 0 до 127, называется ключом и возвращается вызывающему потоку как результат выполнения функции. О втором элементе структуры
Key
, так называемом указателе-деструкторе, мы поговорим чуть позже.
В дополнение к массиву структур
Key
, общему для всего процесса, система хранит набор сведений о каждом потоке процесса в структуре
Pthread
. Частью этой структуры является массив указателей, состоящий из 128 элементов, который мы называем
pkey
. Это показано на рис. 26.3.
Рис. 26.3.
Информация, хранящаяся в системе для каждого потока
Все элементы массива
pkey
инициализируются пустыми указателями. Эти 128 указателей являются «значениями», ассоциированными с каждым из 128 «ключей» процесса.
Когда мы с помощью функции
pthread_key_create
создаем ключ, система сообщает нам фактическое значение ключа (индекс). Затем каждый поток может сохранить значение (указатель), связанное с этим ключом, и, как правило, каждый поток получает этот указатель в виде возвращаемого значения функции
malloc
. Частично путаница с собственными данными потока обусловлена тем, что указатель в паре ключ-значение играет роль значения, но сами собственные данные потока — это то, на что указывает данный указатель.
Теперь мы перейдем к примеру применения собственных данных потока, предполагая, что наша функция
readline
использует их для хранения информации о состоянии каждого потока при последовательных обращениях к ней. Вскоре мы покажем код, выполняющий эту задачу, в котором функция
readline
модифицирована так, чтобы реализовать представленную далее последовательность шагов.
1. Запускается процесс, и создается несколько потоков.
2. Один из потоков вызовет функцию
readline
первой, а та, в свою очередь, вызовет функцию
phtread_key_create
. Система отыщет первую неиспользуемую структуру
Key
(см. рис. 26.2) и возвратит вызывающему процессу ее индекс. В данном примере мы предполагаем, что индекс равен 1.
Мы будем использовать функцию
pthread_once
, чтобы гарантировать, что функция
pthread_key_create
вызывается только первым потоком, вызвавшим функцию
readline
.
3. Функция
readline
вызывает функцию
pthread_getspecific
, чтобы получить значение
pkey[1]
(«указатель» на рис. 26.3 для ключа, имеющего значение 1) для данного потока, но эта функция возвращает пустой указатель. Тогда функция
readline
вызывает функцию
malloc
для выделения памяти, которая необходима для хранения информации о каждом потоке при последовательных вызовах функции
readline
. Функция
readline
инициализирует эти области памяти по мере надобности и вызывает функцию
pthread_setspecific
, чтобы установить указатель собственных данных потока (
pkey[1]
), соответствующий данному ключу, на только что выделенную область памяти. Мы показываем этот процесс на рис. 26.4, предполагая, что вызывающий поток — это поток с номером 0 в данном процессе.
Рис. 26.4. Соответствие между областью памяти, выделенной функцией malloc, и указателем собственных данных потока
На этом рисунке мы отмечаем, что структура Pthread поддерживается системой (вероятно, библиотекой потоков), но фактически собственные данные потока, которые мы размещаем в памяти с помощью функции
malloc
, поддерживаются нашей функцией (в данном случае
readline
). Все, что делает функция
pthread_setspecific
, — это установка указателя для данного ключа в структуре Pthread на выделенную область памяти. Аналогично, действие функции