Конечно, многопоточные программы распространены весьма широко, поэтому большинство разработчиков STL стремится к тому, чтобы их реализации хорошо работали в многопоточных условиях. Но даже если они хорошо справятся со своей задачей, основное бремя остается на ваших плечах. Возможности разработчиков STL в этой области ограничены, и вы должны хорошо понимать, где проходят эти границы.
«Золотой стандарт» поддержки многопоточности в контейнерах STL (которым руководствуется большинство разработчиков) был определен компанией SGI и опубликован на ее web-сайте, посвященном STL [21]. Фактически в нем сказано, что в лучшем случае можно надеяться на следующее:
• безопасность параллельного чтения. Несколько
потоков могут одновременно читать содержимое контейнера, и это не помешает его правильной работе. Естественно, запись в контейнер при этом не допускается;
• безопасность записи в разные контейнеры. Несколько потоков могут одновременно производить запись в разные контейнеры.
Обращаю ваше внимание: это то, на что вы можете надеяться, но не рассчитывать. Одни реализации предоставляют такие гарантии, другие — нет.
Многопоточное программирование считается сложной задачей, и многие программисты желают, чтобы реализации STL изначально обеспечивали полную потоковую безопасность. Это избавило бы их от необходимости самостоятельно синхронизировать доступ. Конечно, это было бы очень удобно, однако добиться этой цели очень сложно. Рассмотрим несколько способов реализации полной потоковой безопасности контейнеров:
• блокировка контейнера на время вызова любой функции;
• блокировка контейнера в течение жизненного цикла каждого возвращаемого итератора (например посредством вызова
begin
или
end
);
• блокировка контейнера на протяжении работы каждого алгоритма, вызванного для этого контейнера. В действительности это бессмысленно, поскольку, как будет показано в совете 32, алгоритм не располагает средствами идентификации контейнера, с которым он работает. Тем не менее, мы изучим этот вариант — будет поучительно увидеть, почему он в принципе неработоспособен.
В многопоточной среде существует вероятность того, что другой поток изменит содержимое
v
сразу же после выполнения строки 1. Если это произойдет, сравнение
first5
с
v.end
в строке 2 становится бессмысленным, поскольку содержимое
v
будет не тем, каким оно было в конце строки 1. Более того, такая проверка может привести к непредсказуемым результатам, поскольку третий поток может перехватить управление между строками 1 и 2 и сделать
first5
недействительным (например, при выполнении вставки вектор может заново выделить память, вследствие чего все итераторы данного вектора станут недействительными. За подробностями о перераспределении памяти обращайтесь к совету 14). Присваивание
*first5
в строке 3 тоже небезопасно, поскольку между строками 2 и 3 другой поток может удалить элемент, на который указывает (или, по крайней мере, указывал раньше) итератор
first5
.
Ни одно из описанных выше решений с блокировкой не решает этих проблем. Вызовы
begin
и
end
в строке 1 сразу возвращают управление, сгенерированные ими итераторы остаются действительными только до конца строки, а
find
тоже возвращает управление в конце строки.
Чтобы этот фрагмент был потоково-безопасным, блокировка
v
должна сохраняться от строки 1 до строки 3. Трудно представить, каким образом реализация STL могла бы автоматически придти к такому выводу. А если учесть, что использование примитивов синхронизации (семафоров, мьютексов [1] и т. д.) обычно сопряжено с относительно высокими затратами, еще труднее представить, каким образом реализация могла бы сделать это без значительного снижения быстродействия по сравнению с программами, которым априорно известно, что в строках 1-3 с
v
будет работать только один программный поток.
1
В среде программистов данный термин (англ. mutex) встречается также в варианте «мутекс». — Примеч. ред.
Понятно, почему в решении проблем многопоточности не стоит полагаться на реализацию STL. Вместо этого в подобных случаях следует самостоятельно синхронизировать доступ. В приведенном примере это может выглядеть так:
if (first5 != v.end) {// Теперь эта строка безопасна
*first5 = 0; // И эта строка тоже
}
releaseMutexFor(v);
В другом, объектно-ориентированном, решении создается класс
Lock
, который захватывает мьютекс в конструкторе и освобождает его в деструкторе, что сводит к минимуму вероятность вызова
getMutexFor
без парного вызова
releaseMutexFor
. Основа такого класса (точнее, шаблона) выглядит примерно так:
template<typename Container> // Базовый шаблон для классов,
class Lock{ // захватывающих и освобождающих мьютексы
public:// для контейнеров: многие технические
// детали опущены
Lock(const Containers container) : c(container) {
getMutexFor(с);// Захват мьютекса в конструкторе
}
~Lock {
releaseMutexFor(c); // Освобождение мьютекса в деструкторе
}
private:
const Container& с;
Концепция управления жизненным циклом ресурсов (в данном случае — мьютексов) при помощи специализированных классов вроде
Lock
рассматривается в любом серьезном учебнике C++. Попробуйте начать с книги Страуструпа (Stroustrup) «The C++ Programming Language» [7], поскольку именно Страуструп популяризировал эту идиому, однако информацию также можно найти в совете 9 «More Effective C++». Каким бы источником вы ни воспользовались, помните, что приведенный выше класс
Lock
урезан до абсолютного минимума. Полноценная версия содержала бы многочисленные дополнения, не имеющие никакого отношения к STL. Впрочем, несмотря на минимализм, приведенная версия
Lock
вполне может использоваться в рассматриваемом примере: