Но на этом пути остаются некоторые препятствия, из которых едва ли не самым распространенным являются унаследованные интерфейсы языка C, работающие с массивами и указателями
char*
вместо объектов
vector
и
string
. Они существуют с давних времен, и если мы хотим эффективно использовать STL, придется как-то уживаться с этими «пережитками прошлого».
К счастью, задача решается просто. Если у вас имеется
vector v
и вы хотите получить указатель на данные
v
, которые интерпретировались бы как массив, воспользуйтесь записью
&v[0]
.
Для
string s
аналогичная запись имеет вид
s.c_str
. Впрочем, это не все — существуют некоторые ограничения (то, о чем в рекламе обычно пишется самым мелким шрифтом).
Рассмотрим следующее объявление:
vector<int> v;
Выражение
v[0]
дает ссылку на первый элемент вектора, соответственно
&v[0]
— указатель на первый элемент. В соответствии со Стандартом C++ элементы
vector
должны храниться в памяти непрерывно, по аналогии с массивом. Допустим, у нас имеется функция C, объявленная следующим образом:
Во всяком случае, так должнобыть. Остается лишь понять, что произойдет, если вектор
v
пуст. В этом случае функция
v.size
вернет 0, а
&v[0]
пытается получить указатель на несуществующий блок памяти с непредсказуемыми последствиями. Нехорошо. Более надежный вариант вызова выглядит так:
if (!v.empty) {
doSomething(&v[0], v.size);
}
Отдельные подозрительные личности утверждают, что
&v[0]
можно заменить на
v.begin
, поскольку
begin
возвращает итератор, а для
vector
итератор в действительности представляет собой указатель. Во многих случаях это действительно так, но, как будет показано в совете 50, это правило соблюдается не всегда, и полагаться на него не стоит. Функция
begin
возвращает итератор, а не указатель, поэтому она никогда не должна использоваться для получения указателя на данные
vector
. А если уж вам очень приглянулась запись
v.begin
, используйте конструкцию
&*v.begin
— она вернет тот же указатель, что и
&v[0]
, хотя это увеличивает количество вводимых символов и затрудняет работу людей, пытающихся разобраться в вашей программе. Если знакомые вам советуют использовать
v.begin
вместо
&v[0]
— лучше смените круг общения.
Способ получения указателя на данные контейнера, хорошо работающий для
vector
, недостаточно надежен для
string
. Во-первых, контейнер
string
не гарантирует хранения данных в непрерывном блоке памяти; во-вторых, внутреннее представление строки не обязательно завершается нуль-символом. По этим причинам в контейнере string предусмотрена функция
c_str
, которая возвращает указатель на содержимое строки в формате C. Таким образом, передача строки
s
функции
void doSomething(const char *pString);
происходит так:
doSomething(s.c_str);
Данное
решение подходит и для строк нулевой длины. В этом случае
c_str
возвращает указатель на нуль-символ. Кроме того, оно годится и для строк с внутренними нуль-символами, хотя в этом случае
doSomething
с большой вероятностью интерпретирует первый внутренний нуль-символ как признак конца строки. Присутствие внутренних нуль-символов несущественно для объектов
, читаетих, не пытаясь модифицировать. Такой вариант наиболее безопасен. Для
string
он неизбежен, поскольку не существует гарантии, что
c_str
вернет указатель на внутреннее представление строковых данных; функция может вернуть указатель на неизменяемую копиюданных в формате C (если вас встревожила эффективность этих операций, не волнуйтесь — мне не известна ни одна современная реализация библиотеки, в которой бы использовалась данная возможность).
Vector предоставляет программисту чуть большую свободу действий. Передача
v
функции C, модифицирующей элементы
v
, обычно обходится без проблем, но вызванная функция не должна изменять количество элементов в векторе. Например, она не может «создавать» новые элементы в неиспользуемой памяти
vector
. Такие попытки приведут к нарушению логической целостности контейнера
v
, поскольку объект не будет знать свой правильный размер, и вызов функции
v.size
возвратит неправильные результаты. А если вызванная функция попытается добавить новые данные в вектор, у которого текущий размер совпадает с емкостью (совет 14), произойдет сущий кошмар. Я даже не пытаюсь предугадать последствия, настолько они ужасны.
Вы обратили внимание на формулировку «обычно обходится без проблем» в предыдущем абзаце? Конечно, обратили. Некоторые векторы устанавливают для своих данных дополнительные ограничения, и при передаче вектора функции API, изменяющей его содержимое, вы должны проследить за тем, чтобы эти ограничения не были нарушены. Например, как объясняется в совете 23, сортируемые векторы часто могут рассматриваться в качестве разумной альтернативы для ассоциативных контейнеров, но при этом содержимое таких векторов должно оставаться правильно отсортированным. При передаче сортируемого вектора функции, способной изменить его содержимое, вам придется учитывать, что при возвращении из функции сортировка элементов может быть нарушена.
Если у вас имеется
vector
, который должен инициализироваться внутри функции C, можно воспользоваться структурной совместимостью
vector
с массивами и передать функции указатель на блок элементов вектора:
// Функция fillArray получает указатель на массив.
// содержащий не более arraySize чисел типа double.
// и записывает в него данные. Возвращаемое количество записанных