UNIX: разработка сетевых приложений, Стивенс Уильям Ричард

UNIX: разработка сетевых приложений

на обложку

Стивенс Уильям Ричард

Шрифт:

POSIX требует наличия только трех элементов структуры:

sin_family

sin_addr

sin_port

. POSIX-совместимая реализация может определять дополнительные элементы структуры, и это норма для структуры адреса сокета Интернета. Почти все реализации добавляют элемент sin_zero, так что все структуры адреса сокета имеют размер как минимум 16 байт.

Типы элементов

s_addr

sin_family

sin_port

мы указываем согласно POSIX. Тип данных

in_addr_t

соответствует целому числу без знака длиной как минимум 32 бита,

in_port_t

— целому числу без знака длиной как минимум 16 бит, a

sa_family_t

—

это произвольное целое число без знака. Последнее обычно представляет собой 8-разрядное целое без знака, если реализация поддерживает поле длины, либо 16-разрядное целое без знака, если поле длины не поддерживается. В табл. 3.1 перечислены эти три типа данных POSIX вместе с некоторыми другими типами данных POSIX, с которыми мы встретимся.

Таблица 3.1. Типы данных, требуемые POSIX

Тип данных	Описание	Заголовочный файл
int8_t	8-разрядное целое со знаком	<sys/types.h>
uint8_t	8-разрядное целое без знака	<sys/types.h>
int16_t	16-разрядное целое со знаком	<sys/types.h>
uint16_t	16-разрядное целое без знака	<sys/types.h>
int32_t	32-разрядное целое со знаком	<sys/types.h>
uint32_t	32-разрядное целое без знака	<sys/types.h>
sa_family_t	семейство адресов структуры адреса сокета	<sys/socket.h>
socklen_t	длина структуры адреса сокета, обычно типа uint32_t	<sys/socket.h>
in_addr_t	IPv4-адрес, обычно типа uint32_t	<netinet/in.h>
in_port_t	порт TCP или UDP, обычно типа uint16_t	<netinet/in.h>

Вы также встретите типы данных

u_char

u_short

u_int

u_long

, которые не имеют знака. POSIX определяет их с замечанием, что они устарели. Они предоставляются в целях обратной совместимости.

И адрес IPv4, и номер порта TCP и UDP всегда хранятся в структуре в соответствии с порядком байтов, определенным в сети ( сетевой порядок байтов— network byte order). Об этом нужно помнить при использовании этих элементов (более подробно о разнице между порядком байтов узла и порядком байтов в сети мы поговорим в разделе 3.4).

К 32-разрядному адресу IPv4 можно обратиться двумя путями. Например, если

serv

— это структура адреса сокета Интернета, то

serv.sin_addr

указывает на 32-разрядный адрес IPv4 как на структуру

in_addr

, в то время как

serv.sin_addr.s_addr

указывает на тот же 32-разрядный адрес IPv4 как на значение типа

in_addr_t

(обычно это 32-разрядное целое число без знака). Нужно следить за корректностью обращения к адресам IPv4, особенно при использовании их в качестве аргументов различных функций, потому что компиляторы часто передают структуры не так, как целочисленные переменные.

ПРИМЕЧАНИЕ

Причина того, что sin_addr является структурой,

а не просто целым числом без знака, носит исторический характер. В более ранних реализациях (например, 4.2BSD) структура in_addr определялась как объединение (union) различных структур, чтобы сделать возможным доступ к каждому из четырех байтов 32-разрядного IPv4-адреса, а также к обоим входящим в него 16-разрядным значениям. Эта возможность использовалась в адресах классов А, В и С для выборки соответствующих байтов адреса. Но с появлением подсетей и последующим исчезновением различных классов адресов (см. раздел А.4) и введением бесклассовой адресации (classless addressing) необходимость в объединении структур отпала. В настоящее время большинство систем отказались от использования объединения и просто определяют in_addr как структуру, содержащую один элемент типа in_addr_t.

Элемент

sin_zero

не используется, но мы всегдаустанавливаем его в нуль при заполнении одной из этих структур. Перед заполнением структуры мы всегда обнуляем все ее элементы, а не только

sin_zero

ПРИМЕЧАНИЕ

В большинстве случаев при использовании этой структуры не требуется, чтобы элемент sin_zero был равен нулю, но, например, при привязке конкретного адреса IPv4 (а не произвольного интерфейса) этот элемент обязательно должен быть нулевым [128, с. 731-732].

Структуры адреса сокета используются только на данном узле: сама структура не передается между узлами, хотя определенные поля (например, поля IP-адреса и порта) используются для соединения.

Универсальная структура адреса сокета

Структуры адреса сокета всегдапередаются по ссылке при передаче в качестве аргумента для любой функции сокета. Но функции сокета, принимающие один из этих указателей в качестве аргумента, должны работать со структурами адреса сокета из любогоподдерживаемого семейства протоколов.

Проблема в том, как объявить тип передаваемого указателя. Для ANSI С решение простое:

void*

является указателем на неопределенный (универсальный) тип (generic pointer type). Но функции сокетов существовали до появления ANSI С, и в 1982 году было принято решение определить универсальнуюструктуру адреса сокета (generic socket address structure) в заголовочном файле

, которая показана в листинге 3.2.

Листинг 3.2. Универсальная структура адреса сокета: sockaddr

struct sockaddr {

uint8_t sa_len;

sa_family_t sa_family; /* семейство адресов: константа AF_xxx */

char sa_data[14]; /* адрес, специфичный для протокола */

};

Функции сокетов определяются таким образом, что их аргументом является указатель на общую структуру адреса сокета, как показано в прототипе функции

bind

(ANSI С):

int bind(int, struct sockaddr*, socklen_t);

При этом требуется, чтобы для любых вызовов этих функций указатель на структуру адреса сокета, специфичную для протокола, был преобразован в указатель на универсальную структуру адреса сокета. Например:

struct sockaddr_in serv; /* структура адреса сокета IPv4 */

/* заполняем serv{} */

bind(sockfd, (struct sockaddr*)&serv, sizeof(serv));

Если мы не выполним преобразование (

struct sockaddr*

), компилятор С сгенерирует предупреждение в форме

"Warning: passing arg 2 of 'bind' from incompatible pointer type"

(Передается указатель несовместимого типа). Здесь мы предполагаем, что в системных заголовочных файлах имеется прототип ANSI С для функции bind.