печатает форматированный список областей памяти процесса. Результат ее вывода несколько более удобочитаем, чем информация, получаемая из файловой системы
/proc
, но это одна и та же информация. Данная утилита включена в новые версии пакета
Первые три строчки соответствуют сегменту кода, сегменту данных и сегменту bss модуля
libc.so
(библиотека функций языка С). Следующие две строчки описывают соответственно сегмент кода и сегмент данных выполняемого образа. Далее три строчки — описание сегментов кода, данных и bss модуля
ld.so
(динамический компоновщик). Последняя строчка описывает стек процесса.
Обратите внимание, что все сегменты кода имеют права на чтение и выполнение, что и должно быть для выполняемых образов. С другой стороны, сегменты данных и bss, которые содержат глобальные переменные, помечаются как имеющие права на запись и чтение, а не на выполнение.
Все адресное пространство составляет порядка 1340 Кбайт, но только 40 Кбайт из них имеют право на запись и соответствуют частному отображению. Если область памяти является совместно используемой и не имеет прав на запись, то ядро хранит в памяти всего одну копию отображаемого файла. Это может показаться обычным для совместно используемых отображений; однако, случай, когда при этом еще и отсутствуют права на запись, проявляется несколько неожиданно. Если учесть факт, что когда на отображение нет прав записи, то соответствующая информация никогда не может быть изменена (из отображения возможно только чтение), становится ясно, что можно совершенно безопасно загрузить выполняемый образ в память всего один раз. Поэтому динамически загружаемая библиотека функций языка С и занимает в памяти всего 1212 Кбайт, а не 1212 Кбайт, умноженное на количество процессов, которые эту библиотеку используют. В связи с этим, процесс, код и данные которого имеют объем порядка 1340 Кбайт, на самом деле занимает всего 40 Кбайт физической памяти. Экономия памяти из-за такого совместного использования получается существенной.
Обратите внимание на области памяти, которые не имеют отображаемого файла, находятся на устройстве с номерами
00:00
и номер файлового индекса для которых равен нулю. Это отображение страницы, заполненной нулями (zero page, пулевая страница). Если отобразить страницу, заполненную нулями, на область памяти, которая имеет права на запись, то побочным эффектом является инициализация всех переменных в нулевые значения. Это важно, поскольку в таком случае получается область памяти, заполненная нулями, которая нужна для сегмента bss.
Каждой области памяти, связанной с процессом, соответствует структура
vm_area_struct
. Так как процесс не является потоком (thread), то для него существует отдельная структура
min_struct
, на которую есть ссылка из структуры
task_struct
.
Работа с областями памяти
Ядру часто необходимо определять, соответствует ли та или иная область памяти в адресном пространстве процесса заданному критерию, например, существует ли заданный адрес в области памяти. Эти операции являются основой работы функции
mmap
, которая
будет рассмотрена в следующем разделе, и выполнять их приходится часто. Несколько полезных для этого функций объявлены в файле
<linux/mm.h>
.
Функция
find_vma
Функция
find_vma
определена в файле
mm/mmap.c
.
Эта функция позволяет найти в заданном адресном пространстве ту первую область памяти, для которой значение поля
vm_end
больше заданного адреса
addr
. Другими словами, эта функция позволяет найти первую область памяти, которая содержит адрес
addr
или начинается с адреса, большего адреса
addr
. Если такой области памяти не существует, то функция возвращает значение
NULL
.
В противном случае возвращается указатель на соответствующую структуру
vm_area_struct
. Обратите внимание, что найденная область VMA может начинаться с адреса, большего адреса
addr
, и этот адрес не обязательно принадлежит найденной области памяти. Результат выполнения функции
find_vma
кэшируется в поле
map_cache
дескриптора памяти. Поскольку очень велика вероятность того, что после одной операции с областью памяти последуют еще операции с ней же, то процент попаданий в кэш получается достаточно большим (на практике получаются значения порядка 30-40%). Проверка кэшированных результатов выполняется очень быстро. Если нужный адрес в кэше не найден, то выполняется поиск по всем областям памяти, связанным с заданным дескриптором. Этот поиск выполняется с помощью красно-черного дерева следующим образом.
на предмет того, содержит ли кэшированная область VMA необходимый адрес. Обратите внимание, что простая проверка того, является ли значение поля
vm_end
большим
addr
, не гарантирует что проверяемая область памяти является первой, в которой есть адреса, большие
addr
. Поэтому, для того чтобы кэш в этой ситуации оказался полезным, проверяемый адрес должен принадлежать кэшированной области памяти. К счастью, это как раз и соответствует случаю выполнения последовательных операций с одной и той же областью VMA.