Ассемблер для процессоров Intel Pentium
Шрифт:
2.2. Компоновка программ
После успешной трансляции исходного текста ассемблерной программы результат в виде объектного файла передается компоновщику link.exe. Компоновщик может связать несколько объектных файлов в один исполняемый ЕХЕ-файл. При этом все сегменты, определенные в программе, группируются в соответствии с инструкциями, содержащимися в объектном файле. Вся информация о размещении сегментов записывается в заголовок исполняемого файла.
Здесь следует упомянуть о том, что структура программы (не только на ассемблере) определяется несколькими факторами:
– архитектурой процессора;
– особенностями той операционной системы, под управлением которой эта программа будет выполняться;
–
Например, исходный текст простой 16-разрядной программы, выводящей строку str на экран в операционной системе MS-DOS, может выглядеть так:
Эта программа выполняется только в операционной системе MS-DOS и не работает в таких операционных системах, как Windows 2000 и Windows XP, поскольку структура исполняемого файла не соответствует требованиям, выдвигаемым этими операционными системами. Чтобы программа могла вывести строку на экран, например, в Windows XP, требуется кардинальным образом изменить структуру программы.
Кроме этого, программы для операционных систем MS-DOS и Windows требуют задания различных параметров компилятора и компоновщика, что вызвано различной организацией операционных систем MS-DOS и Windows. Операционная система MS-DOS использует 16-разрядную модель памяти в реальном режиме, в то время как Windows XP, например, 32-разрядный защищенный режим с линейной адресацией памяти. Далее мы проанализируем основные параметры компилятора ml.exe и компоновщика link.exe макроассемблера MASM для создания различных типов приложений.
Трансляцию файлов с расширением ASM можно выполнить из командной строки:
ml /с /coff имя_файла.asm
Созданный при помощи этой команды объектный файл имеет формат COFF. Если параметр /coff не задан, то форматом созданного объектного файла будет OMF.
Компоновщик link.exe оперирует с OBJ-файлами как в формате COFF, так и в формате OMF, при этом выполняется автоматическое преобразование формата файла из OMF в COFF. Обычно при генерации исполняемых файлов используется формат COFF. Кроме того, и это очень важно, если файл объектного модуля должен применяться в приложении, написанном на Visual C++ .NET, то формат его обязательно должен быть COFF. В то же время при применении объектного файла в приложении, разработанном в Borland Delphi 2005, единственным воспринимаемым форматом является OMF.
Для того чтобы из объектного файла создать исполняемый файл, работающий в MS-DOS, следует выполнить командную строку
link /со имя_файла. ob;
Здесь следует учитывать то, что версия компоновщика link.exe должна поддерживать генерацию 16-разрядных приложений MS-DOS. Использование 32-разрядных компоновщиков приведет к ошибке создания ЕХЕ-файла.
Для генерирования 32-разрядных ЕХЕ-файлов следует использовать корректную версию компоновщика, при этом командная строка должна выглядеть так:
link /SUBSYSTEM:WINDOWS /0PT:N0REF имя_фдйла.ob;
Приведенных здесь сведений вполне достаточно для компиляции исходных текстов ассемблерных программ и процедур, представленных в книге. Более подробная информация о пакете MAS M доступна в Интернете, а также в многочисленных литературных источниках.
В последующих главах мы рассмотрим структуру данных и синтаксис команд макроассемблера MASM.
Глава 3Синтаксис языка ассемблера
Язык ассемблера, называемый также языком символического кодирования, представляет собой машинный язык в символической форме, которая более понятна и удобна программисту. Сложная внутренняя структура, разнообразные форматы команд, многочисленные режимы адресации процессоров Intel ограничивают возможности разработки сложных и объемных программ на языке ассемблера. Однако в любых сложных программах всегда существуют критические
Разработка программ на языке ассемблера требует хороших знаний архитектуры всей системы, включая режимы адресации данных, структуры памяти и системы команд процессора. Поэтому анализ возможностей ассемблера мы будем проводить в тесной взаимосвязи с архитектурой процессоров Intel Pentium. Напомню, что мы рассматриваем язык ассемблера, основанный на разработке фирмы Microsoft версии 6.14 и выше. Он включает в себя множество параметров, команд и директив, анализ которых займет много времени. Поэтому здесь будут рассмотрены только наиболее важные языковые конструкции, без знания которых создавать программы невозможно. Для такого анализа нужно четко понимать, как данные представляются в компьютере и каковы общие принципы их обработки, поэтому начнем именно с этого.
3.1. Представление данных в компьютере
В основе работы компьютера лежат понятия бита и байта – именно они представляют данные и команды в памяти. Минимальной единицей информации в компьютере является бит. Бит может принимать одно из двух значений: 0 или 1 – и является составным элементом для более информативных единиц данных. Минимальный объем информации, к которому имеется доступ в памяти компьютера, составляет один байт (8 двоичных разрядов, или битов), при этом говорят о байтовой организации памяти (хотя теоретически память может быть организована и по-другому). Все байты оперативной памяти нумеруются начиная с нуля. Местоположение каждого байта в памяти характеризуется его номером или, по-другому, адресом. Схематически байт представляет собой структуру данных, изображенную на рис. 3.1.
Рис. 3.1. Представление байта
Старший бит байта имеет номер 7, младший – 0. В оперативной памяти машины байты данных располагаются по возрастанию адресов (рис. 3.2).
Рис. 3.2. Адресация памяти
Исключение составляет специальная область памяти, называемая стеком, – в ней байты данных располагаются в сторону убывания адресов. Более подробно мы рассмотрим стек в последующих главах.
Редко случается так, что для представления данных требуется один байт. Во многих случаях данные нужно представить большим числом байтов. Если данные можно представить двумя байтами, то говорят, что они представлены словом. О данных, требующих для представления 4 байта, говорят, что они имеют размерность двойного слова. Наконец, данные могут быть представлены восемью (учетверенное слово) или шестнадцатью (двойное учетверенное слово) байтами. Во всех этих случаях расположение байтов соответствует правилу: младший байт располагается по младшему адресу, а старший байт – по старшему (рис. 3.3).
Нумерация байтов в обычных, двойных и учетверенных словах начинается с младшего (нулевого) байта и заканчивается 1, 3 и 7-м байтом соответственно. В документации часто используется такой способ расположения байтов, когда старшие байты располагаются слева, а младшие – справа. Пример такого расположения байтов в двойном слове показан на рис. 3.4.
Рис. 3.3. Представление данных различной размерности в памяти
Крайний слева байт принято называть старшим, а крайний справа – младшим. Такой порядок расположения байтов связан с обычной для нас формой записи чисел, когда в многоразрядном числе слева находятся старшие разряды, а справа – младшие. Следующее число опять начнется со старшего разряда и закончится младшим. Однако в памяти компьютера данные располагаются в более естественном порядке непрерывного возрастания номеров байтов, и, таким образом, каждое слово или двойное слово в памяти начинается с младшего байта и заканчивается старшим (см. рис. 3.4).