Чтение онлайн

на главную - закладки

Жанры

Журнал «Компьютерра» №29 от 16 августа 2005 года
Шрифт:
***

Второй козырь нового степпинга - поддержка набора инструкций SSE3, впервые появившегося в Pentium 4 Prescott[И поэтому также известного как Prescott New Instructions (PNI)]. Тринадцать новых инструкций (из которых две - MONITOR и MWAIT, связанные с технологией HyperThreading, - выделены в особый «подблок» и процессорами AMD принципиально не поддерживаются) есть своеобразная «работа над ошибками»; инженеры Intel посчитали целесообразным добавить их по итогам практического использования действительно новаторских SSE/SSE2. Каждая такая инструкция фактически рассчитана на использование буквально в одной-двух ситуациях, когда традиционные схемы требуют «недостаточно быстрых» (как в случае с HADDPS, осуществляющей сложение компонентов внутри одного вектора) или «некрасивых решений» (в случае с FISTTP, округляющей число в сторону нуля, как того требует стандарт языка C, независимо от выбранного для сопроцессора режима округления).

Потенциально все эти инструкции способны многократно повысить производительность некоторых участков кода; на практике[Подробности см. на www.anandtech.com/cpuchipsets/showdoc.aspx?i=2350] же такие участки встречаются сравнительно редко и с трудом поддаются «компиляторным» оптимизациям (программисту требуется либо использовать стандартные, вручную оптимизированные библиотеки, либо возиться с оптимизацией «критичных» участков кода на ассемблере, что требует сегодня очень высокой квалификации). Вдобавок для «неудачных» языковых конструкций (типа округления чисел с плавающей точкой в x87) давно найдены эффективные «обходные пути» с использованием «нетиповых» инструкций (PF2ID, CVTSS2SI или CVTPS2PI вместо стандартной FISTP). В итоге прирост производительности от поддержки SSE3 составляет всего пару процентов, лишь изредка доходя до 7-8%[В некоторых подтестах прирост производительности куда больший - до 25%, однако в целом даже в таких приложениях итоговая производительность увеличивается ненамного. Например, прирост скорости при кодировании видео в DivX - 0,26%]. Так что ожидать от SSE3 многого не приходится, однако «фича» это приятная.

Третье достоинство степпинга E - усовершенствованный контроллер памяти[По неофициальной информации, степпинг D имеет проблемы с интегрированным контроллером памяти: некоторые процессоры нестабильно работали даже на номинальных частотах. Правда, скорее всего, «бракованные» CPU были простой перемаркировкой своих менее дорогих и менее шустрых собратьев: тогда на рынке присутствовало много поддельных процессоров AMD, что даже вынудило компанию практически отказаться от треевых поставок в пользу боксовых (PIB) процессоров, надежно защищенных от подделок]. В основном изменения касаются улучшенной совместимости контроллера с «быстрыми» типами оперативной памяти - теперь можно использовать гораздо более быструю 1T-адресацию с одиночными (по одному на канал памяти, коих у Sempron один, а у Athlon 64 - два) модулями памяти практически любой организации (если сами модули, конечно, эту адресацию «вытянут») и с парами (для Athlon 64 это означает четыре модуля) односторонних модулей DDR400. Кроме того, появилась и долгожданная неофициальная поддержка нестандартной «быстрой» оперативной памяти стандартов DDR433, DDR466 и DDR500 без повышения тактовой частоты процессорной шины! Да-да, отныне преимуществами этих скоростных модулей смогут в полной мере насладиться не только оверклокеры, разгоняющие процессоры с риском для стабильности системы, но и добропорядочные пользователи, строго придерживающиеся спецификаций. Здесь, правда, следует сделать поправку на некоторые особенности архитектуры K8 (см. врезку); да и прирост производительности от 10-20% прибавки пропускной способности оперативной памяти не очень большой, однако в целом - штука чрезвычайно интересная. Для ее поддержки (чтобы появилась возможность выбрать «быстрые» разновидности оперативной памяти) требуется обновить BIOS; соответствующие апдейты к своим материнским платам многие производители уже выпустили. Правда, из-за того, что JEDEC (организация, занимающаяся выработкой стандартов на оперативную память) и DDR400-то стандартизировала «со скрипом», а о более быстрой памяти DDR пока и речи не идет, гарантировать, что свежекупленная «оверклокерская» память и процессор заработают на заявленных таймингах без проблем, вам никто не сможет.

Заявленное максимальное тепловыделение (TDP) осталось тем же, что и у «старичка» FX 55 (104 Вт): чуть ниже TDP новых двухъядерных процессоров (110 Вт), тоже основанных на степпинге E4. С полутора до 1,4-1,35 В снизилось напряжение питания ядра; слегка увеличился потребляемый при работе ток; однако проблем с совместимостью нового процессора со старыми схемами питания (VRM) возникнуть не должно[За исключением совсем уж дешевых или старых материнских плат, не обеспечивающих совместимости с FX55 и 90-нм процессорами]. По-прежнему разблокирован на повышение коэффициент умножения процессора; правда, разгоняется FX 57 пока довольно умеренно (с воздушным охлаждением можно заведомо рассчитывать разве что на 3,0 ГГц). Кстати, в отличие от тех времен, когда в линейке Athlon 64 FX фигурировал один и только один процессор, старый FX 55 будет выпускаться по-прежнему, но уже в 90-нм исполнении[Предыдущий вариант изготовлялся по старому 130-нм технологическому процессу, но якобы с некоторыми хитрыми «доработками» (выдвигались даже гипотезы о применении в FX 55 технологии DSL и частичном использовании 90-нм норм для критичных участков). Учитывая колоссальную стоимость разработки отдельного степпинга специально для ничтожного по объему выпуска FX 55, информация эта относится скорее к разряду мифических] и в степпинге E4. Вполне разумное решение, учитывая более приемлемую ($827) цену «младшей» модели и то, что «идеология» линейки FX (топовые и только топовые процессоры, лучшие в мире) при этом не нарушается: что FX55, что FX57 в своей «игровой» нише все равно конкурентов не имеют.

Модель: Airbus A380, Длина: 73 м, Высота: 24 м, Вес: 275 т (пустой), Максимальная скорость: 1050 км/ч, Крейсерская скорость: 1000 км/ч, Высота полета: 13000 м, Максимальная дальность полета: 13000 км, Двигатели: четыре двигателя Rolls-Royce Trent 900 или Engine Alliance, Количество посадочных мест: 555, Цена: $280 млн.

Тесты производительности

Ограниченность журнального пространства, к сожалению, не позволяет рассказать о полученных результатах подробнее. Так что просто смотрите в таблицу, а я постараюсь кратко прокомментировать самые интересные из них.

В играх Athlon 64 FX 57 просто нет равных. Причем чем новее и требовательнее к процессорным ресурсам игра, тем больше отрыв Athlon 64. В Half-Life 2 с его сложной реалистичной физикой (на движке Havok 2) отрыв FX 57 от лучшего решения Intel (Pentium 4 670) составляет, ни много ни мало, аж 36%! Причем обещанный в недалеком будущем FX 59 может довести этот разрыв до совсем уж неприличной полуторакратной (!) разницы; а никакого достойного «противовеса» в ближайшие несколько лет (!) Intel нам не обещает. Да, с появлением хорошо распараллеленных многопоточных игр ситуация может измениться; да, в играх с менее развитой (UT 2004 - 26%) и совсем неразвитой (Doom 3 -14%) физикой разница в производительности не столь значительна, однако то, что на ближайшие два года Athlon 64 FX будет безусловным лидером в играх, можно не сомневаться.

Вторая область, где FX безоговорочно лидирует, - это «интерактивные приложения». Буквально везде, где программа активно взаимодействует с пользователем, а не считает тихонечко чего-нибудь пару часов, Athlon 64 FX 57 без труда опережает всех преследователей.

***

Рендерить трехмерные сцены или кодировать видеофильмы пока, впрочем, лучше на процессорах Intel. Правда, на двухъядерных процессорах AMD это получается еще быстрее, но это уже совсем другая история. Однако положительные сдвиги у AMD есть и в этой области: например, в наших тестах FX 57 впервые сумел обогнать Pentium 4 670 при кодировании видео с помощью довольно популярного Windows Media Encoder 9. Да и в остальных тестах отставание не столь велико: скорее всего, заметной разницы вы здесь не почувствуете.

Единственное «слабое место» FX проявляется только при одновременной работе нескольких «тяжелых», ресурсоемких приложений. Производительность его при этом просаживается очень сильно, вплоть до «замораживания» под большой нагрузкой графического интерфейса Windows.

Модель: McLaren F1, Тип кузова: Купе, Длина: 4290 мм, Ширина: 1820 мм, Высота: 1140 мм, Клиренс: 120 мм, Снаряженная масса автомобиля: 1020 кг, Объем двигателя: 6064 см3, Привод: задний, Мощность двигателя: 550/7000 л.c., Крутящий момент: 600/4000 Нм, Передние тормоза: Дисковые вентилируемые, Задние тормоза: Дисковые, Цена: $890 тысяч

Отдавать процессор после недельного тестирования не хотелось. Очень не хотелось. Даже нам, завзятым железячникам, немало повидавшим на своем веку. На сегодняшний день это объективно лучший одноядерный процессор. Просят за него, конечно, немало, но он того стоит.

Благодарим компанию AMD за предоставленный образец процессора Athlon 64 FX 57.

Особенности работы интегрированного контроллера памяти в процессорах архитектуры K8

В CPU архитектуры K8 контроллер памяти интегрирован непосредственно в кристалл и соединен с ним, внешним миром и некоторой обслуживающей логикой через интегрированный в процессор же «свитч» (так называемый кросс-бар). Все это хозяйство работает на одной тактовой частотой с процессорным ядром, а потому чем выше частота - тем быстрее работают все компоненты чипа. Однако у подобного решения есть и недостатки: работать с оперативной памятью подобный контроллер может только в синхронном режиме. Проще говоря, в один такт шины памяти должно укладываться целое число тактов процессора. Нетрудно догадаться, что при подобном подходе тактовая частота оперативной памяти получается делением тактовой частоты процессора на некоторое целое число - коэффициент деления памяти (memory divider). Но всегда ли этот коэффициент можно подобрать? Ответить на этот вопрос нам поможет таблица.

Оранжевым цветом я выделил встречающиеся на практике комбинации коэффициентов деления памяти и процессорных множителей (и соответствующих им тактовых частот). Чем насыщеннее цвет - тем быстрее память. Нетрудно убедиться в следующем: благодаря тому, что опорные тактовые частоты шин HyperTransport и шины памяти DDR400[Правда, «несущая» тактовая частота шины HyperTransport выше и получается умножением базовой частоты на специальный «множитель HT». Например, у степпингов D и E этот множитель равен 5. С учетом того, что в HyperTransport данные передаются дважды за такт, «эффективная» частота передачи данных по стандартному линку HT у новых процессоров AMD составляет 2000 МГц, а не «базовые 200».] совпадают (200 МГц[Как и в случае с шиной HyperTransport, данные для DDR SDRAM (Double Data Rate SDRAM), что следует из названия, передаются дважды за такт. Поэтому тактовая частота DDR400 равна 200 МГц (400/2)]), подходящий целочисленный коэффициент (равный коэффициенту умножения процессора) для этого типа памяти всегда легко отыскать, причем тактовая частота оперативной памяти в точности равна стандартным 200 МГц. То же самое можно сказать про оперативную память DDR200 (выделена светло-серым). А вот с памятью других стандартов дела обстоят хуже.

Взглянем, например, на часто использующуюся совместно с процессорами Opteron оперативную память DDR 333. Нетрудно заметить, что подобрать коэффициент деления так, чтобы результирующая тактовая частота равнялась в точности 166,67 МГц, можно сегодня только в одном-единственном случае - при использовании процессора с частотой 2,0 ГГц. В остальных случаях приходится выбирать из «более или менее близких» к 166,67 МГц вариантов, от 160 до 169 МГц включительно. Но все-таки подобрать подходящие коэффициенты для DDR333 и DDR266 с приемлемой точностью можно всегда.

Поделиться:
Популярные книги

Мимик нового Мира 14

Северный Лис
13. Мимик!
Фантастика:
юмористическое фэнтези
постапокалипсис
рпг
5.00
рейтинг книги
Мимик нового Мира 14

"Фантастика 2023-123". Компиляция. Книги 1-25

Харников Александр Петрович
Фантастика 2023. Компиляция
Фантастика:
боевая фантастика
альтернативная история
5.00
рейтинг книги
Фантастика 2023-123. Компиляция. Книги 1-25

Девяностые приближаются

Иванов Дмитрий
3. Девяностые
Фантастика:
попаданцы
альтернативная история
7.33
рейтинг книги
Девяностые приближаются

Темный Лекарь 5

Токсик Саша
5. Темный Лекарь
Фантастика:
фэнтези
аниме
5.00
рейтинг книги
Темный Лекарь 5

Неудержимый. Книга VIII

Боярский Андрей
8. Неудержимый
Фантастика:
фэнтези
попаданцы
аниме
6.00
рейтинг книги
Неудержимый. Книга VIII

Чемпион

Демиров Леонид
3. Мания крафта
Фантастика:
фэнтези
рпг
5.38
рейтинг книги
Чемпион

Хочу тебя навсегда

Джокер Ольга
2. Люби меня
Любовные романы:
современные любовные романы
5.25
рейтинг книги
Хочу тебя навсегда

Отмороженный 7.0

Гарцевич Евгений Александрович
7. Отмороженный
Фантастика:
рпг
аниме
5.00
рейтинг книги
Отмороженный 7.0

Маршал Советского Союза. Трилогия

Ланцов Михаил Алексеевич
Маршал Советского Союза
Фантастика:
альтернативная история
8.37
рейтинг книги
Маршал Советского Союза. Трилогия

Волк 4: Лихие 90-е

Киров Никита
4. Волков
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Волк 4: Лихие 90-е

Довлатов. Сонный лекарь 3

Голд Джон
3. Не вывожу
Фантастика:
попаданцы
аниме
5.00
рейтинг книги
Довлатов. Сонный лекарь 3

Кодекс Охотника. Книга XIX

Винокуров Юрий
19. Кодекс Охотника
Фантастика:
фэнтези
5.00
рейтинг книги
Кодекс Охотника. Книга XIX

Везунчик. Дилогия

Бубела Олег Николаевич
Везунчик
Фантастика:
фэнтези
попаданцы
8.63
рейтинг книги
Везунчик. Дилогия

Идеальный мир для Лекаря 12

Сапфир Олег
12. Лекарь
Фантастика:
боевая фантастика
юмористическая фантастика
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря 12