Журнал «Компьютерра» № 10 от 14 марта 2006 года
Шрифт:
Новый техпроцесс получил вполне привычное название – P1264 (до того использовался 90-нм P1262, а еще раньше – 130-нм P1260), привычные производственные материалы и привычное производственное оборудование – ультрафиолетовые литографические инструменты на основе 193-нм лазеров. Даже в 90-нм P1262 разнообразных технологических новшеств было больше (что уж говорить о принципиально новом P1260) – однако в P1264 удалось обойтись без особых ухищрений, ограничившись лишь небольшими улучшениями и усовершенствованными фазосдвигающими масками. Среди улучшений – переход к использованию в качестве электропроводящего материала силицида никеля (NiSi) и слегка доработанная технология «напряженного кремния», позволяющие снизить (в первом случае – за счет уменьшения электрического сопротивления, а во втором – за счет большего рабочего тока при тех же токах утечки) тепловыделение кристалла. А вот толщину изолирующего оксидного слоя в новом техпроцессе изменять, как это делалось раньше, не стали, сохранив ее на уровне 1,2 нм. Кроме того, в кристалл, ранее насчитывавший семь слоев, добавлен восьмой слой[В свое время AMD за счет этого дополнительного слоя сделала из неудачного, горячего и плохо масштабировавшегося по частоте 130-нм Throughbred-A отличный 130-нм Throughbred-B], позволяющий повысить плотность электрических контактов, скорость распространения электрических сигналов и снизить «межконтактную» емкость. Собрав эти «мелочи» вместе, технологам удалось совершить маленькое чудо: сохранив все преимущества «тонкого»
Тем не менее, заполучив в свое распоряжение прогрессивный техпроцесс, сильно изменять ядро Pentium 4 Prescott в связи с «похоронами» NetBurst разработчики не стали. Новые ядра (кодовое название CedarMill) «официально» получили кэш-память объемом 2 Мбайт, технологию виртуализации Intel Virtualization Technology (VT-x, aka Vanderpool) и сниженный с 14 до 12 минимальный множитель. Причем (сюрприз, сюрприз!) в степпингах E0 и R0 «старичка» Prescott мы все это уже видели. Даже тактовые частоты, несмотря на явный задел, поднимать не стали: для одноядерных CedarMill верхним пределом сегодня стала частота 3,6 ГГц (понижена с прежних 3,8 ГГц Prescott), а для двухъядерных Presler – 3,55 ГГц (повышена с 3,20 ГГц Smithfield). По сути, почти весь созданный новым технологическим процессом задел для повышения тактовой частоты (а если слова о 40% увеличения быстродействия транзисторов правдивы, то новые Pentium 4 могли бы постепенно достичь 5 ГГц) так и остался неиспользованным (хотя оверклокеры будут счастливы) – Intel улучшила лишь результаты откровенно провального Pentium D 3,20 ГГц. Отчасти это вызвано желанием снизить тепловыделение (в первом приближении оно пропорционально частоте), а отчасти «политическими» мотивами: все-таки NetBurst, при всех своих недостатках, была невероятно прогрессивной архитектурой, и грядущий «суперпроцессор» Conroe мог бы и не догнать «второй Northwood», неожиданно преодолевший технологические проблемы[А вот в Conroe, похоже, из 65-нм выжмут все, что только можно. И похоже, что ценой традиционно немаленького тепловыделения изначально «мобильного» чипа]. Вдобавок, похоже, что увеличенный до 4 Мбайт (2+2) кэш двухъядерников сыграл-таки негативную роль, поскольку снижения TDP для двухъядерных процессоров так и не произошло: оно по-прежнему составляет 130 Вт у старших моделей. Правда, измерения показывают, что новый 955-й Pentium Extreme Edition значительно экономичней прежнего лидера – 840-го (возможно, оценка в 130 Вт для предыдущего поколения была «слегка» оптимистична?), хотя и рассеивает тепла раза в полтора больше, чем сопоставимое по производительности решение конкурента. Так или иначе, на 10–20% тепловыделение новых процессоров снизили – и прекрасно.
Еще один немаловажный момент, связанный с новым технологическим процессом, -заметно возросшая производительность (в смысле – количественные возможности по выпуску процессоров с одной пластины) и пропорционально снизившаяся себестоимость производства. Площадь одноядерного CedarMill (с двухмегабайтным кэшем!) уменьшилась до скромнейших 81 кв. мм, мало того – новые двухъядерники, в отличие от ядра Smithfield, «собираются» из двух независимых ядер CedarMill в одном корпусе. В принципе, Smithfield и так был не более чем объединением двух ядер Prescott, но их приходилось делать в виде единого кристалла. Ну а теперь, похоже, нашелся удобный способ независимой упаковки двух кристаллов в один процессор. Кстати, Presler (это не отдельное ядро, а два CedarMill) станет не единственным процессором, использующий эту технологию: ближе к 2007 году похожим образом Intel собирается выпускать четырехъядерные процессоры, упаковывая по два двухъядерных кристалла. «Двойная упаковка» очень технологична (не нужно одновременно производить два типа кристаллов, меньше влияние возникающих дефектов, больше выход с одной пластины) и, в принципе, позволяет Intel легко перевести в 2006 году большую часть своих процессоров на использование двух ядер. Или, как вариант, сильно снизить цены на свою продукцию, и без того продающуюся недорого. «Продержаться» до выхода Conroe тоже как-то необходимо, а AMD, несмотря на сократившийся разрыв в производительности двухъядерных процессоров, пальму первенства по быстродействию и тепловыделению уступать в ближайшие полгода явно не намерена.
В мобильном секторе все гораздо сложнее. Новые 65-нм процессоры (кодовое название Yonah[Строго говоря, есть несколько разных Yonah. По числу ядер есть Yonah1 и Yonah2; а ближе к 2007 году, возможно, под названием Stealey выйдет и «дешевый» одноядерный Yonah1 с урезанной до 512 Кбайт кэш-памятью L2]) – впервые в мире мобильных CPU – являются двухъядерными, причем построенными на основе прогрессивной технологии, общей для двух ядер кэш-памяти второго уровня. Правда, два ядра – это удвоенное тепловыделение, которое трудно компенсировать даже более тонким технологическим процессом, поэтому при работе ноутбука от батарей процессор незаметно «превращается» в одноядерный, если мощность второго ядра не требуется. Добавили в процессор и поддержку технологии виртуализации Intel VT-x. Правда, кэш-память второго уровня увеличивать по сравнению с предыдущим поколением Dothan не стали – она так и осталась равной 2 Мбайт, что для одноядерных, что для двухъядерных вариантов. Заодно процессоры получили новую систему маркировки, а соответствующая платформа (Centrino третьего поколения) была названа Napa.
Далеко не везде от процессора требуется очень высокая производительность. Особенно если речь идет о производительности в вычислениях с плавающей точкой (FP). Например, Itanium в таких вычислениях несомненный лидер – и где x86, а где Itanium[На то, конечно, есть и другие важные причины, но…]? Зато частенько требуется обеспечить небольшое тепловыделение, причем как для ноутбуков, так и для настольных систем и, что самое парадоксальное, серверов. Парадоксальное – потому что для серверов, в принципе, не слишком важны тишина и сложность системы охлаждения – сервер все равно стоит в отдельном, а зачастую – и в специально кондиционируемом помещении[А завтра, глядишь, и к системе фреонового охлаждения подключать начнут. Вроде той разработки крупной российской компании Kraftway, о которой мы рассказывали в прошлогоднем #46]. Однако усиливающееся влияние кластерных систем диктует свои законы – и сегодня «в моде» блейд-серверы и прочие «тонкие» одно-двухъюнитовые решения, позволяющие установить в одну стойку множество небольших однотипных серверов. Желательно двух-, а еще лучше – четырехпроцессорных. И поскольку это совсем недорого – двухъядерных. Помножьте 130 (если не 180) ватт TDP двухъядерных Xeon на два сокета и 42 сервера в стойке – и представьте себе задачу энергоснабжения и последующего отвода более 12–16 кВт мощности. Особенно если таких стоек – целый зал. Нужно ли после этого удивляться, что располагающая более чем двумястами тысячами серверами Google решила расширить свою базу за счет серверов, построенных на процессорах AMD.
Впрочем, методики решения подобных «небыстрых, зато холодных» задач давным-давно отработаны и сводятся к использованию ноутбучных процессоров в несвойственных им системах. К примеру, новые десктопные системы от Apple используют процессоры Core Duo. С серверными процессорами так же просто поступить невозможно – они требуют специальной инфраструктуры, сертификации, чипсетов и, главное, возможности работать в многопроцессорных конфигурациях. Однако особого труда для Intel подобная адаптация, похоже, не составляет, так что уже в самое ближайшее время мы увидим серверную модификацию Core Duo на ядре Yonah в виде низковольтных семейств процессоров Xeon LV и Xeon ULV (ядро Sossaman). Работая на частотах порядка 1,67–2,0 ГГц, они не будут блистать производительностью и не будут поддерживать 64-битные расширения, – зато будут обладать более чем конкурентоспособными тепловыми пакетами в 31 и 16 Вт соответственно против 60/30 Вт у HE (и EE – модификаций Opteron[У Intel и AMD методики измерения тепловыделения CPU отличаются (Intel указывает типичное тепловыделение, AMD – максимальное), так что прямое сравнение TDP некорректно]). Выходящая в середине нынешнего года серверная ипостась Conroe – ядро Woodcrest – столь же низким тепловыделением похвастать не сможет, так что линейка Sossaman’ов в исполнении Socket 479, похоже, обречена на долгое пребывание на рынке.
В секторе «не-столь-компактных» систем дела обстоят проще: на смену текущему (прямо скажем, не слишком удачному) двухъядерному процессору Intel Xeon «Paxville», должен прийти заметно более производительный и менее горячий 65-нм эквивалент Presler под кодовым названием Dempsey. Обладая вдвое увеличенным кэшем L2, а также более быстрой 1066-МГц системной шиной, Dempsey обещает стать весьма интересным продуктом. Заодно с Paxville Dempsey вытеснит и одноядерный Xeon DP «Irwindale». В секторе MP-процессоров (4-сокетные системы и выше) на смену ядру Potomac (серверный аналог ядра Prescott с 1-Мб L2 и 8-Мб L3) придет сложнейший двухъядерный 65-нм процессор Tulsa с 16 Мбайт общей кэш-памяти L3. В отличие от других своих двухъядерных 65-нм собратьев Tulsa будет выполнен в виде одного кристалла (сказывается общий L3) с громадной площадью 435 кв. мм. 1,33 млрд. транзисторов – это не шутка. Хотя ему далеко до другого «долгостроя» – двухъядерного Itanium 2 «Montecito» (1,72 млрд. транзисторов, 595 кв. мм). Что за проблемы с этим чудом техники, насчитывавшем, помимо двух ядер, поддерживавших своеобразную[Нет, это не Hyper-Threading для Itanium 2, хотя формально технологии и похожи. Temporal Multi-Threading, или Helper Threads, основывается на несколько других принципах] многопоточность (по два потока на ядро), 24 (12x2) мегабайта кэш-памяти L3 и производящимся по 90-нм технологическому процессу, приключились у Intel – неизвестно, но то что они были – несомненно. Montecito изрядно опоздал с выходом на рынок и «слегка» подрастерял свои тактовые частоты и заявленные поначалу «фичи». Впрочем, это все равно очень хороший процессор с впечатляющей производительностью, «смена» которого ожидается не раньше 2007 года
Попутно с процессорами анонсированы и новые чипсеты для DP-систем – Blackford и Greencreeck. В числе новшеств – переход на две независимые процессорные шины (пропускной способности одной шины для многопроцессорных многоядерных систем катастрофически не хватает) и переход к использованию новой оперативной памяти FB-DIMM. Вскоре изменится и сокет – вслед за Pentium 4 процессоры Intel Xeon переберутся с Socket 603/604 на разъем LGA 771.
Вышеперечисленными моделями Intel, конечно, не ограничивается. Горячие головы уже рассказывают о планах уважаемой корпорации едва ли не до 2008 года, и если верить им, то первый четырехъядерный процессор Intel появится уже в конце текущего – начале следующего года и будет представлять собой два кристалла архитектуры Conroe в одной упаковке. Серверная модификация выйдет чуть раньше и получит название Clovertown; настольная – на полгода позже и будет называться Kentsfield. Заодно выйдет и 65-нм четырехъядерная версия Itanium (надеемся, что история с Montecito не повторится) с кодовым названием Tukwilla, хотя в отношении Itanium технологический процесс 90-нм не будет забыт даже тогда – на его основе выпустят «доработанный» Montecito (видимо, такой, каким его обещали изначально) под названием Montvale. Тогда же начнется интересный процесс объединения линеек Xeon и Itanium, поскольку через пару лет и те и другие будут переведены с существующих FSB на новую последовательную шину CSI (Common System Interface), являющуюся своеобразным аналогом шины AMD Hyper-Transport и, как и последняя, обеспечивающую очень широкую совместимость с наборами системной логики. Фактически станет возможным ставить в один и тот же сервер как Xeon, так и Itanium, что, за счет широко используемой инфраструктуры, теоретически должно резко снизить стоимость систем на основе последних.
В общем, скучать нам в ближайшие года два не придется. Некоторый «застой», наблюдавшийся последний год, медленно, но верно уходит в прошлое: похоже, что уже в 2006-м мы увидим очередной виток противостояния ведущих процессорных компаний, с присущими ему ценовыми войнами, гонкой мегагерц и выпуском принципиально новых CPU. А конечный пользователь от этого, как всегда, только выиграет.
Проблема с современными «тонкими» технологическими процессами – в том, что для производства очень маленьких «рисунков» на поверхности кристалла используется свет с «большой» длиной волны. «Большая» длина лежит, правда, где-то в области глубокого ультрафиолета, но ситуацию это не меняет – при длине волны 193 нм свет, в силу волновых свойств, попросту огибает препятствия с размерами, почти на порядок меньшими (65-нм транзистор, 35-нм затвор). А уменьшить длину волны не получается – еще чуть-чуть, и излучение станет настолько жестким, что начнет ионизировать большинство используемых сегодня в оптических системах материалов, вынуждая отказаться от линзовых систем в пользу систем зеркал (которые, к слову, в разрабатываемых EUV-установках тоже быстро разрушаются) и совершенно новых фоторезистов. Ведутся разработки систем с промежуточной 157-нм волной, для которой еще можно что-то подобрать без радикальных конструктивных изменений и «мокрых» иммерсионных технологий, использующих принцип уменьшения длины волны в жидкостях с высоким коэффициентом преломления. Но из лабораторий они пока не вышли и к тому же повышают доступное разрешение всего лишь в 1,5–2 раза.
Предложенное еще при переходе индустрии на 90-нм технологический процесс решение можно охарактеризовать как своеобразное «приручение» волновых свойств света, превращение их из врага в союзника. Рисунок маски, который литографическая установка переносит на кремниевую пластину, изменяют особым образом, где-то «подрисовывая» лишнее, где-то «убирая» нужное (OPC – Optical Proximity Correction) и используя в некоторых местах вставки, «поворачивающие» фазу на 180° (APSM – Alternating Phase Shift Mask). Процесс этой «доработки», ведущей от изначальной задумки инженеров к итоговой маске, полностью автоматизирован – новый рисунок попросту пересчитывается на компьютере. В итоге удается даже с обычной 193-нм литографией «рисовать» транзисторы для 45-нм технологии, а вместе с 157-нм и иммерсионными технологиями он обеспечит индустрии вполне приемлемые инструменты и для 32-нм и 22-нм техпроцессов, освоение которых намечено на 2009 и 2011 годы. А там, глядишь, еще что-нибудь изобретут – и почти рентгеновские установки «экстремального ультрафиолета» EUV с длиной волны 13 нм, которые нам обещали к 2003 году (а сегодня обещают к 2009-му), уже не понадобятся. В любом случае запас прочности на ближайшие лет пять у разработчиков процессоров есть.