Радость познания
Шрифт:
Параллельные компьютеры
Первая тема касается параллельных компьютеров. Почти все современные компьютеры, обычные компьютеры, работают на компоновке или архитектуре, придуманной фон Нейманом [6] , в которой существуют очень большая память, где хранится вся информация, и одна центральная область, в которой проводятся простые вычисления.
Мы берем одно число из одного отдела памяти, а другое — из другого отдела памяти, посылаем их в центральное арифметическое устройство для их сложения, а затем отсылаем ответ обратно в некоторое место памяти. Существует, по сути, один центральный процессор, который работает очень-очень быстро и очень напряженно, в то время как память в целом не участвует в процессе и представляет быстрый картотечный ящик с файловой структурой, который очень редко используется. Совершенно очевидно, что чем больше процессоров работают одновременно, тем быстрее мы должны выполнять вычисления. Но здесь возникает затруднение: допустим, кому-то, работающему на одном процессоре, понадобится та же самая информация из памяти, что и другому,
6
Джон фон Нейман (1903–1957) — венгерско-американский математик, его считают одним из отцов вычислительных машин. — Примеч. ред. иностр. издания.
Некоторые шаги в этом направлении были предприняты на так называемых векторных процессорах. Если иногда вам необходимо выполнить одинаковые действия на многих различных элементах, вы, возможно, выполняете их одновременно. В принципе можно написать правильные программы стандартным способом, и тогда интерпретирующая программа автоматически поймет, когда полезно использовать эту векторную возможность. Такая идея применяется в компьютерах американской фирмы «Cray» и в японских «суперкомпьютерах». Другой проект состоит в том, чтобы взять большое число эффективно работающих относительно простых (но не слишком упрощенных) компьютеров и соединить их вместе в некоторую структуру. Тогда все они могут работать, составляя часть схемы. Каждый компьютер является совершенно независимым, причем они будут передавать информацию от одного к другому, когда один или другой в ней нуждается. Такого рода схема реализована, например, в Калтехе (Калифорнийском технологическом институте), в гиперкубе «Cosmic Cube», и представляет только одну из многочисленных возможностей. Сегодня многие конструируют такие машины. Другая возможность — распределить очень большое число очень малых центральных процессоров вокруг памяти. Каждый процессор общается только с малой частью памяти, и существует детально разработанная система взаимосвязей между ними. Примером такой машины является the Connection Machine (машина с переменной структурой связей с параллельными процессорами), созданная в MIT (Массачусетсом технологическом институте). Она имеет 64 000 процессоров и систему маршрутизации, в которой каждые 16 могут переговариваться с другими 16, и, таким образом, получается 4000 возможностей маршрутного соединения.
Многие научные задачи, такие, например, как прохождение волн через некоторые материалы, можно было бы очень легко решить, применив параллельное соединение процессоров. Дело в том, что происходящее в данной части пространства в некоторый момент времени может быть определено локально — нужно только знать давление и напряжение от соседних объемов. Ответ можно вычислить одновременно для каждого объема, и эти граничные условия соединяются с различными объемами. Вот почему такой тип модели работает для решения подобных задач. Если задача достаточно обширна, следует выполнить большой объем вычислений. Параллельное соединение компьютеров может значительно ускорить время решения задачи, и этот принцип применяется не только в решении научных задач.
Куда подевалось предубеждение двухлетней давности, будто параллельное программирование трудновыполнимо? Выходит, то, что было сложным и почти невыполнимым, вскоре станет обычной программой и продемонстрирует на примере этой программы эффективность параллельного соединения компьютеров. Принимая во внимание, что мы имеем возможность параллельных вычислений, нужно полностью переписать программы, по-новому переосмыслив, что происходит внутри машины. Невозможно эффективно использовать старые программы. Это колоссальное неудобство для большинства промышленных приложений, из-за этого идея может натолкнуться на значительное сопротивление. Но большие программы, как правило, дело ученых или специалистов — умных и способных программистов. Они любят свое дело и горят желанием начать все заново. Они готовы переписать программы, если это позволит сделать их более эффективными. Итак, следует перепрограммировать тяжелые, огромные программы новым способом, и когда все в конце концов придут к этому, появится все больше и больше новых программ и программисты научатся с ними работать.
Снижение энергетических потерь
Вторая тема, о которой я хочу рассказать, — это энергетические потери в компьютерах. Тот факт, что они должны охлаждаться, является очевидным ограничением для создания больших компьютеров — уже немало усилий потрачено для охлаждения такой машины. Я хотел бы объяснить, что это просто результат плохой разработки и не содержит ничего фундаментального. Внутри компьютера каждый бит информации контролируется проводом, находящимся под тем или иным напряжением. Это называется «один бит», и нам нужно менять напряжение на проводе от одного значения до другого, увеличивать или снимать с него заряд. Я приведу аналогию с водой: мы наполняем сосуд водой до определенного уровня или опустошаем его до другого уровня. Это только аналогия — если вам нравится более реалистическая задача с подачей электричества, вы можете придумать более точную электрическую схематику. То, что мы сделаем сейчас, есть аналог происходящего в случае с водой: наполним сосуд, наливая в него воду до верхнего края (Рис. 1),и будем понижать ее уровень, открыв нижний кран и позволив всей воде вытечь из сосуда. В обоих случаях существуют потери энергии из-за внезапного перепада уровня воды от высоты верхнего уровня, до которого она была налита, до нижнего уровня дна, и когда вы начинаете снова наливать воду — наоборот. В случае напряжения и заряда возникает та же самая ситуация.
Это аналогично тому, как объяснял мистер Беннет, управляя автомобилем, — он начинает двигаться при включении зажигания и останавливается при нажатии на тормоз. Каждый раз при включении зажигания и затем при нажатии на тормоз вы теряете мощность. Другой способ провести аналогию с автомобилем — обеспечение связи колес с маховиками. Когда автомобиль останавливается, скорость маховика увеличивается; таким образом, сохраняя энергию, связь может заработать, и автомобиль опять начнет двигаться. Аналог с водой будет следующим: пусть у вас есть U-образная трубка с краном в центре на ее дне, соединяющая два рукава U-образной трубки (Рис. 2).Мы начинаем заполнять ее доверху справа, причем левая часть остается пустой, кран перекрыт. Если теперь открыть кран, вода будет перетекать в другую часть трубки, мы снова своевременно перекроем кран, вода сохранится в левой стороне. Теперь мы хотим двигаться в другую сторону — снова откроем кран, и вода потечет обратно, мы ее там опять сохраним. Но налицо некоторые потери, вода уже не поднялась так же высоко, как прежде, и нам надо добавить немного воды, чтобы скорректировать потерю — потеря энергии много меньше, чем в методе прямого заполнения. Эта хитрость использует инерцию воды, аналог этого для электричества — индуктивность. Однако на современных кремниевых транзисторах очень трудно скомпенсировать индуктивность на чипах. Поэтому эта методика не слишком удобна при существующей технологии.
Еще один способ — наполнить резервуар с помощью источника напряжения, который устанавливается лишь не намного выше уровня воды. Источник своевременно поднимается, когда мы заполняем резервуар (Рис. 3),так что перепад уровня воды всегда мал на протяжении всего опыта. Таким же образом мы могли бы воспользоваться выпускным отверстием для понижения уровня в резервуаре, но сбрасывать воду вблизи верха и низа трубки так, чтобы тепловые потери в месте расположения транзистора не возникали или были небольшими. Реальный объем потерь будет зависеть от того, насколько велико расстояние между источником напряжения и поверхностью воды, когда мы наполняем резервуар. Этот метод соответствует изменению со временем подачи напряжения на источник. Итак, если пользоваться источником с меняющимся со временем напряжением, то можно применять этот метод. Безусловно, существуют потери энергии в самом источнике, но все они локализованы в одном месте, где несложно создать одну большую индуктивность. Эта схема называется «горячие часы», так как источник напряжения работает одновременно и как часы, которые фиксируют продолжительность чего-либо. Кроме того, нам не требуется дополнительного сигнала часов, чтобы измерять циклы, как это делается в обычных конструкциях.
Оба последних устройства используют тем меньше энергии, чем медленнее они движутся. Действительно, схема U-образной трубки не будет работать, пока ее центральный кран не сможет открываться и закрываться медленнее, чем вода в трубке будет успевать перетекать туда и обратно. Следовательно, мои устройства должны быть медленными, я сохранил энергетические потери, но сделал устройства медленными. Фактически энергетические потери, умноженные на время, необходимое для рабочего цикла, остаются постоянными. И все-таки это оказывается очень удобным, поскольку время, показываемое часами, много больше времени цикла для транзисторов, и мы можем этим воспользоваться, чтобы понизить энергию. Кроме того, если, к примеру, мы выполняем вычисления в три раза медленнее, мы могли бы использовать одну треть энергии три раза за время, которое содержит в девять раз меньшую мощность, чем должна растрачиваться. Может быть, это стоящая мысль. Может быть, при конструировании с применением параллельного соединения компьютеров или при других способах работы мы затратим немного больше времени, чем при максимальной скорости цикла, сделаем машины больше, чем обычно, но при этом еще снизим энергетические потери.
Для транзистора энергетические потери, умноженные на время, затрачиваемое на работу, являются результатом умножения нескольких факторов (Рис. 4):
1. Тепловой энергии, пропорциональной температуре, кТ,
2. Длины транзистора между источником и выводом тока, деленной на скорость внутренних электронов (тепловая скорость 3kT/m);
3. Длины транзистора в единицах среднего свободного пробега электронов до соударения в транзисторе;
4. Полного числа электронов, находящихся внутри транзистора во время его работы.
Подставляя соответствующие значения всех этих величин, получим, что энергия, используемая в транзисторах, в настоящее время приблизительно в миллиард — десять миллиардов или еще больше раз тепловой энергии кТ.Когда транзистор включен, он использует эту огромную энергию. Это очень большая величина. Безусловно, хорошая мысль — уменьшить размеры транзистора. Мы уменьшаем длину между источником и выводом тока и можем уменьшить число электронов, тем самым существенно понизив энергию. Оказывается, что чем меньше транзистор, тем быстрее он работает, так как электроны могут проходить через него быстрее и быстрее его включать. Исходя из любых соображений, хорошо бы сделать транзистор поменьше, и все пытаются это сделать.