Разбег в неизвестность
Шрифт:
Облом получился оглушительный. Сперва собирался задвинуть CD в дальний ящик и не доставать его оттуда лет пять. Да что там, я бы именно так и сделал, тем более что глаза от рассматривания «питов» болели так, что пришлось идти к врачу за каплями. Но неожиданно вмешалась Катя, которую я по неосмотрительности привлек к задаче. В порыве комсомольского энтузиазма жена сначала просто взывала к моей совести, а затем перешла на серьезные угрозы типа «тогда я сама во всем разберусь!».
Пришлось думать. Первым делом напряг память и вспомнил, что перед пользовательскими данными должен быть не просто заголовок, а отдельный раздел. Проверка показала, что на экспериментальном CD-RW его можно обнаружить только в микроскоп, а вот на старых аудиодисках он виден невооруженным глазом. Более того, всего областей три, условно я их назвал стартовая (ближе к центру) [261] , основная и финишная (вдоль края).
261
Стартовая
Причем объем первой и последней огромен, по прикидкам – не менее десяти мегабайт. Не знаю, зачем создателям потребовалось столько места, но одной проблемой стало меньше.
Неделю мы с Катей изучали «область данных» при помощи затребованного мощного микроскопа с пристроенным фотоаппаратом. Записывали, стирали, снова записывали разные куски всякими замысловатыми способами. Определенный прогресс был, в пакетном режиме количество появляющихся за сессию данных уменьшалось почти на порядок [262] . Но при этом все равно оставалось невообразимо большим для ручной обработки. Дошло до того, что мне вместо успокаивающей эротики начали сниться черточки, точки и целые поля, заполненные этими проклятыми символами прогресса! И это при том, что последнее время секс у нас в семье был исключительно с диском и микроскопом!
262
В этом случае перед пакетом должен идти один связующий (link) сектор и 4 вводных (run-in). После должны быть записаны 2 выводных сектора (run-out). Всего на сессию получится чуть менее полумиллиона «питов».
Но терпение супруги подошло к концу, я уже предвкушал заслуженные выходные. И все же удача явно была на стороне Кати, когда она добралась до режима «Format CD». Ранее я уже пробовал этот вариант и отбросил его как непригодный, когда после нескольких минут работы «Nero» практически весь диск покрылся записанными кусками. Моя жена пошла немного дальше – она выяснила, что с обработанным таким образом CD-RW можно обращаться как с обычным жестким диском [263] , то есть записывать на него файлы быстро и без всяких сессий. Очевидное на первый взгляд знание – но в «прошлом будущем» мне ни разу не приходилось использовать CD подобным образом.
263
Предварительным форматированием можно организовать CD-RW как устройство прямого доступа. При этом вспомогательные сектора занимают около 120MB. «Nero» – популярная программа для записи CD.
Дальше шли мое самобичевание собственной тупости, снисходительно-победная улыбка супруги и отупляющие поиски куска, который изменился в результате записи. Нельзя сказать, что найти его было просто, скорее, нам наконец-то повезло… Если, конечно, это можно так назвать, ведь файл в несколько сотен байт при записи каким-то загадочным образом умудрился превратиться во много десятков тысяч «питов»! [264]
Отступать было поздно, пришлось вспомнить времена «Аватара». По моему техзаданию на базе микроскопа и кинокамеры собрали специальный «комбайн», обеспечивающий покадровую съемку. Отдельной задачей был плавный механизм поворота диска на несколько десятых миллиметра зараз, если смотреть на край. Так, чтобы в захват объектива влезала каждый раз новая порция из двух-трех десятков «питов». С помощью этой техники за пару недель удалось превратить физические дорожки в слое пластика во вполне разборчивые кадры.
264
Длина «сырой» емкости сектора CD – ровно 2352 байта, не больше и не меньше. Однако в силу раскрытых ниже по тексту особенностей он «вырастает» после записи почти в три раза.
Впрочем, на все терпения не хватило. Справедливо рассудив, что чудес не бывает, я предположил, что нужное для расшифровки хранится в начале или конце найденного куска, поэтому мы ограничились пятьюстами кадрами или десятком тысяч бит с обеих сторон. Результатом работы стала здоровенная катушка пленки, которая поехала к шифровальщикам КГБ вместе с распечаткой эталонного файла и моими смутными догадками о способах и особенностях записи.
Специалисты за какие-то полтора месяца блестяще справились с предложенным квестом. Более того, комитетчики были в восторге от продуманной сложности метода записи данных на неизвестный носитель. Хорошо хоть лишние вопросы не задавали, наверняка считали, что остальные части секретного устройства исследуют их же коллеги.
В общем, корректирующий код оказался новейшим, но уже вполне известным, носил имя Рида – Соломона [265] и имел в основании число двести пятьдесят шесть. Однако в технике код не использовался, и мне быстро объяснили причину. Сам по себе процесс кодирования очень прост. Порцию данных в два килобайта нужно всего-то «пропустить» через полином, порожденный правилами арифметики Галуа. Тут лучше не вдумываться в непонятные термины, а верить специалистам на слово. Плохо другое, алгоритм исправления ошибок как минимум на порядок сложнее, следовательно, на скорости в триста бод с ним не справится даже целая БЭСМ-4.
265
Код Рида – Соломона был изобретен в 1960 году Ирвином Ридом и Густавом Соломоном. Для записи CD-дисков его применили в 1982 году. В данном случае алгоритм позволяет исправлять до 392 байт на блок данных из 2048 байт.
Стала понятной и наша с Катей неспособность что-то разобрать в записи. Оказывается, каждый байт из потока уже закодированных данных подвергался преобразованию в четырнадцать бит, а между этими словами вставлялись как разделители трехбитные куски, так, чтобы на носителе было не более десяти нулей или единиц подряд. Дополнительно к этому добавлялись синхробайты, контрольная сумма и байт служебной информации непонятного назначения [266] .
Уж не знаю, сколько седых волос нажили специалисты-криптографы, разбираясь в этом «взрыве мозга». Все равно применить корректирующее кодирование на практике нельзя, оно невообразимо сложно для тысяча девятьсот шестьдесят шестого года [267] . Причем не только алгоритм Рида – Соломона, а любые известные науке варианты. Их, кстати, хватает – у капиталистов отличился Хемминг, в СССР завкафедрой Ленинградской академии связи товарищ Финк предлагал комитетчикам сверточный код еще в конце пятидесятых… Разумеется, никто не запрещал сначала создавать образ диска на ЭВМ, а уже потом «кидать» его на резец. Но для этого надо подготовить блок данных в ОЗУ или на магнитном барабане и лишь потом переносить его на «виниловую дискету». В теории вполне реально, но практика шестидесятых сразу ставила крест на затее. Не было тут подходящих объемов памяти, и процессорное время стоило совсем не копейки. Потратить несколько часов ЭВМ ради удобства хранения данных? Спецы только пальцем у виска покрутят да вежливо пошлют… В сад, ага.
266
Для физической «читабельности» применяется 14-битное EFM-слово (от англ. «Eight to Fourteen Modulation» – модуляция восемь в четырнадцать).
267
Первое применение в серийном изделии код Рида – Соломона получил в контроллере жесткого диска IBM 3370 емкостью 571 Мбайт в 1979 году.
Пришлось откатиться на позорный примитив. Федор от расстройства задействовал триады, например, вместо «1» – писал «111». Безусловно, надежность резко выросла, зато емкость упала катастрофически. Двадцать килобайт, на мой взгляд, попросту не стоили возни, так как влезали на полсотни метров широко распространенной перфоленты.
Поэтому опробовали более экономный вариант – навесили на блоки записываемых данных биты четности для проверки контрольной суммы, и начали записывать на пластинку сразу две копии, разнеся их на пару килогерц. Соответственно, при считывании использовался только «целый» блок. Но ничего хорошего из этого не получилось. Надежность обнаружения дефекта по одному биту оказалась недостаточной, требовалось серьезное усложнение. Вроде бы ничего страшного, задача вполне посильная для техники шестьдесят шестого года… Но уж слишком часто при механическом повреждении дорожки погибали сразу обе копии. В принципе решение нашли и тут, достаточно было один из каналов «резать» с задержкой по времени…
Однако на этой стадии мне стало окончательно понятно – дешевого и «красивого» варианта не получится. Все эти нагромождения имели смысл только совместно со сложным специализированным контроллером, в котором имелись и «математика», и буферная память. По меркам текущей эпохи результатом реализации нашего затянувшегося экспромта грозил стать основательный «шкаф».
Если уж «городить огород», то лучше сразу с магнитным или оптическим диском. Там хоть перспектива очевидна, тогда как винил – не более чем паллиатив на пяток лет. Проект пришлось свернуть. Резак так и оставили «пользоваться» на ВЦ ТЭЦ. Выжимку из исследований с шикарными фотографиями опубликовали в «компьютерном» приложении к журналу «Радио», благо секретность работы была нулевая, эффект примерно такой же, а вот с интересным контентом напряженка.
Сухой остаток напоминал анекдот. Вместо купания лошадей в шампанском облили пивом котенка. Единственный алгоритмический бонус имел горький привкус, даже на основе грампластинки нельзя было сделать ничего толкового без микросхем. Ранее я думал, что для копирования CD-ROM не хватает только дешевого маломощного лазера. Поэтому надеялся на быстрый прогресс после окончания работ товарища Алферова. Реальность оказалась жестокой для системного интегратора из поколения, которое не знало контроллеров с частотой ниже гигагерца.