В поисках Гордо
Шрифт:
— Это объясняет, почему их Ретикулум меньше, чем наша Паутина: нет табу на наготу и секс — нет порнографии. Наша сеть полегчала бы на целые зеттабайты, если бы в ней не было всего этого дела.
— Именно. Но это ещё не всё. У инопланетян три руки. У самцов две слева и одна справа, у самок наоборот. Это довольно странный диморфизм, но можно понять, каким образом он закрепился в ходе эволюции. Они прислали нам множество изображений семейных групп; самец и самка по бокам, ребёнок посередине. Они не держатся за клешни, однако самка кладёт левую клешню ребёнку на одно плечо, а самец — правую клешню на другое,
— Ну… да, — сказала Ханна.
— Алгоритмы разглядели в этом более глубокий смысл. Сознательно или нет, инопланетяне явно помещают ценные для них вещи с той стороны, где у них одна рука. Мы назвали их «моносторона» и «бисторона», и всё, имеющее большую ценность и нуждающееся в защите, всегда находится на моностороне.
— И всё это сделали алгоритмы? Начав с нуля?
— Не с нуля. Они начали с сотен миллионов изображений, каждое из которых просмотрели с терпением и вдумчивостью, недоступной человеку.
Наконец, пришла очередь Эмили занять место свидетеля. Ханна Плакстон задала ей серию отрепетированных вопросов об алгоритмах извлечения данных, открывших для человечества Ретикулум. Но потом Пётр Судейко начал перекрёстный опрос.
— Доктор Чу, — сказал он, — я был впечатлён естественностью речи Урсулы.
— Спасибо.
— Вы в самом деле проделали великолепную работу, создав ИИ-аватар инопланетянина, с помощью которого можно осуществлять поиск в Ретикулуме так же легко, как в нашей Всемирной паутине.
— Спасибо. Это была командная работа.
— Это правда поражает воображение. Я считал, что универсальная трансляция того сорта, что выполняет Урсула, невозможна. Не могли бы вы пояснить нашему достойному жюри присяжных, каким образом это было достигнуто?
— Конечно. Мы достигли первого прорыва в деле распознавания спонтанной речи в 2010 году, воспользовавшись полностью связными глубинными нейронными сетями, или ГНС. Для глубинного обучения вы даёте нейронным сетям всё новые и новые образцы, и сравнивая их, сети в конце концов догадываются о семантике слов, семантике предложений и модели знаний.
Одним из ключевых факторов оказалось понимание того, что семантическое намерение лучше определяется на уровне фразы/предложения, а не уровне отдельного слова. В конце концов, слова часто многозначны: «лук» — это овощ или метательное оружие? Но фраза или предложение, а ещё лучше документ целиком, содержат богатую контекстную информацию, которой мы можем воспользоваться. И, разумеется, целая сеть, неважно, их или наша, содержит бесчисленные розеттские камни. К примеру, есть лишь несколько способов представления периодической системы элементов, а любая технологически развитая цивилизация должна как-то это делать.
Так что наши нейронные сети просто смотрят, какие инопланетные слова часто соседствуют с изображениями каких объектов. Это статистическая игра, но если играешь в неё достаточно долго, то выигрываешь.
— Понятно. И для простых вещей оказывается довольно легко составить таблицу перевода.
— Верно. К примеру, они прислали тысячи фотографий образцов минералов, и, просматривая тексты, связанные с этими фотографиями, нейронные сети способны не только выяснить названия конкретных минералов — как на их языке называется кварц или алмаз — но и со временем догадаться об их более общих терминах, в том числе таких, что подчёркивают различия, о которых даже большинство людей не имеет понятия, как к примеру, о разнице между «горной породой» и «минералом».
— Должна признаться, что я и сам не знаю, в чём разница.
— Минерал однороден и имеет специфическую кристаллическую структуру; горная порода сложена из множества минералов.
— Вот как, — сказал Судейко. — Значит, я полагаю, пользуясь той же самой методикой, ваши алгоритмы опознали слова, которыми инопланетяне называют, скажем, «ручей» и «реку»?
— Точно так.
— «Пруд» и «озеро».
— Верно.
— «Море» и «океан».
— Э-э…
— Да, доктор Чу?
— Разумеется, наша методика способна сопоставлять лишь то, для чего существуют термины в обоих языках. Я уверена, что вы видели фотографии их планеты и их карты мира. Их планета гораздо суше нашей. Там нет морей и океанов — и поэтому отсутствуют континенты и крупные острова. Карта их мира выглядит как ломтик швейцарского сыра, в котором дырки — это озёра.
— Ага! — воскликнул Судейко с улыбкой триумфатора на лице. Он повернулся к судье Вейсману. — Ваша честь, я хотел бы повторно вызвать свидетеля Урсулу.
Вейсман объявил пятнадцатиминутный перерыв. Когда он закончился и все снова расселись, Пётр Судейко сказал:
— Урсула, у меня появились к вам новые вопросы.
Он расхаживал туда-сюда по открытой площадке перед столом судьи, а глазные стебельки аватара поворачивались ему вслед.
— Я сделаю всё, чтобы на них ответить.
— Я провёл много времени, рассматривая фотографии, которые вы разместили в Ретикулуме. Естественно, многие из них были мне непонятны. Я был весьма благодарен за автоматическое подписывание, иначе в большинстве случаев я бы понятия не имел, на что я смотрю. Однако там были фото, которые выглядели неожиданно знакомо. Похоже, что оба наши народа испытывают особую любовь к закатам.
— Закаты очень красивы.
— И я так считаю. Ваше солнце и наше очень похожи — то, что мы называем жёлтыми карликами класса G. Думаю, мне было бы непросто отличить фотографию вашего заката от фотографии нашего.
По глазным стебелькам Урсулы пробежала рябь — знак согласия.
— Да, полагаю, это было бы трудно.
— Но, разумеется, после того, как солнце окончательно село, всё становится очень разным. Ваша система находится от нашей в сорока шести световых годах.
— Сорока шести ваших световых годах, — любезно поправила Урсула. — И в ста двух наших.
— Верно, верно. Но в каких бы единицах не измерялось это расстояние, его достаточно, чтобы исказить взаимное расположение звёзд. Я не астроном, как доктор Плакстон, но, если я правильно понимаю, самая яркая звезда на нашем небе — та, которую мы называем Сириус, тогда как на вашем небе самый яркий Канопус.