Викиномика. Как массовое сотрудничество изменяет всё
Шрифт:
Без сомнения, эти проблемы являются результатом действующего способа физического распространения информации и незначительного объёма публикаций. Существующий сегодня издательский процесс возник в Европе XVII века, когда скорость открытий была несоизмеримо более медленной по сравнению со стандартами XXI века. Научные издания предоставляли первичную инфраструктуру для общения и сотрудничества. Помимо ежегодных академических симпозиумов, журналы были местом, где учёные могли получить информацию, обмениваться ею и аккуратно критиковать работу друг друга. Издание журналов стоило дорого, требуя значительного капитала и операционных расходов.
Однако по мере того, как набирает скорость и размах научное разви тие, всё большее количество участников научной экосистемы задаётся вопросом, насколько адекватна их нуждам эта старомодная журнальная система. При новых коммуникационных технологиях бумажный издательский процесс стареет. Традиционная система пирингового рецензирования журналов дополняется, если не заменяется, возрастающими
Организация поиска знаний в пиринговой манере, конечно, не является чем-то новым в науке. Однако последние исследования показывают, что рост сотрудничества имеет взрывной характер. Одно исследование, проведённое Институтом Санта-Фе, [220] показало, что средний исследователь в области физики высоких энергий имеет в своей лаборатории около ста семидесяти трёх сотрудников. По результатам того же исследования, среднее количество авторов научных статьи удвоилось и утроилось во многих областях. Всё большее количество статей цитируется от двухсот до пятисот раз, а самая высокорейтинговая публикация имеет индекс цитирования 1681. [221]
220
Santa Fe Institute.
221
Стабильно растёт и среднее количество авторов на научную работу. За последние шестьдесят лет среднее значение чуть больше i стабильно росло до — 2,22 в области компьютерных наук, 2,66 в области физики твердых тел, 3,35 в области астрофизики, 3,75 в области биомедицины и 8,96 в области ядерной физики больших энергий. Количество ссылок на работы других авторов колеблется между 200 и 500, а рекордное количество ссылок в одной работе составляло поразительные 1681 ссылку. См. М. Е. J. Newman, "Who is the besl connected scientist.? A study of scientific co-authorship networks," Working Paper, Santa Fe Institute (2000 г.).
Агрегаторы знаний должны принять новые условия, например, рост использования баз данных в Интернете и всё большее развитие масштабных совместных проектов в Сети. Рассмотрим в качестве примера эксперимент с Большим адронным коллайдером (БАК), проводимый Европейским советом по ядерным исследованиям [222] Ожидалось, что с 2007 года [223] крупнейший в мире ускоритель частиц начнёт производить петабайты сырых данных в год, данных, которые будут предварительно обработаны, структурированы и проанализированы командами из тысяч физиков по всему миру (заметьте, что петабайт — это квадриллион [224] байтов, другими словами, очень много данных!). В ходе этого процесса данных будет создано ещё больше. Появится необходимость управлять сотнями миллионов файлов, что включает их размещение в сотнях институтов.
222
European Council for Nuclear Research (CERN).
223
Первые значительные испытания БАК прошли в сентябре 2008 года. Однако вследствие вскоре произошедшей аварии БАК возобновит свою работу летом-осенью 2009 года. — Прим. издателя.
224
Квадриллион (франц. quadrillion) — число, изображаемое единицей с 15 нулями, т. е. число ю'\ Иногда квадриллионом называют число 1024.
Помимо этого существует ещё Решетка земной системы [225] (ESG), опытная таблица данных, включающая возможности суперкомпьютера с масштабными серверами для сохранения и анализа данных, созданная для учёных, занимающихся совместными исследованиями климатических явлений. Будучи когда-то единственным в своём роде, данный проект создаёт виртуальное пространство для сотрудничества, которое объединяет распределённые центры, пользователей, модели и данные на территории США. Данные для этого проекта собираются из самых разных источников, включая наземные и спутниковые датчики, компьютерное моделирование, а также тысячи независимых исследователей, размещающих в системе свои файлы. Специальные программы позволят учёным выполнять долгосрочное моделирование высокого разрешения, используя распределённые системы данных сообщества. Основатели ESG предполагают, что проект приведёт к революции в нашем понимании глобальных изменений климата.
225
Earth Syslem Grid.
Такие проекты вдохновляют исследователей во многих областях знаний на генерирование изменений, уже сейчас замещающих такие дисциплины, как биоинформатика
226
В рамках проекта Sloan Digital Sky Survey, сотни исследователей из пятидесяти организаций, разбросанных по всему миру, могут использовать потенциал ю тысяч компьютеров, а объём данных для исследования миллионов планет и звёзд составляет более пятнадцати терабайтов. Свободный и открытый обмен информацией и идеями даст учёным невиданную ранее картину Вселенной, причём данные могут быть получены в сотни раз быстрее, чем при использовании традиционных методов. См."Let data s" peak to data," Nature, том 438, номер 531 (i декабря 2005 г.).
По мере того как масштабные научные совместные проекты становятся нормой, учёные больше полагаются на распределённые методы сбора данных, проверяя точность открытий, тестируя гипотезы не только для ускорения работы, но и для повышения достоверности самих научных знаний. Быстрое, повторяющееся раскрытие информации привлечёт к пиринговому процессу ещё больше членов научного сообщества. Результаты будут проверены сотнями участников сообщества в один момент, а не пятёркой анонимных рецензентов чуть ли не через год. Это позволит новым знаниям быстрее поступать к практикам и предпринимателям.
В быстроразвивающихся дисциплинах, например, в физике высоких энергий и биоинформатике, этот совместный метод сбора и оценки публикаций уже становится реальностью. В 1991 году Пол Джинспарг [227] основал arXiv — общественный сервер, на котором физики могли размещать цифровые копии своих рукописей до публикации. Начав жизнь как механизм для обмена допечатными текстами в теоретической физике, ресурс быстро стал главной библиотекой для большой части исследовательской литературы по физике, компьютерным наукам, астрономии и многим математическим дисциплинам.
227
Paul Ginsparg.
«Изначально я ожидал около ста поступлений в год от двух сотен человек в одной узкой области, на которую первоначально ориентировался, — объясняет Джинспарг. — Но с первого дня ежедневно поступало множество рукописей, и к концу года подключилось уже несколько тысяч человек». [228]
Сегодня более половины всех исследовательских публикаций по физике размещается на этом ресурсе. Они продолжают поступать со скоростью около 4,5 тысячи в месяц. Пользователи могут даже получать RSS-потоки, сообщающие им о новых публикациях в их области.
228
Цит. по "From the Los Alamos Preprint Archive to the arXiv: An Interview with Paul Ginsharg," Science Editor 25, номер 2 (март-апрель 2002 г.), стр. 43.
Доктор Пол Кемп [229] из Спелман-колледжа, активный пользователь сайта, говорит, что «[arXiv] намного быстрее традиционного издательского цикла». Однако самоорганизующееся вокруг arXiv сообщество справляется с сохранением важных элементов пиринговой оценки публикаций. «Мы хотим получить ценную, прошедшую пиринговое рецензирование информацию, — заявляет Кемп. — Какая разница, получили мы её от издателя, который организовал стороннее рецензирование публикации, или с помощью прямой обратной связи от сообщества людей, заинтересованных в предмете, по электронной почте в ответ на предпечатный текст на arXiv? Результат один». [230]
229
Paul Camp.
230
Цит. по "Royal Society: Rent-seeking is more important than science," Boing Boing (25 ноября 2005 г.) .
Недавние попытки, такие как Google Book Search, Public Library of Science и World Digital Library, сейчас строятся на концепции открытого доступа. Эти проекты собирают огромные объёмы научных исследований и достижений человеческой культуры в легкодоступных формах. Результаты новых исследований, которыми могли бы пользоваться только богатые подписчики, сейчас широко доступны на бесплатной основе для изучения и исследований. Более старые источники, которые при другом сценарии валялись бы в пыльных архивах, сейчас, в цифровом формате, получат новую жизнь и новых читателей.