Журнал "Компьютерра" N749
Шрифт:
Открытость против закрытости
Развитие концепции открытости ПО и данных, получившее толчок благодаря прогрессу Интернета, не обошло стороной и геопространственные данные. Как и в случае с программным обеспечением, сообщества, продвигающие открытые базы пространственных данных, "противопоставили себя" крупным корпорациям, вкладывающим огромные ресурсы в системы сбора информации и имеющим обыкновение продавать одни и те же наборы данных по несколько раз.
В современном мире идея о том, что сведения об улицах, по которым все ходят, не принадлежат общественности, рано или поздно должна была показаться комуто неправильной. Что и случилось — появился OpenStreetMap.
Этот процесс, названный краудсорсингом (crowdsourcing), приобрел широкие масштабы. За полтора года существования проекта OpenStreetMap количество зарегистрированных пользователей перевалило за 45 тысяч.
Интересно, что подобные "ключи" к общественности пытаются подбирать и коммерческие компании, активно использующие краудсорсинг для исправления ошибок в своих картах (не правда ли, похоже на сваливание на пользователей ловли ошибок в ПО?). Корпорация Google, больше года использующая систему участия, при которой вы можете исправить ошибки геокодинга, сделала следующий шаг в этом направлении и представила систему MapMaker, фактически дублирующую OpenStreetMap.
Конечно, это не могло не вызвать бурю раздражения в мире opensource-геоданных, ведь результат вашей работы оказывается фактически принадлежащим Google!
Это выглядит тем более странно, учитывая, что Google поддерживала первую конференцию OpenStreetMap. На фоне этих событий действия другого гиганта, Yahoo, выглядят куда более логичными.
В 2006 году Yahoo разрешила использовать свои данные высокого разрешения для оцифровки дорожной сети и других объектов и размещения результатов в открытом доступе в базе OpenStreetMap, благодаря чему включиться в работу надобщей картой теперь может любой, не выходя из дома.
Качество публикуемых данных
Один из самых частых вопросов, возникающих у нас при изучении интернетресурсов, — насколько представленная информация корректна?
Неуверенность возрастает, как только мы переходим от простого любопытства к использованию данных для решения профессиональных задач. Могу ли я быть уверен в том, что авторы ресурса проверили опубликованную информацию? откуда она появилась? в какой степени я могу ей доверять? Сегодня не многие пользователи Интернета задумываются об источниках пространственной информации и качестве картографических данных, поэтому мы ожидаем, что уже в недалеком будущем их постигнет глубокое разочарование: лишь немногие ресурсы могут похвастаться заслуживающими доверия данными. Уже сейчас в Сети можно встретить анекдотические истории об успешно проложенных "кратчайших" маршрутах или даже о случаях элементарной дезинформации, возникающей из-за публикации устаревших картографических материалов.
Один из наиболее приемлемых вариантов оценки качества публикуемых данных — создание метаданных (данных о самих данных), где помимо специальной географической и описательной информации указывались бы такие характеристики, как точность, качество, надежность. Однако смысловая "относительность" перечисленных характеристик, с одной стороны, и многообразие стандартов метаданных, сложность их получения в автоматическом режиме и особенно субъективность при описании качества данных[См., например, Grade Finale Report (edina.ac.uk/projects/grade/GRADE_Final_Report.pdf, Do spatial data consumers really understand data quality information?; www.spatial-accuracy.org/2006/PDF/Boin2006accuracy.pdf, Spatial Data Quality By Wenzhong Shi, Peter F. Fisher and Michael F. Goodchild (Eds).Taylor and Francis, London and New York, 2002).] —
В 2007 году Open Geospatial Consortium Data Quality Working Group (WG)[ www.opengeospatial.org.], осознавая трудности, связанные с разработкой универсального стандарта метаданных, предпринял уникальную попытку обобщить опыт, знания и экспертные мнения в области оценки качества пространственных данных.
Более чем двум тысячам специалистам в области ГИС и ДЗЗ по всему миру было предложено заполнить специальную анкету[www.surveymonkey.com/s.aspx?sm=_2ffWZCQbm2ugKS_2fW8A0MWIQ_3d_3d.] и изложить в достаточно свободной форме то, какие параметры могут быть использованы для оценки качества геопространственной информации и каким образом эта оценка может быть описана в метаданных.
Некоторые попытки по совершенствованию механизмов описания качества данных были предприняты и такими инициативными группами, как GSDI Association, CGIAR и INSPIRE. Тем не менее до сих пор метаданные являются абсолютно добровольным элементом подготовки и распространения геоданных. Большинство компаний далеко не сразу приходят к пониманию важности документирования состояния данных, и ситуация в целом остается довольно-таки печальной: чаще всего пользователь ничего не знает о качестве используемых им данных.
Авторские права и юридические аспекты
Авторские права, пожалуй, одна из самых болезненных проблем для современного веб-сообщества, не обошла она и пространственные данные. В настоящее время законодательство в области их распространения столь фрагментарно, что большинству компаний приходится действовать по принципу "все или ничего" — данные либо хранятся за семью замками в серверной части, доступной по внутренней сети ограниченному числу сотрудников компании, либо публикуются в Интернете и дальше уследить за их судьбой становится очень трудно, а чаще всего — вообще невозможно. В связи с этим компании следуют принципу "ничего" и просто-напросто не публикуют свои данные.
Более того, растет число картографических веб-сервисов, позволяющих:
1) объединять слои данных из различных источников;
2) модифицировать сами данные;
3) создавать собственные данные на основе опубликованных, и для каждого случая вообще-то необходимо определять правообладателя и особенности дальнейшего распространения и использования информации. К настоящему моменту ни один из перечисленных случаев юридически не урегулирован, что вызывает негодование поставщиков данных. Интересный анализ этой проблемы и возможное решение предложил Онсард (Н. J. Onsurd)[www.sli.unimelb.edu.au/research/SDI_research/Presentations/CommonsAndMarketMelbourne.ppt.]. Главная идея здесь сводится к созданию единой peer-to-peer системы хранения, добавления и доступа к данным с использованием Open Access Licenses (аналог GNU для ПО).
С веб-картографией, в широком понимании этого слова, связана масса перспективных технологий. Остановимся на некоторых из них, имея в виду, что помимо простой визуализации и создания данных, пожалуй, самым новым аспектом работы с пространственными данными является перенос в веб их обработки и анализа. Это становится возможным благодаря развитию инструментария, легко размещаемого на веб-серверах: как открытого GDAL, PROJ, GeoTools, FDO, так и проприетарного ArcGIS Server.