Чтение онлайн

на главную

Жанры

Выжить во время потопа
Шрифт:

– Что такое «большие данные» и как они влияют на изменения в бизнесе, политике, социальной сфере?

– Давайте начнем с определений, потому что как таковой технологии «больших данных» не существует. «Большие данные» – это некоторый маркетинговый термин, который объединяет много разных понятий. Кто-то к «большим данным» относит развитие искусственного интеллекта и автоматическое принятие им решений. Кто-то воспринимает «большие данные» информацией, которую невозможно посчитать на локальном компьютере. Для кого-то «большие данные» – это данные от нескольких петабайт. И если вы спросите рядового журналиста или, например, сотрудников компании «Яндекс» об этом, вы получите совершенно разные ответы и разное ощущение масштаба.

У меня тоже нет ощущения, что «большие данные» – это объемы, так

как сейчас и терабайт не является «большими данными». Петабайтом сейчас мало кого можно удивить, поэтому нет такого явления, как «большие данные». Сегодня это – некоторая совокупность технологий, которая включает обработку, сбор, обмен, интеграцию, публикацию и все остальное, что касается работы с большими объемами информации.

К чему это приводит? Создается инфраструктура, которая существует для обмена большим количеством информации. Она применяется для самых разных задач, например: для интернета вещей, для мониторинга сельхоздеятельности (уход за животными, землями), для мониторинга самолетов в реальном времени, для понимания поведения потребителей, для слежки за гражданами страны со стороны спецслужб, для научных исследований. Большой адронный коллайдер генерирует в день, по-моему, около петабайта данных. Там невероятное количество сенсоров. У них в работе действительно огромные объемы данных, и когда мы говорим про примеры – вот, пожалуйста.

Мы редко задумываемся, почему в некоторых точках продажи при оплате банковской картой не требуется ввод PIN-кода, а в других – при схожей сумме – нам приходится вводить заветные четыре цифры. Это – бытовой пример анализа активности потребителя на основе сотен данных: геолокации, точки продажи, периодичности, времени совершения операции и т.п.

В качестве еще одного примера рассмотрим подход, который применяется в Калифорнийском университете в Сан-Франциско при работе с пациентами клиник. Здесь врачи во время работы с пациентом узнают не только о симптомах болезни и просматривают историю прошлых обращений. Их интересует контекст, в котором живет пациент: экономический, социальный, экологический и т.п. Как заявляют исследователи, такой подход позволяет лучше выявлять причины заболеваний и находить эффективные способы их лечения. Помимо этого, соотнесение болезней с «жизненным контекстом» пациента позволяет предсказывать их распространение и быстрее реагировать в критических ситуациях.

На презентации новых продуктов компании Apple в 2018 году было представлено четвертое поколение умных часов. Помимо функции определения падения человека и соответствующего шаблона реагирования, обновленные сенсоры устройства позволяют каждому пользователю пройти процедуру ЭКГ (электрокардиограмму) за считанные секунды и без посещения клиники. Для отслеживания малейших изменений в работе сердца необходимо проводить эту процедуру как можно чаще, а не раз в год, как это часто бывает. В последнем случае реакция на проблему может оказаться запоздалой.

Не сложно представить, как в развитых странах совсем скоро умные часы станут таким же атрибутом получения данных, как и некоторые медицинские приборы. Разница в том, что гаджеты всегда с нами, и поверьте, благодаря совершенствованию математических моделей они уже знают о нас больше, чем мы можем себе представить. Питание алгоритмов данными через устройство выгодно ровно до тех пор, пока человек будет получать необходимую персонализированную и важную информацию. И это абсолютно рационально, если позволит человеку жить дольше.

Делим яблоки

Три четверти новых покупок на сайте онлайн-кинопрокатчика Netflix делается благодаря предложениям системы рекомендации12. Увеличение потока данных от конкретного пользователя дает возможность создать более персонализированный продукт и адекватное потребительское предложение. И это уже стали понимать сами пользователи. В 2009 году компания Google анализировала данные в онлайн-режиме и благодаря математической модели смогла определить корреляцию между поисковыми запросами и распространением вируса H1N1. Система была права в 97% случаев13. В новом мире не качество, а количество данных определяет ценность получаемой информации. В 2011 году журнал Science провел анализ 509 млн твитов, полученных за два года от 2,4 млн человек, и пришел к выводу, что перемены настроения людей имеют ежедневные и еженедельные закономерности во всем мире вне зависимости от культуры. Такое исследование было бы просто невозможным до 2006 года – до появления компании Twitter и инструментов сбора и анализа

большого объема данных.

Исследователь Альберт-Лазло Барабаши со своей командой проанализировал все журналы анонимного мобильного трафика, полученные от оператора беспроводной связи. Он работал согласно новому принципу, используя все данные, и получил интересные результаты. Если удалить из мобильной сети людей, имеющих множество связей в определенном сообществе (семья, коллеги, близкий круг общения), сеть окажется менее активной, но будет существовать. Однако при удалении людей, имеющих широкие связи за пределами ближайшего окружения, сеть тотчас распадается. Фактически люди со множеством друзей для работы такой структуры менее важны, чем те, у кого есть распределенная сеть контактов за пределами непосредственного окружения. Этот факт заставляет иначе оценивать важность контактов и групп людей в коммуникационных сетях. И снова – этот эксперимент не был бы возможен до появления соответствующих технологических решений.

Французская журналистка газеты The Guardian Жюдит Дюпорталь решила провести эксперимент (достаточно очевидный) и запросила у сервиса онлайн-знакомств Tinder все хранящиеся о себе данные. Результатом четырехлетнего использования приложения стал 800-страничный отчёт. В нем содержалась информация о предпочтениях журналистки, местах ее проживания, а также фотографии из Instagram – включая те, что были удалены. Разумеется, была информация и о 1700 сообщениях партнёрам и статистике посещения приложения. А теперь учтите, что Tinder имеет ориентировочно 50 млн пользователей14.

Компании, собирающие данные, не знают о кнопке «Delete» («Удалить»). И в этом нет ничего сверхъестественного. В отличие от материальных объектов, ценность данных не уменьшается по мере их потребления. Высказывание Бернарда Шоу прошло проверку на прочность: «Если у вас есть яблоко и у меня есть яблоко, и мы поменяемся ими, то у нас останется по яблоку. Но если у вас есть идея и у меня есть идея, и мы поменяемся ими, – у нас будет по две идеи».

Недавний переход в цифровую эпоху – фундаментальное изменение человеческой действительности. Этот вектор был бы невозможен до информационной эры, где произошло очередное перерождение этого понятия. Мы наверняка не перестанем рассматривать окружающий мир как бесконечное множество неконтролируемых событий и процессов, поскольку география неизвестного расширяется пропорционально новым открытиям.

Фиджитал

Термин Phygital (Фиджитал) еще не популярен, хотя точно отражает действительность. Его формула выглядит так:

Объединение двух реальностей произошло не только в сфере высоких технологий, но и в умах поколений. Онлайн – уже не инструмент, не функция и далеко не способ достижения чего-либо. Онлайн часть бытия, с которой мы ежеминутно взаимодействуем. Эта «максима» составляет базис фиджитал-мировоззрения. Вряд ли у кого-нибудь вызывает удивление тот факт, что, переходя на сайт для приобретения новой книги, вы видите как минимум два варианта ее покупки: физический и цифровой. У них закономерно разная стоимость, так как мы прекрасно понимаем, скольких издержек удается избежать покупателю и компании при заказе электронного аналога книги. Мы можем долго говорить о запахе книг, приятном шуршании страниц (что, кстати, напрямую зависит от качества используемых при печати материалов), некоей медитативной атмосфере и т.д. Но ценность идей и заложенных мыслей в обоих форматах – неизменна. Отличается лишь форма. Цифровую книгу сложно потерять, ее легко подарить, с ней удобно работать как со справочным материалом, она невероятно мобильна и т.д. И здесь я не говорю о расходовании природных ресурсов – это частый аргумент при продаже электронных книг, но работающий невероятно точечно. Мне хочется упомянуть лишь о стремлении к комфорту и желании снизить ответственность. Пролив кофе на новую книгу, сделав заметку, вырвав страницу, вы навсегда меняете ее форму и содержание (отсутствующие страницы не восстановишь). Все это вынуждает быть предельно ответственным при пользовании физическими книгами. Во время учебы в университете мне доводилось пользоваться книгами 1946 года, страницы которых едва не рассыпались при перелистывании. И проблема в том, что у этих трудов не было цифровых аналогов. С физической «смертью» носителя информации канет в Лету главное – ее содержание. Это недопустимо для фиджитал-мира.

Поделиться:
Популярные книги

Отмороженный 8.0

Гарцевич Евгений Александрович
8. Отмороженный
Фантастика:
постапокалипсис
рпг
аниме
5.00
рейтинг книги
Отмороженный 8.0

Скрываясь в тени

Мазуров Дмитрий
2. Теневой путь
Фантастика:
боевая фантастика
7.84
рейтинг книги
Скрываясь в тени

На границе тучи ходят хмуро...

Кулаков Алексей Иванович
1. Александр Агренев
Фантастика:
альтернативная история
9.28
рейтинг книги
На границе тучи ходят хмуро...

Восход. Солнцев. Книга I

Скабер Артемий
1. Голос Бога
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Восход. Солнцев. Книга I

Заставь меня остановиться 2

Юнина Наталья
2. Заставь меня остановиться
Любовные романы:
современные любовные романы
6.29
рейтинг книги
Заставь меня остановиться 2

Системный Нуб 4

Тактарин Ринат
4. Ловец душ
Фантастика:
боевая фантастика
рпг
5.00
рейтинг книги
Системный Нуб 4

Машенька и опер Медведев

Рам Янка
1. Накосячившие опера
Любовные романы:
современные любовные романы
6.40
рейтинг книги
Машенька и опер Медведев

Мастер 2

Чащин Валерий
2. Мастер
Фантастика:
фэнтези
городское фэнтези
попаданцы
технофэнтези
4.50
рейтинг книги
Мастер 2

Титан империи 5

Артемов Александр Александрович
5. Титан Империи
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Титан империи 5

Мятежник

Прокофьев Роман Юрьевич
4. Стеллар
Фантастика:
боевая фантастика
7.39
рейтинг книги
Мятежник

Последний рейд

Сай Ярослав
5. Медорфенов
Фантастика:
фэнтези
аниме
5.00
рейтинг книги
Последний рейд

Идеальный мир для Лекаря 9

Сапфир Олег
9. Лекарь
Фантастика:
боевая фантастика
юмористическое фэнтези
6.00
рейтинг книги
Идеальный мир для Лекаря 9

Неудержимый. Книга XIV

Боярский Андрей
14. Неудержимый
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Неудержимый. Книга XIV

Младший сын князя

Ткачев Андрей Сергеевич
1. Аналитик
Фантастика:
фэнтези
городское фэнтези
аниме
5.00
рейтинг книги
Младший сын князя