Аналитика: методология, технология и организация информационно-аналитической работы
Шрифт:
— методики СТ А.А. Шияна, как инструмент, позволяющий осознать и учесть свои особенности при ведении ИАР;
— переход к активному использованию средств автоматического анализа эмоциональной нагрузки сообщений, подлежащих оцениванию;
— использование средств предобработки сообщений, позволяющих перейти от первичных речевых конструкций к конструкциям, построенных из стандартизованных терминов и оборотов, объединенных допустимыми логическими связками.
Так что, проблема в целом очерчена, пути ее решения существуют — можно работать. Работать как над собой, так и над созданием тех средств автоматизации, которые способны разгрузить аналитика, снизить те стрессовые нагрузки, которые существенно осложняют их работу. Первые шаги на этом пути связаны с решением задачи атрибуции сообщений, формирования их «паспорта». Уже на этом уровне может быть получена та информация, учет которой позволит снизить нагрузку на эксперта.
7. Атрибуция
Задача анализа сообщений на семантическом уровне является сложной даже при работе с данными первичных источников информации (данными, полученными из каналов внутрисистемных взаимодействий). Однако сохраняющаяся в последние годы тенденция к сокращению числа сообщений первичных источников привела к необходимости развития и совершенствования методологии их анализа.
При работе с данными вторичных источников информации особую актуальность приобретает комплекс мероприятий, направленных на установление контекста информационного взаимодействия, его характеристик его участников, их ценностной ориентации и вероятных целей, преследуемых ими при генерации ими тех или иных сообщений. Для решения этой задачи аналитик должен располагать значительно большим объемом сведений об условиях получения информации, обеспечивающим возможность восстановления ситуативного контекста акта коммуникации (информационного взаимодействия). Сообщение, как таковое, или массив сообщений перестает быть тем единственным объектом, на котором концентрируется внимание аналитика: самой технологией их сбора, предварительной обработки и накопления должна быть предусмотрена возможность восстановления на этапе анализа ситуативного контекста генерации данного сообщения и контекста информационного взаимодействия.
Очевидно, что без дополнительных данных («данных о данных») контекст восстановить крайне сложно и возможно лишь в экстремальных случаях. Чтобы убедить вас в справедливости этого замечания, приведем фрагмент модельного сообщения, для которого задача восстановления контекста без привлечения дополнительной информации действительно имеет решение: «Сегодня, 18 мая 2002 года, сидя в московском офисе газеты «Агентство ОБС», я, корреспондент Холмс И.И., по заказу генерального директора ООО «Наветы» Клевещенко Г.П. сочиняю эту статью-расследование. Название статьи — «Не могу молчать!» — неслучайное: вот уж три года, как…». Согласитесь: своеобразный стиль, а уж откровенность… тянет на еловый венок — подобное сообщение едва ли встретишь в СМИ.
Еще одним аргументом в пользу необходимости атрибуции поступающих сообщений является то, что реальная ценность сообщения при ведении ИАР не всегда может быть оценена при первом прочтении. Очень часто случается так, что на момент получения сообщение не может быть отнесено к классу релевантных тематике исследований. Причин тому масса: начиная с того, что сообщение может быть действительно нерелевантно текущей тематике исследований, и, заканчивая тем, что связь данного сообщения с тематикой исследований не может быть установлена в силу неполноты или неадекватности модели исследуемой системы (что часто случается на начальном этапе исследований). Но ведь сообщение, тем не менее, прочитано (и проанализировано)… на его интерпретацию затрачены усилия, а относительно его содержания сформулированы некие выводы. Проблема состоит в том, что задача протоколирования этих выводов не имеет технологического покрытия — автоматизации этого процесса не уделяется должного внимания. Считается, что эти трудозатраты неизбежны. Как следствие, при необходимости вовлечения этого сообщения в процесс анализа вся работа проделывается вновь, да и привлечь его к процессу анализа может не всякий аналитик — для этого он должен помнить о самом факте существования такого сообщения.
Естественным выходом из такой ситуации является создание инструментальных средств, обеспечивающих режим автоматизированного протоколирования выводов аналитика при первом прочтении сообщения. Создание таких средств возможно при условии, что автоматизированная система рассматривается в качестве инструмента предобработки сообщений, предлагающей аналитику некий набор версий, подлежащих оцениванию и утверждению им по прочтении некоторого сообщения. Теоретически создание подобных систем не является чем-то невозможным, более того, технологическая база на сегодня способна обеспечить необходимое быстродействие, если задаться реалистичными целями (то есть, не требовать от компьютерной системы стопроцентной достоверности выводов).
Чего же тогда можно требовать от такой системы? Какой ценностью обладает система, которая предоставляет не абсолютно достоверные выводы?
— Польза от такой системы однозначно есть. Для того, чтобы она была полезна, достаточно, чтобы она обеспечивала генерацию ограниченного числа максимально правдоподобных гипотез о значении некоторого комплекса атрибутов на основе проведения анализа формально-логических отношений, выраженных в тексте. Уже в этом случае аналитик получает возможность отбирать те из них, которые наилучшим образом описывают его выводы, полученные экспертным путем. Это не только экономия времени на протоколирование, но и возможность формально логической экспертизы утверждений, выраженных в тексте.
Таким образом, окончательно убеждаемся в необходимости учета ряда специфических атрибутов сообщения, содержащих дополнительную информацию о контексте информационного взаимодействия и результатах его анализа. Остается определить, какие именно атрибуты целесообразно включить в протокол анализа сообщения. Вероятно, было бы лучше вывести перечень атрибутов на основе исчерпывающего рассмотрения универсального алгоритма обработки сообщения (это можно сделать, но тогда аргументация выбора отнимет много страниц, а это нарушит замысел книги). Поэтому здесь мы ограничимся максимально компактным перечнем, а пример разбора поместим в приложении 3.
Прежде, чем перейти к рассмотрению этого перечня, заметим лишь, что ситуативный контекст сообщения, как правило, уникален, и поэтому значения атрибутов содержатся на разных уровнях семантической иерархии сообщения и присутствуют в различных комбинациях. В ходе анализа сообщения его потребитель (аналитик) неосознанно проходит несколько циклов «погружения» в семантическую иерархию сообщения, в результате чего значение одного и того же атрибута могут извлекаться на разных этапах анализа.
Описание основного содержания этапов обработки и анализа сообщений и их условные обозначения (столбец «Идентификатор этапа» — Э-ID) представлены в табл. 4.3, позже эти данные будут использованы при описании распределения атрибутов сообщения по этапам и семантическим классам.
Таблица 4.3 — Содержание этапов обработки и анализа сообщений. | |
---|---|
Содержание этапа | Э-ID |
Получение физического доступа к среде распространения данных | 00 |
Получение материальной копии массива данных | 01 |
Разбиение массива данных на сообщения по структурным признакам | 02 |
Анализ и согласование форматов представления данных | 03 |
Экспресс-анализ и отбор сообщений (язык, ключевые слова, структурные признаки и идентификационные данные) | 04 |
Структурный анализ сообщения (выделение элементов структурной организации текста) | 05 |
Выделение, категорирование и маркировка метаязыковых конструкций | 06 |
Анализ и восстановление ссылочных отношений | 07 |
Анализ и восстановление временных отношений | 08 |
Анализ и восстановление пространственных отношений | 09 |
Анализ и восстановление функциональных отношений (субъект-объектных, инструментальных и иных) | 10 |
Идентификация ситуационной модели или фрейма, описывающего ситуационный и коммуникативный контекст | 11 |
Анализ и восстановление рефлексийных отношений | 12 |
Анализ эмоциональной компоненты сообщения и соотнесение оценочных суждений с субъектами рефлексии | 13 |
Анализ акцентов внимания субъектов рефлексии | 14 |
Анализ и восстановление логических (причинно-следственных) отношений | 15 |
Выделение и связывание повествовательных стратегий (сюжетных линий), их пространственная и временная синхронизация | 16 |
Выделение релевантных сведений | 17 |
Выявление противоречий | 18 |
Обобщение информации | 19 |