Аналитика: методология, технология и организация информационно-аналитической работы
Шрифт:
— выявление базисных процессов реального мира, влияющих на процесс генерации суждений и др.
Для систем, обладающих способностью к реализации функции целеполагания, решение задачи верификации тесно связано с решением задач технологического обеспечения ИАР, поскольку требует от аналитика формализации тех ценностей субъекта целеполагания, относительно которых могут быть выявлены конфликты целей, декларируемых в совокупности суждений (выражающих стратегии поведения субъекта целеполагания).
Декларации стратегий, скрыто противоречащих базисным ценностям индивида или некоторого сообщества индивидов, в своей основе содержат логически выводимые высказывания, явно противоречащие ценностной аксиоматике. То есть, в результате интеграции с
В настоящее время средства автоматизированного оценивания достоверности данных реализованы лишь для систем, не способных к целеполаганию либо не являющихся объектом преобразующей деятельности человека. В сферах, где это условие не выполняется, пределом достижений в области оценивания достоверности данных является автоматизация процесса маркирования пар противоречивых утверждений, предварительно формализованных экспертами. Маркирование может также осуществляться на основании сопоставления с набором допустимых стратегий, измеренных значений и иных данных разного уровня формализации и верифицируемости. Существуют системы, позволяющие оценивать действия целеполагающих систем на основе сопоставления с эталоном. Чаще всего, в таких системах в качестве эталона используются некие непротиворечивые системы регламентов, сохраняющие стабильность на протяжении рассматриваемого интервала времени — например, законодательные акты и иные.
Там же, где верификация данных (сообщений) по причине специфичности их объекта невозможна, автоматизация этого процесса сводится преимущественно к автоматизации процедур обработки результатов экспертных опросов, осуществляемых различными классическими методами.
Поскольку возможность оценивания достоверности данных связана с анализом прагматической составляющей знаковых систем и отображением элементарных или сложных высказываний на множество значений [0, 1] (как правило), постольку реализация автоматизированных систем, обладающих такой возможностью, связана с генерацией стратегий дискредитации утверждений. То есть для создания полностью автоматической системы, способной оценивать достоверность предоставляемых данных, требуется синтезировать систему искусственного интеллекта, способную вырабатывать эффективные стратегии, направленные на дискредитацию утверждений, а это требует от машины способности к автоматическому подбору аргументации (что не так уж и просто).
Для того чтобы автоматизированная информационная система могла автоматически подбирать аргументы, она должна быть в состоянии выделять из сообщений утверждения, подлежащие проверке (то есть, атомарные высказывания, содержащие сведения, значимые для решения проблемы), выполнять преобразование совокупности имеющихся данных в совокупность примитивных утверждений, соотнесенных с моделью фрагмента реального мира, на которой возможно осуществить проверку их истинности и непротиворечивости.
В отличие от задачи анализа достоверности, для решения задачи анализа непротиворечивости высказываний и сообщений не требует столь сложных операций, как синтез стратегий дискредитации утверждений (хотя теория поиска логического вывода, активно разрабатываемая в теории систем искусственного интеллекта предоставляет достаточно развитый аппарат для этого). Решение задачи анализа логической непротиворечивости потока сообщений связано с рядом проблем, среди которых на первом месте стоит проблема формализации текста (преобразования поступающего на вход системы ИАР произвольного сообщения к некоторому синтаксически однородному представлению). Первым этапом на пути к решению этой проблемы является построение модели естественного языка, на котором это сообщение представлено.
Современные подходы к решению проблемы анализа сообщений в общих чертах воспроизводят аналитические операции, выполняемые человеком, с той лишь разницей, что при этом учитывается необходимость алгоритмизации и автоматизации этих операций. Уникальное быстродействие «арифметикологического устройства» и ресурсы памяти, которыми располагает человек при аналитической обработке сообщений, позволяют ему быстро адаптироваться к способу синтаксического представления. Механизмы сценарной синхронизации (распознавание знакомого ситуационного контекста, сценария развития ситуации), активизирующиеся при наличии минимального социального опыта, обеспечивают человеку высокую избирательность и помехоустойчивость при восприятии сообщений. Эти механизмы функционируют не на уровне сообщения и даже не на уровне предложений — уровень их функционирования гораздо ниже и соответствует уровню элементарного высказывания.
В реальных условиях на способ представления сообщения могут оказывать влияние различные факторы. В число этих факторов, влияющих на способ синтаксического оформления сообщения (более общо — речевого акта) входят:
— цель сообщения;
— категория потребителя (образовательный статус, социальная или профессиональная группа);
— мотивация к восприятию (заинтересованность, нейтралитет, сопротивление);
— способ представления (устная, письменная форма);
— стиль (литературный, новостийный, обыденный и т. п.);
— способ взаимодействия (монолог, диалог, интервью и т. д.).
Некоторые значимые особенности представления сообщений, привносимые перечисленными выше факторами, приведены в работах Т.А. ван Дейка, Д. Кинча [63] и других специалистов в области лингвистики текста. В результате работы этих авторов был сформирован ряд специфических научных направлений, таких как грамматика текста, прагматическая лингвистика текста, получили развитие социальная и психо- лингвистика, а также теории генеративных и контекстно — зависимых грамматик. Ценность вклада перечисленных ученых в развитие методологии ИАР определяется тем, что ими были впервые сформулированы основные положения дискурсного анализа сообщений, учитывающего различные виды контекста сообщения во взаимодействии с социально-культурным и ситуационным контекстом, характеризующим состояние, в котором пребывают лица, генерирующие и получающие эти сообщения.
63
См. Дейк ван Т.А. Язык. Познание. Коммуникация. — Благовещенск: БГК, 2000.
Уровень сложности генерируемых в зависимости от дискурса сообщений существенно варьируется. Особенно ярко проявляется здесь действие принципа релевантности подачи информации. Так, в работах Т.А. ван Дейка «Структура новостей в прессе» и «Анализ новостей как дискурса» дается перечень языковых, социальных и психологических факторов, обусловливающих композиционную и стилистическую специфику этого типа текстов.
Анализ обзорных, аналитических, новостийных, ретроспективных публикаций, появляющихся в отечественной и зарубежной прессе, в целом подтвердил тезис о стилистической и композиционной специфичности этих видов текстов. Однако, помимо этого, было отмечено наличие достаточно серьезных вариаций внутри каждого класса. Данные вариации могут быть обусловлены как личностной спецификой автора, так и общим эмоциональным строем каждого конкретного издания (здесь сказывается редакционная политика). Результаты статистических исследований различных типов текстов показали наличие устойчивых зависимостей между уровнем сложности предложений (показатели: длина предложения, наличие формальных признаков сложно подчиненных, сочиненных конструкций, обособленных оборотов, длина слов и т. п.) и гипотезой источника сообщения об образовательном статусе и интеллектуальном потенциале потребителя.