Рейтинговые книги
Читем онлайн Аналитика: методология, технология и организация информационно-аналитической работы - Юрий Курносов

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 95 96 97 98 99 100 101 102 103 ... 153

В настоящее время средства автоматизированного оценивания достоверности данных реализованы лишь для систем, не способных к целеполаганию либо не являющихся объектом преобразующей деятельности человека. В сферах, где это условие не выполняется, пределом достижений в области оценивания достоверности данных является автоматизация процесса маркирования пар противоречивых утверждений, предварительно формализованных экспертами. Маркирование может также осуществляться на основании сопоставления с набором допустимых стратегий, измеренных значений и иных данных разного уровня формализации и верифицируемости. Существуют системы, позволяющие оценивать действия целеполагающих систем на основе сопоставления с эталоном. Чаще всего, в таких системах в качестве эталона используются некие непротиворечивые системы регламентов, сохраняющие стабильность на протяжении рассматриваемого интервала времени — например, законодательные акты и иные.

Там же, где верификация данных (сообщений) по причине специфичности их объекта невозможна, автоматизация этого процесса сводится преимущественно к автоматизации процедур обработки результатов экспертных опросов, осуществляемых различными классическими методами.

Поскольку возможность оценивания достоверности данных связана с анализом прагматической составляющей знаковых систем и отображением элементарных или сложных высказываний на множество значений [0, 1] (как правило), постольку реализация автоматизированных систем, обладающих такой возможностью, связана с генерацией стратегий дискредитации утверждений. То есть для создания полностью автоматической системы, способной оценивать достоверность предоставляемых данных, требуется синтезировать систему искусственного интеллекта, способную вырабатывать эффективные стратегии, направленные на дискредитацию утверждений, а это требует от машины способности к автоматическому подбору аргументации (что не так уж и просто).

Для того чтобы автоматизированная информационная система могла автоматически подбирать аргументы, она должна быть в состоянии выделять из сообщений утверждения, подлежащие проверке (то есть, атомарные высказывания, содержащие сведения, значимые для решения проблемы), выполнять преобразование совокупности имеющихся данных в совокупность примитивных утверждений, соотнесенных с моделью фрагмента реального мира, на которой возможно осуществить проверку их истинности и непротиворечивости.

В отличие от задачи анализа достоверности, для решения задачи анализа непротиворечивости высказываний и сообщений не требует столь сложных операций, как синтез стратегий дискредитации утверждений (хотя теория поиска логического вывода, активно разрабатываемая в теории систем искусственного интеллекта предоставляет достаточно развитый аппарат для этого). Решение задачи анализа логической непротиворечивости потока сообщений связано с рядом проблем, среди которых на первом месте стоит проблема формализации текста (преобразования поступающего на вход системы ИАР произвольного сообщения к некоторому синтаксически однородному представлению). Первым этапом на пути к решению этой проблемы является построение модели естественного языка, на котором это сообщение представлено.

Современные подходы к решению проблемы анализа сообщений в общих чертах воспроизводят аналитические операции, выполняемые человеком, с той лишь разницей, что при этом учитывается необходимость алгоритмизации и автоматизации этих операций. Уникальное быстродействие «арифметикологического устройства» и ресурсы памяти, которыми располагает человек при аналитической обработке сообщений, позволяют ему быстро адаптироваться к способу синтаксического представления. Механизмы сценарной синхронизации (распознавание знакомого ситуационного контекста, сценария развития ситуации), активизирующиеся при наличии минимального социального опыта, обеспечивают человеку высокую избирательность и помехоустойчивость при восприятии сообщений. Эти механизмы функционируют не на уровне сообщения и даже не на уровне предложений — уровень их функционирования гораздо ниже и соответствует уровню элементарного высказывания.

В реальных условиях на способ представления сообщения могут оказывать влияние различные факторы. В число этих факторов, влияющих на способ синтаксического оформления сообщения (более общо — речевого акта) входят:

— цель сообщения;

— категория потребителя (образовательный статус, социальная или профессиональная группа);

— мотивация к восприятию (заинтересованность, нейтралитет, сопротивление);

— способ представления (устная, письменная форма);

— стиль (литературный, новостийный, обыденный и т. п.);

— способ взаимодействия (монолог, диалог, интервью и т. д.).

Некоторые значимые особенности представления сообщений, привносимые перечисленными выше факторами, приведены в работах Т.А. ван Дейка, Д. Кинча[63] и других специалистов в области лингвистики текста. В результате работы этих авторов был сформирован ряд специфических научных направлений, таких как грамматика текста, прагматическая лингвистика текста, получили развитие социальная и психо- лингвистика, а также теории генеративных и контекстно — зависимых грамматик. Ценность вклада перечисленных ученых в развитие методологии ИАР определяется тем, что ими были впервые сформулированы основные положения дискурсного анализа сообщений, учитывающего различные виды контекста сообщения во взаимодействии с социально-культурным и ситуационным контекстом, характеризующим состояние, в котором пребывают лица, генерирующие и получающие эти сообщения.

Уровень сложности генерируемых в зависимости от дискурса сообщений существенно варьируется. Особенно ярко проявляется здесь действие принципа релевантности подачи информации. Так, в работах Т.А. ван Дейка «Структура новостей в прессе» и «Анализ новостей как дискурса» дается перечень языковых, социальных и психологических факторов, обусловливающих композиционную и стилистическую специфику этого типа текстов.

Анализ обзорных, аналитических, новостийных, ретроспективных публикаций, появляющихся в отечественной и зарубежной прессе, в целом подтвердил тезис о стилистической и композиционной специфичности этих видов текстов. Однако, помимо этого, было отмечено наличие достаточно серьезных вариаций внутри каждого класса. Данные вариации могут быть обусловлены как личностной спецификой автора, так и общим эмоциональным строем каждого конкретного издания (здесь сказывается редакционная политика). Результаты статистических исследований различных типов текстов показали наличие устойчивых зависимостей между уровнем сложности предложений (показатели: длина предложения, наличие формальных признаков сложно подчиненных, сочиненных конструкций, обособленных оборотов, длина слов и т. п.) и гипотезой источника сообщения об образовательном статусе и интеллектуальном потенциале потребителя.

Исследования специалистов в области инженерной психологии, специализирующихся в области разработки сложных автоматизированных систем управления, показывают, что смена интерфейса информационной системы или способа представления информации приводит к возникновению дезадаптационного стресса. При работе с текстами событием, аналогичным смене интерфейса, является смена стиля изложения материала. По своему воздействию на потребителя сообщений смена стиля изложения сопоставима со сменой интерфейса информационной системы и также приводит к возникновению у аналитика стрессовых состояний, более того, в некоторых случаях она может привести к потере способности к восприятию текста. Это позволяет выделить проблему преодоления композиционной и стилистической неоднородности сообщений в отдельный класс проблем ведения ИАР.

Вполне естественно, что проблема преодоления стилевой и композиционной специфики сообщения представляет собой не меньшую трудность для компьютерных систем. Однако, коль скоро для рассматриваемых приложений речь не идет о понимании сообщения в привычном для человека смысле этого слова, для компьютерных приложений данная проблема предстает в своем «рафинированном» виде. Это означает, что на начальных этапах анализа текста рассмотрение функций прагматического характера, возлагаемых автором сообщения на композиционную и стилистическую специфику порождаемого им текста, может быть вынесено на другой уровень интерпретации текста.

По существу, процесс преодоления стилевой и композиционной специфики может быть сведен к двум относительно независимым процессам: процессу приведения отдельных высказываний к стандартизованной грамматической форме (этот процесс может быть назван также процессом редукции, приведения к канонической форме) и процессу связывания повествовательных микро- и макростратегий. Поскольку прагматическая составляющая текста, порождаемого в ходе информационного взаимодействия (ИВ), зачастую заключена в его эмоциональной компоненте, постольку попутно с приведением сообщения к стандартизованной форме должна решаться и задача выявления и протоколирования интонационных, композиционных и иных особенностей текста.

1 ... 95 96 97 98 99 100 101 102 103 ... 153
На этой странице вы можете бесплатно читать книгу Аналитика: методология, технология и организация информационно-аналитической работы - Юрий Курносов бесплатно.
Похожие на Аналитика: методология, технология и организация информационно-аналитической работы - Юрий Курносов книги

Оставить комментарий