Постоянный адрес сатьи http://soob.ru/n/2003/10/practice/3


Супероружие для аналитика

Основными задачами любой аналитической деятельности является получение информации, ее систематизация, анализ и прогноз в целях выработки рекомендаций для принятия управленческих решений. С развитием интернета количество открытых источников информации резко увеличилось. Как следствие, информационно-аналитическая работа стала невозможна без использования автоматизированных средств анализа данных.

ИНФОРМАЦИЯ КАК ПРОБЛЕМА

Количество информации, циркулирующей в обществе, постоянно увеличивается. На сегодняшний день достаточно проблематично оценить хотя бы приблизительные объемы информации, получаемой различными государственными, научными и другими организациями, ведомствами и компаниями. По данным исследовательского центра компании GTE, только научные институты собирают ежедневно около терабайта новых данных! Из-за огромных объемов процесс обработки информации превратился в колоссальную проблему. Возможности же аналитиков по обработке информационных массивов ограничены. Ни один профессиональный аналитик не в состоянии проанализировать столь огромные потоки информации. Спрашивается: сколько газет в день он может качественно проработать? От силы 56. Далее уже идет переполнение биологического компьютера. Поэтому на анализ больших информационных массивов компаниям приходится бросать целую армию высококвалифицированных и дорогих профессиональных аналитиков. Кроме того, нужно не забывать, что успех любого аналитика зависит от того, насколько должным образом он сумеет обработать и объективно оценить полученные данные. Однако каким бы объективным ни был аналитик, фактор субъективности все равно остается. Человек в той или иной мере является заложником сложившихся представлений, предпочтений и профессионального опыта. Именно субъективный фактор нередко является причиной неверного прогноза. Очевидно, что решение проблемы анализа большого объема информационных данных возможно только с помощью процесса автоматизации. Главное достоинство технических средств анализа данных они лишены тех недостатков, которые присущи человеку-аналитику. С их помощью можно анализировать большие объемы информации, получая при этом объективные результаты.

ПРЕДЕЛ АНАЛИТИКИ

Любая информация может быть представлена в 3 форматах - текстовом, цифровом и графическом. Практически любое явление или процесс можно описать словами. Именно поэтому львиная доля информации, используемой для аналитики, берется из текстовых сообщений и документов.  Основным методом прикладного информационного анализа текстов является контент-анализ. Он предполагает систематическую числовую обработку компонентов информационного источника, а также оценку и интерпретацию ее результатов. Если текст разбить на слова, а затем посчитать частоту их упоминания, то на основании этого распределения (тезауруса текста) можно построить соответствующий график. Тезаурус - это своего рода информационный код, отражающий заложенный в тексте смысл. С его помощью можно исследовать динамику информационного образа того или иного объекта в разных СМИ и в разные промежутки времени. Это составляет предел аналитики, достигнутый в мире. Следующий же шаг заключается в сравнении интенсивности изменений тезаурусов информационных образов разных объектов и, соответственно, получения из него неких выводов. Именно эта идея положена в основу разработки современных информационно-аналитических комплексов «Тренд» и «Мониторинг», в которых синтезированы достижения лингвистки и ряда направлений современной математики. Появления этих систем стало возможным благодаря усилиям бывших военных математиков, ранее занимавшихся расчетами траекторий полета баллистических ракет. Именно они рискнули применить к анализу текстовой информации новейшие достижения математической науки.

СЕКРЕТ В ДЕЛЬТЕ

Разработчики технологий научились сравнивать тезаурусы разных информационных образов между собой и получать меру их схожести. Это дало возможность осуществить следующий шаг- начать исследовать деятельность любого объекта, сравнивая его информационный образ N с информационным образом заданного события (эталоном) N1. Ключевым вопросом в такого рода исследовании является оценка динамики изменения меры схожести (N-N1)=.N во времени, которая позволяет выявить наличие значимой тенденции усиления схожести информационного образа объекта с заданным эталоном.. Например, крупная компания обеспокоена возможностью «наезда» со стороны силовых структур. Для того, чтобы выяснить насколько вероятно это событие, в систему вводится имеющийся информационный массив публикаций о деятельности компании в СМИ. Если его нет, то тогда можно использовать разного рода текстовые сообщения, отражающие ситуацию в компании - служебные документы, данные от различных контактов и т.п.. Далее задаются фильтры- эталоны, имеющие отношение к проблематике, например, «Наезд силовой структуры». Они выступают своего рода эталонными информационными образами. В качестве эталонных фильтров могут выступить описания в прессе уже имевших место ранее «наездов» со стороны правоохранительных органов на разные структуры. Вся информация, касающаяся данного объекта, прогоняется через такие фильтры. Сравнивая по мере схожести информацию по компании с эталонными фильтрами, программа оценивает вероятность развития такого рода сценариев для этой компании. Если мера схожести достигает некоего порога, то аналитику поступает сигнал о том, что наступление рассматриваемого события начинает иметь значимую вероятность. Система схватывает зарождение процессов примерно за 2 месяца до наступления события. Если ее настроить на выявление кризисов, то у пользователя возникает мощная поддержка для анализа и контроля над оперативной обстановкой.

КВАНТОВАЯ ЛИНГВИСТИКА

Образным объяснением принципа работ системы может служить следующий пример: в физике есть разделы механики и квантовой механики. Механика описывает внешнюю сторону физических объектов. Квантовая же механика рассматривает их внутреннее состояние и изменения на уровне микромира, которые находят свои проявления во вне, то есть на уровне механики (макромира). Работу системы «Тренд» по аналогии можно назвать квантовой лингвистикой, так как она работает на глубинных уровнях функционирования языка. Если исследователю нужно узнать состав незнакомого ему минерала, то он просвечивает его заданными лучами определенного спектра и частоты и по полученной реакции определяет наличие в минерале тех или иных веществ и их количественное содержание Информационный образ изучаемого объекта или процесса содержит на «квантовом» уровне информацию обо всех сторонах деятельности объекта или развития процесса. Он и является тем минералом на уровне физической механики, который необходимо подвергнуть исследованию, а в качестве исследовательских инструментов выступают задаваемые аналитиками информационные образы тех аспектов или событий, наличие которых в деятельности объекта надо изучить.

ПРАКТИКА

Главное достоинство системы «Тренд» заключается в том, что она позволяет исследовать и получать данные о внутренних сторонах деятельности объектов или развития процессов, которые явно не отражены в сообщениях СМИ или специальных текстовых данных. Еще одна важная особенностью работы системы состоит в том, что она способна отсекать заказные информационные вбросы и шумы, которые зачастую искажают реальную действительность. Расчеты позволяют аналитикам увидеть динамику развития тех или иных аспектов деятельности объекта или процесса, а также дать прогноз по ним на период до двух месяцев с вероятностью более 67%. В случае кризисных явлений это позволяет руководству принять необходимые меры для их локализации. Результаты расчетов также существенно снижают риски, связанные с субъективностью оценок, даваемыми аналитиками по исследуемым вопросам. Программа «Мониторинг» в отличие от «Тренда» позволяет вести автоматизированный мониторинг большого числа объектов по неограниченному числу эталонных фильтров, проводить их сравнение, прогнозировать тенденции развития ситуации по этим фильтрам , автоматически сигнализировать оператору- аналитику о выходе объекта исследования на значения, близкие к кризисным. Спектр применения информационно-аналитических систем «Тренд» и «Мониторинг» чрезвычайно широк: деловая разведка, внешняя и внутренняя безопасность, выборные и PR-кампании, анализ экономического состояния, отношений в коллективе, политической и социальной напряженности, выявления конфликтных ситуаций, кризисов и угроз.

Дата публикации: 12:39 | 11.02


Copyright © Журнал "Со - Общение".
При полном или частичном использовании материалов ссылка на Журнал "Со - Общение" обязательна.