ИСПОЛЬЗОВАНИЕ СОВРЕМЕННЫХ ТЕХНОЛОГИЙ ПРИ РАССЛЕДОВАНИИ ФИНАНСОВЫХ МОШЕННИЧЕСТВ
Информационно-аналитические системы
Информационная аналитика в современном мире - это междисциплинарная отрасль, использующая совокупность приемов и методов фундаментальной и прикладной науки для анализа и решения задач в различных сферах человеческой деятельности. Анализ в данном случае выступает как:
Информационно-аналитические системы - это комплекс аппаратных, программных средств, информационных ресурсов, методик, используемых для обеспечения автоматизации аналитических работ в целях обоснования принятия управленческих решений и других возможных применений. Подобные системы позволяют получать информацию, обрабатывать ее и проводить над ней анализ. Информация - это сведения в виде данных, которые не зависят от формы их представления [1]. Безусловно в любой сфере деятельности встречаются большие объемы важной информации. Качество обработки такой информации влияет на результат анализа данных.
Основная трудность аналитической подготовки принятия решений имеет следующие направления:
- 1. Извлечение из множества источников смешанных данных. Информация может быть представлена в различных форматах и приведение ее к одному формату и одной структуре является ответственной задачей.
- 2. Формирование хранения и доставки пользователям необходимой для принятия решений информации.
- 3. Интеллектуальный и оперативный анализ и подготовка плановой или постоянной оценки состояния объекта управления в виде бумажных документов или экранных форм.
- 4. Подготовка итогов оперативного и интеллектуального анализа для эффективного их восприятия потребителями и принятия на основе адекватных решений.
Информационно-аналитическая система имеет два способа заполнения: вручную и автоматически. На стадии первичной фиксации информация проходит сквозь систему сбора информации и ее глубокого изучения.
Транзакционная база данных в предприятии может быть не одна, зачастую их несколько. Так как транзакционные источники информации не имеют особой согласованности между собой, то анализ располагает к себе преобразовательные и объединяющие функции.
Предметом анализа служит сосредоточенная в хранилище информация, которая по мере надобности изымается четко из исходных источников. Данные источники должны быть структурированы в виде системы характеристик исследуемой предметной области. Информация из внутренних и наружных источников проходит путь в информационное хранилище через программы очистки и преобразования к одному формату. В особых случаях им предоставляется возможность поступать напрямую к заинтересованным лицам или в программы приложения. Далее данные из информационных хранилищ в случае OLAP-анализа либо Reporting-a употребляются для принятия своевременных решений, подготовки материалов или документов. При работе в режиме интеллектуального анализа знания извлекаются из информационного хранилища. В основном они применяются для решений стратегического характера.
Процессы продвижения и использования данных в информационно-аналитических системах проходят несколько этапов (рис. 1):

Рис. 1. Этапы продвижения и использования данных в ИАС
- 1. Этап извлечения, преобразования и загрузки данных. Формируется сбор требуемых данных в хранилище и прорабатываются пути непосредственного извлечения в критических случаях необходимой уточняющей информации из первичных источников на базе принятой системы характеристик, определяющих работу организации. Информация подлежит анализу и применению во время принятия решений и необходима при разработке каких-либо документов. Данному этапу предшествует работа по созданию необходимой структуры перекачиваемых данных.
- 2. Этап накопления, обеспечения готовности данных к использованию. По мере накопления в соответствующих областях памяти производится периодическая загрузка данных из функциональных (транзакционных) подсистем интегрированной информационной системы (ИС) либо автономных ИС, а также поддерживается нужный уровень качества данных. В критических случаях возможна внеплановая загрузка по ситуации.
- 3. Этап использования и анализа данных, содержащихся в хранилище и извлекаемых напрямую из первичных источников. Для обеспечения процесса управления организацией либо другим объектом данные используются в трех фундаментальных режимах: формирование плановых отчетных и прочих документов (Reporting), своевременного анализа в незапланированных ситуациях (OLAP-анализ), интеллектуального либо углубленного анализа (Data mining). Накопленные в хранилище данные имеют возможность быть примененными в специализированных программах, которые обеспечивают успешное развитие бизнеса в целом.
Процессы, которые совершают извлечение, преобразование и загрузку данных, называют ETL-процессами (от англ. Extract, Transform, Load - дословно «извлечение, преобразование, загрузка») [12]. Назначение процесса извлечения помогает осуществить получение данных из источников, находящихся на нижних уровнях. В процессе работы преобразования информации происходит ликвидация избытка данных. Это реализуется с помощью проведения вычислений и агрегаций. Извлечение, загрузка и преобразование могут быть трехступенчатыми, однако их применение зарезервировано регламентом.
Подготовка принятия решений требует концентрации существенного, а подчас колоссального количества информации на месте его подготовки. Возникает задача приближения места хранения и использования информа ции. Трудности подготовки принятия решений разрешаются с применением инструментальных систем поддержания принятия решения Decision Support Sistem (DSS) [1]. В них большое место стали занимать OLAP-технологии, интеллектуальный анализ, подготовка плановых и стандартных документов, которые применяют информационные ресурсы, предоставляемые системами сбора и хранения данных.
Вопрос сбора и хранения информационных ресурсов выделился как занимающий особое место во всей системе управления организацией и оформился в концепцию информационных хранилищ (ИХ) (англ. Data Warehouse) [1]. Данная подсистема является центральной в интегрированной информационной системе, преобразовывающейся в совокупность локальных информационных систем и информационных технологий, слитых воедино средствами информационно-аналитической системы.
Эксплуатация информационных хранилищ подразумевает выполнение хранилищами задач накопления информации о деятельности организации, партнеров и иных ресурсов из различных источников, в том числе баз данных, которые отображают отдельные бизнес-процессы, информационных систем и прочих источников информации, в том числе из глобальных информационных сетей, как, например, Internet. Идея хранилищ данных — это создание единого информационного ресурса организации, многопрофильного в рамках одной концептуальной идеи, направления исследований, корпоративной структуры и т.д., а не просто единый подход к хранению необходимых данных [1]. Информация в хранилище из источников сохраняется и накапливается на протяжении определенного периода времени в области накопления. В течение этого времени осуществляется деятельность по обеспечению необходимого качества данных по определенным стандартам. Во время перекачки из источников данные трансформируются в общий формат, проверяется их смысловая согласованность, а также присутствие погрешностей, ошибок, ведутся мероприятия по повышению качества данных. При достижении требуемого уровня качества и определенного графиком работы момента времени данные переносятся в область хранения. В основе концепции информационных хранилищ стоит идея гибкой архитектуры данных. Имеется в виду, что, собственно, любому пользователю из числа доверенных лиц должна быть обеспечена возможность доступа к любому разрешенному для использования участку данных, которыми располагает организация. Подобный доступ осуществляется путем закладки в организационно-методологические основы построения системы сбора и хранения данных соответствующих возможностей, а также согласования принципов построения и четкого взаимодействия аппаратного, программного комплексов и структуры накапливаемых и хранимых сведений.
Существует несколько различных концепций использования хранилищ данных в разных архитектурах:
- 1. Концепция централизованного хранилища данных предполагает, что при нескольких источниках информации — операционных базах данных - создается единое централизованное хранилище.
- 2. Концепция распределенного хранилища данных основывается на распределении функций ИХ по местам их возникновения или группировки нескольких операционных БД вокруг локального или регионального информационного хранилища.
Одним из способов организации централизованного хранения и представления информации является концепция витрин данных (Data Mart). При таком подходе информация, относящаяся к масштабной предметной области, например информационному пространству крупной корпоративной системы, имеющей несколько достаточно самостоятельных направлений деятельности, группируется по этим направлениям в специально организованных базах данных. Эти базы данных называют витрины данных.
Информация извлекается из информационных хранилищ и предоставляется ее конечным потребителям независимо от архитектуры ИХ и способов представления в базах данных. Она должна соответствовать предъявляемым требованиям по форме представления, содержанию, оперативности, достоверности, воспринимаемости и т.д. Используемые методы анализа обязаны обеспечивать необходимое содержание и достоверность предоставляемой пользователям информации.
Информационные системы руководителя (ИСР) — это инструмент, предоставляющий доступ к необходимым данным в режиме реального времени. Главная задача ИСР — это обеспечение лица, принимающего решения, оперативной и достоверной информацией по важнейшим направлениям бизнеса, в удобной для восприятия форме.
Различают два вида информационно-аналитических систем по режиму и темпу анализа:
1. Статические системы имеют заранее разработанный сценарий обработки данных при весьма ограниченных возможностях вариаций запросов. Такие системы называются информационные системы руководителя (Executive Information System - EIS).
2. Динамические системы обеспечивают обработку нерегламентиро-ванных запросов и гибкую систему подготовки отчетов.
Применение OLAP-системы позволяет автоматизировать стратегический уровень управления организацией. OLAP (англ. Online Analytical Processing - аналитическая обработка данных в реальном времени) представляет собой мощную технологию обработки и исследования данных. Системы, построенные на основе технологии OLAP, предоставляют фактически безграничные возможности по составлению отчетов, выполнению трудоемких аналитических расчетов, построению прогнозов и сценариев, разработке множества вариантов планов.
Еще одна функция НАС - это оперативный анализ. Этот процесс обеспечивает быстрый доступ к любой необходимой информации, содержащейся в информационных хранилищах либо представляемой также в виде многомерного куба [1]. Извлечение информации, как правило, сопровождается обработкой ее по несложным алгоритмам, таким как.
- 1. Производится суммаризация.
- 2. Нахождение процентов от заданных величин.
- 3. Получение относительных показателей.
- 4. Вычисление величин с заданными коэффициентами.
- 5. Другие действия над данными на разных уровнях детализации.
Данные, предназначенные для анализа, представляются в виде электронных таблиц. Пользователю предоставляется возможность оперативно производить над ними различные более сложные вычисления. Инструменты OLAP-систем обеспечивают осуществимость сортировки и выборки данных по заданным условиям. Есть возможность задавать разнообразные качественные и количественные условия.
В рамках OLAP-технологий на основе того, что многомерное представление данных может быть организовано как средствами реляционных СУБД, так и многомерных специализированных средств, различают три типа многомерных OLAP-систем:
- 1. Многомерный (Multidimensional) OLAP - MOLAP.
- 2. Реляционный (Relation) OLAP - ROLAP.
- 3. Смешанный или гибридный (Hibrid) OLAP - HOLAP [1].
Для обработки собранных в различных источниках и местах сбора и хранения данных и выполнения интеллектуального анализа используются все достижения математической науки и информационных технологий.
В первую очередь применяются методы линейной алгебры, классического математического анализа, дискретной математики, многомерного статистического анализа.
Основными задачами интеллектуального анализа являются:
- 1. Выявление взаимозависимостей, причинно-следственных связей, ассоциаций и аналогий, определение значений факторов времени, локализация событий или явлений по месту.
- 2. Классификация событий и ситуаций, определение профилей различных факторов.
- 3. Прогнозирование хода процессов, событий.
Основной задачей является трактовка закономерностей в исследуемых процессах, взаимосвязей и взаимовлияния различных факторов, поиск крупных «непривычных» отклонений, мониторинг хода различных процессов в области мягких и глубинных знаний [1].
Информационные технологии достигли невообразимых возможностей в нынешнем мире. С каждым днем их функциональная возможность обретает все больше и больше ресурсов. В связи с такой тенденцией общее число инструментов информационной безопасности вырастает. Это приводит к большей доступности инструментов для использования многочисленными организациями. Происхождение новых средств не заставляет пересматривать всю работу старой аналитики, а, наоборот, дополняет ее и улучшает. С появлением новейших инструментов общее время работы оптимизируется, однако качество получаемого результата возрастает, а не уменьшается. Если время работы способно сокращаться, следовательно, и общий объем затрат становится меньше. В конечном итоге внедрение и применение нового оборудования оставляет только положительные результаты и содействует позитивной эволюции для данной области сферы деятельности.