Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Базовые и прикладные информационные технологии

Средства реализации статистических информационных технологий

Как правило, для статистических ИТ используют технические средства, функции которых были изложены в предыдущих разделах. Что касается специальных программных пакетов, методических и организационных средств, то их разработано достаточно много. Вот некоторые из них.

Программный комплекс «Судебная статистика» автоматизирует сбор, обработку и формирование статистических отчетов в системе Судебного департамента при Верховном Суде РФ и в региональных управлениях.

Для Министерства сельского хозяйства и его ведомственных предприятий (ФГУП ВНИИ «Агросистема», ФГУП «ГВЦ Министерства сельского хозяйства РФ» и Федеральное государственное учреждение «Центр рыночной информации АПК») реализована система сбора и обработки статистики

В Госкомстате для почтовой отчетности разработан пакет прикладных программ «Форма», благодаря которому в 2—3 раза сокращаются затраты на проектирование комплексов электронной обработки информации.

Этот пакет включает регламентные модули:

  • • ввод, контроль, запись первичных отчетов;
  • • корректировка первичных отчетов;
  • • формирование «сводов»;
  • • печать сводных отчетов,

которые могут сочетаться с автономными задачами государственной статистики.

Банки данных по показателям (БнДП) предназначены для пользователей — АРМ-статистиков и АРМ-экономистов — в режиме аналитической обработки данных; обслуживаются федеральные органы власти и управления. Банки обеспечивают запросы в диалоговом режиме, формирование массивов данных, содержат следующие базы данных:

  • • статистических данных (до 600 показателей);
  • • отраслевые;
  • • проблемно-ориентированные.

Единицей хранения в БнДП является значение показателя, определяемое тремя компонентами: показателем и его признаком; объектом наблюдения; периодичностью отчетности по объекту.

Базы данных в среде БнДП установлены на файл-сервере ЛВС Госкомстата РФ. БнДП разработали для Windows NT с использованием СУБД SQL Server.

Банк готовых документов (БнГД) предназначен для многоуровневой системы «Статистика России». Федеральный уровень БнГД содержит 18 баз данных. Информация имеет текстовую, табличную и графическую формы; содержит статистические, экономико-аналитические, методические, нормативные и другие готовые документы. БнГД включает широкие возможности телекоммуникации, поиск информации осуществляется по многоуровневому порядку на естественном языке.

Таким образом, инструментальные средства этой технологии на автоматизированном уровне позволяют осуществлять подготовку и работу с комплексом электронной обработки информации: загрузку библиотечного массива и всех элементов информационного фонда, его корректировку, на региональном уровне подготовку исходной информации, ввод и запись исходной информации и ее корректировку, обработку и печать сводных таблиц: формирование промежуточных итоговых числовых матриц, расчеты и печать таблиц, подготовку материалов на верхний уровень, объединение массивов сводных данных. Обработка и получение сводных таблиц выполняется на федеральном уровне, свободные данные получают и местные органы.

«КРОК-Статистика» (программное решение компании КРОК) — система сбора статистической отчетности, используемая для обработки статистических данных различных министерств и ведомств, регулирующих работу сельского хозяйства, транспорта, образования, здравоохранения и т. д. Возможно получение любой статистической формы, содержащей статистические данные в целом по Российской Федерации или в рамках произвольного территориального деления.

Первичные статистические отчеты формируются автоматически на основе шаблонов отчетных форм, в виде документов MS Excel. Заполненные отчетные формы автоматически собираются и обрабатываются системой. Генерация шаблонов возможна на программных платформах Windows, начиная с MS Windows 95, при использовании стандартного пакета MS Office версий 97, 2000, ХР.

При первичном вводе данных осуществляется формальный логический контроль в виде формул проверки данных, что позволяет сократить объем недостоверной информации. После формально-логического контроля они загружаются в хранилище комплекса, организованное в рамках СУБД промышленного класса (например, MS SQL Server 2000 или Oracle). «КРОК-Статистика» позволяет получать производные статистические отчеты, показатели которых рассчитываются по заданным формулам.

Программное обеспечение имеет трехзвенную архитектуру:

  • • выделенный сервер БД промышленного класса (например, Microsoft SQL Server);
  • • сервер приложений на основе интернет-сервера MS Internet Information Server (IIS);
  • • использование веб-браузера MS Internet Explorer на рабочих местах пользователей.

Такая архитектура позволяет организовать централизованное администрирование комплекса в целом. При обновлении версии системы актуализация информации у конечных пользователей происходит непосредственно в момент доступа к приложению.

Система «КРОК-Статистика» обеспечивает высокий уровень безопасности и защиты от несанкционированного доступа. Возможен переход на защищенные протоколы взаимодействия (HTTPS, использование цифровых сертификатов интернет-сервера).

Технология компании КРОК легла в основу разработки многих систем, где требуется сбор и обработка больших объемов статистических данных, например «Системы автоматизации проведения единого государственного экзамена», АСУ ЗАГС Ставропольского края и др.

Методы математической (прикладной) статистики реализуются с помощью пакетов прикладных математических (MathCad, Mat Lab и др.), статистических (STATISTICA, StatGraphics. и др.) и других программ, в которых предусматриваются средства обработки данных.

Целесообразно изучать анализ данных на компьютере в Excel, а затем, по мере возникновения соответствующих вопросов, переходить к профессиональным программам. Excel — мощный электронный процессор, оснащенный сотнями различных функций и возможностями их реализаций для статистических задач. При этом можно использовать встроенные функции, циклические ссылки, графическое представление процесса и результатов вычислений, создание пользовательских функций и надстроек. Функции Excel можно применять для решения типовых задач математического анализа и матричной алгебры (вычисление пределов числовых последовательностей и функций, производных и интегралов, решения систем линейных алгебраических уравнений). Средствами VBA можно разработать специальные диалоговые формы и программы-надстройки.

Mathcad — программное средство, среда для выполнения на компьютере разнообразных математических и технических расчетов, имеет простой в освоении и в работе графический интерфейс. Mathcad предоставляет пользователю инструменты для работы с формулами, числами, графиками и текстами. В среде Mathcad доступны более сотни операторов и логических функций, предназначенных для численного и символьного решения математических задач различной сложности. Открытая архитектура приложения в сочетании с поддержкой технологий .NET и XML позволяют легко интегрировать Mathcad практически в любые ИТ-структуры и инженерные приложения.

Mat Lab (Matrix Laboratory) — пакет прикладных программ для решения задач технических вычислений и одноименный язык программирования, используемый в этом пакете. Он работает на большинстве современных операционных систем.

Statistica (компании StatSoft) — современный пакет программ для статистического анализа, имеет процедуры для анализа данных (data analysis), управления данными (data management), добычи данных (data mining), визуализации данных (data visualization); включает большое количество разнообразных категорий и типов графиков (в том числе специализированные статистические — гистограммы, матричные, категорированные графики и др.). В системе Statistica имеется возможность выбора различных типов линий, форматов разметки осей, цветов, легенд, названий и других атрибутов графики.

Существуют различные варианты пакета в зависимости от целей и задач пользователя: однопользовательская версия Single-User, сетевая версия Concurrent Network — для локальных вычислительных сетей, Enterprise версия — для использования в вычислительных системах и крупных организациях, Web-Based — применяется в крупных сетях через веб-браузер.

Пакет Statistica включает следующие модули:

  • • Base — основные статистики и набор методов для разведочного анализа;
  • • Advanced Linear/Non-Linear Models — широкий спектр линейных и нелинейных средств моделирования, регрессионный анализ, анализ компонент дисперсий, анализ временных рядов и т. д.;
  • • Multivariate Exploratory Techniques — многомерные разведочные технологии анализа, от кластерного анализа до расширенных методов классификационных деревьев, в сочетании с большим набором средств интерактивной визуализации для построения связей и шаблонов;
  • • QC (контроль качества) — аналитические методы управления качеством, а также контрольные карты презентационного качества;
  • • Neural Networks (отдельный модуль) — единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык;
  • • Data Miner — интеллектуальный анализ данных.

StatGraphics — программа анализа данных, позволяющая использовать более 170 различных статистических процедур — как простейшие инструменты оценки выборки, так и весьма мощные методы. Простота работы с программой достигается за счет интуитивно понятного интерфейса, возможности изменения параметров процедуры и отличной графики.

Обратившись к сайту http://www.bing.com/search?q=STATGRA PH ICS, можно найти методические рекомендации по проведению лабораторных работ с пакетами StatGraphics, Statistica, SPSS по темам: «Предельные теоремы»; «Выборки и их представление»; «Оценки»; «Доверительные границы и интервалы».

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >
 

Популярные страницы