Статистические информационные технологии

Основные понятия

Статистика (от лат. status — состояние дел) — отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных и изучаются количественные стороны массовых общественных явлений в числовой форме. Термин «статистика» ввел немецкий ученый Г. Ахенвалль в 1746 г.

ИТ выполняет обработку данных по стандарту ИСО/МЭК 2382-1. В соответствии со стандартом выделяют следующие понятия:

  • 1) входные данные: данные, введенные в систему обработки информации или в какую-то ее часть для сохранения или обработки;
  • 2) входной [прилагательное]: относящийся к устройству, процессу или каналу ввода-вывода, участвующему в процессе ввода, или к соответствующим данным или состояниям.

Примечание. Слово «вход» может использоваться вместо слов «входные данные», «входной сигнал» или «входной процесс», когда такое использование понятно в данном контексте;

  • 3) ввод данных — процесс введения данных в систему обработки информации или в какую-то ее часть для сохранения или обработки;
  • 4) обмен данными — перенос данных между функциональными блоками в соответствии с набором правил, управляющих передачей данных и координацией обмена;
  • 5) вывод данных — процесс, с помощью которого система обработки информации или какая-то ее часть передают данные из этой системы или части;
  • 6) выходные данные: данные, которые система обработки информации или какая-то ее часть передают из этой системы или части;
  • 7) выходной [прилагательное] — относящийся к устройству, процессу или каналу ввода-вывода, участвующему в процессе вывода, или к соответствующим данным или состояниям. Слово «выход» может использоваться вместо слов «выходные данные», «выходной сигнал» или «выходной процесс», когда такое использование понятно в данном контексте;
  • 8) оцифровка — процесс представления в цифровой форме данных, не являющихся дискретными. Пример: Получить цифровое представление значения физической величины на основании аналогового представления этого значения;
  • 9) редактирование (документа) — процесс обработки документа, включающий в себя создание и (или) изменение его содержимого, структуры и (или) атрибутов;
  • 10) форматирование (документа) (компоновка, размещение) — выполнение операций для определения компоновки документа;
  • 11) разметка документа (операция) — добавление к тексту документа текста разметки на специальном языке;
  • 12) сохранение — процесс занесения данных в запоминающее устройство;
  • 13) хранение (данных) — процесс(ы) поддержания данных в неизменном состоянии после их сохранения, обеспечивающий(е) возможность их последующего считывания в произвольный момент времени.

Государственная статистика изучает массовые явления в жизни общества, выявляет их сложные взаимосвязи, дает обоснованную оценку экономики страны, создает базу для принятия решений в системе управления экономикой страны.

Госкомстат — орган государственной статистики России, выполняющий важные функции по отношению к органам управления. Органы госстатистики решают задачи различных видов: регламентные и запросные, информационного обслуживания, экономического анализа.

Для решения регламентных задач разработаны комплексы электронной обработки информации (КЭОИ), где используется текстовая информационная технология. При этом по каналам связи и на носителях выполняется обмен данными между всеми уровнями задачи. Для верхнего уровня управления могут применяться локальные КЭОИ.

Для информационного обслуживания используются банки данных по показателям и банки готовых документов.

Экономический анализ базируется на статистическом анализе, основой которого является определение, сбор и накопление исходных статистических данных. При этом для получения качественного результата анализа обязательно выполнение следующих требований: сопоставимость исходных статистических показателей, корректность и единовременность получения данных по этим показателям, полнота охвата возможной аудитории участников статистического исследования.

Реализация указанных трудоемких задач на современном уровне выполняется с помощью автоматизированных статистических ИТ и систем, позволяющих:

  • • определять и оперативно изменять отчетные статистические формы;
  • • выполнять работу абонентов, предоставляющих статистическую информацию в автоматизированном режиме или полностью автоматический сбор информации от абонентов;
  • • контролировать логическую корректность информации на всем протяжении процесса сбора данных;
  • • обеспечивать единое электронное хранение статистических данных с возможностью предоставления информации внешним системам.

Для обоснования закономерности в неопределенных процессах выработаны методы математической статистики (прикладной статистики или анализа данных).

Математическая статистика — раздел математики, разрабатывающий математические методы систематизации и использования статистических данных для научных и практических выводов. Часто она опирается на теорию вероятностей, позволяющую оценить надежность и точность выводов.

К задачам математической статистики относятся проверка статистических гипотез и оценка параметров распределения, неизвестной вероятности события, неизвестной функции распределения, зависимости случайной величины от других случайных величин и др. Для изучения совокупности однородных объектов используется, как правило, выборочное исследование.

Выборка — множество случайно отобранных объектов, явлений, процессов из генеральной (общей) их совокупности. Выборка должна быть репрезентативна, т. е. ее минимальный объем должен обеспечивать оценку математического ожидания с заданной точностью и надежностью.

Информационные технологии математической статистики предоставляют средства для определения таких величин как генеральная средняя, выборочная средняя генеральная дисперсия, генеральное среднее квадратическое отклонение, выборочная дисперсия, исправленная дисперсия (несмещенная оценка генеральной дисперсии), выборочное среднее квадратическое отклонение, доверительной вероятности (надежности) объема выборки и других характеристик.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >