МЕТОДИКА ОБРАБОТКИ РЕЗУЛЬТАТОВ СОЦИОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ

Первичная обработка результатов социологического исследования и анализ эмпирических данных

После завершения сбора эмпирических данных необходимо провести их обработку. Обработка полученной информации представляет собой преобразование эмпирических данных, полученных в ходе исследования, с целью сделать их обозримыми, компактными, пригодными для анализа, проверки исследовательских гипотез, интерпретации. Процесс обработки результатов исследования включает ряд этапов.

Один из них — редактирование и кодирование информации. Основное назначение этой процедуры состоит в унификации и формализации той информации, которая была получена в ходе исследования. Часть анкетной информации заранее формализована: даны закрытые вопросы (т. е. приведены возможные варианты ответов) и проставлены их цифровые коды. Однако нередко в ответах и на такие вопросы встречаются описки, нечеткое написание и другие погрешности, которые устраняются при редактировании собранных анкет. Другой тип данных, собираемых при массовых опросах, представляют ответы на открытые вопросы. Их группировка и последующее кодирование также являются задачей этой процедуры.

Другой важный этап — это ввод данных в компьютер и электронная обработка информации. Объем информации, собираемой в ходе исследования, как правило, достаточно велик. Обработка таких массивов данных без применения современных компьютеров крайне сложна и малоэффективна.

Информация, собранная на основании анкетирования, в ряде случаев прямо не отвечает на вопросы, которые необходимо решить в исследовании. Связано это с тем, что подчас бывает сложно непосредственно замерить изучаемую характеристику. Для ее получения может потребоваться выполнение ряда преобразований собранных данных. Так, для фиксации среднедушевого дохода необходимо задать респонденту вопросы о его заработной плате (доходе), о заработных платах членов семьи и о количестве членов семьи и др. После этого для получения показателя среднедушевого дохода необходимо сложить ответы на вопросы о заработных платах и разделить сумму на число членов семьи.

Создание переменных является процедурой, в некотором смысле обратной процедуре операционализации понятий: создаваемые переменные выступают в качестве показателей, изучению которых, собственно, и посвящено исследование. Для многих вопросов анкет получаемая информация непосредственно отвечает задачам исследования, и в этом случае сами вопросы являются переменными.

Существуют множество программных средств, с помощью которых можно обрабатывать эмпирическую информацию. Они подразделяются на два больших класса: специализированные программные средства и универсальные статистические пакеты программ.

Подготовка данных к обработке — это один из наиболее трудоемких этапов эмпирического исследования. В нем можно условно выделить, как уже отмечалось, ввод данных в компьютер; проверка и чистка данных; специальная подготовка данных. В организации ввода данных в компьютер за последние годы произошли значительные изменения. Современные статистические пакеты позволяют создавать макеты ввода данных непосредственно в компьютере, не загромождая инструментарий избыточной информацией. Статистический анализ данных обычно применяется к исследованию причинных связей между изучаемыми показателями или, точнее, к проверке гипотез о наличии и характере таких связей. Для того, чтобы связь могла рассматриваться как причинная, необходимо (но не достаточно), чтобы выполнялись три принципа причинности (каузальности):

  • — причины (предикторы) должны предшествовать следствию и с очевидностью порождать (инициировать) его наступление;
  • — причины и следствие должны коррелировать друг с другом;
  • — взаимосвязь причин и следствия должна быть изолирована от влияния других факторов.

Таким образом, выбор методов обработки информации зависит от цели и задач исследования, а также от способов измерения используемых показателей. При решении поставленных задач не всегда удается использовать один или два метода, в основном применяют несколько методов.

Как уже отмечалось, первоначально информация проходит стадию предварительной подготовки к обработке. На этой стадии происходит проверка методического инструментария на точность, полноту, качество заполнения, происходит выбраковка некачественно заполненных анкет. Затем информация кодируется, переводится на язык формальной логики. Каждому варианту ответов присваивается некое условное число (код). Кодирование закрытых вопросов происходит, как правило, на уровне разработки инструментария. Формализованный список вариантов ответов называется кодификатором.

Затем происходит обработка первичной информации. При ручной обработке данных по каждому вопросу анкеты нужно определить следующие показатели:

  • — сколько человек выбрали тот или иной вариант ответа;
  • — сколько затруднились с ответом;
  • — сколько опрашиваемых не дали ответа на вопрос.

Эти показатели необходимо подсчитать в абсолютных цифрах, а затем в процентах к общему числу респондентов. Затем необходимо провести проверку: при сложении всех трех показателей в процентах должно получаться 100% или более 100%, если респондент выбрал большее количество альтернатив, чем предполагалось условиями заполнения анкеты. Если получилось меньше 100%, то это означает, что при подсчете была допущена ошибка. После того, как получена картина ответов на все вопросы, можно начинать составление таблиц взаимной сопряженности между ответами на различные вопросы.

При составлении таблиц сопряженности необходимо учитывать значимость связей между вопросами. После получения результатов необходимо прокомментировать каждое полученное цифровое значение. Далее нужно сопоставить полученные данные с гипотезами исследования, что позволит сделать вывод о том, какие гипотезы нашли подтверждение в ходе проведения исследования, а какие — нет.

Затем желательно оценить качество полученных результатов по следующим критериям:

  • — является ли полученная информация качественно новой;
  • — что добавляет полученная информация к тому, что уже известно об объекте;
  • — какие результаты исследования оказались неожиданными;
  • — какие выводы можно сделать по результатам исследования.

При компьютерной обработке обобщение первичной информации получается в виде табуляграмм. Компьютерная обработка дает исследователю так называемый статистический обсчет (общее количество ответов по каждому варианту в абсолютном и процентном выражении) и по заданию исследователя выявляет связи и зависимости (корреляции). Здесь начинают действовать законы математической статистики. Для наглядности полученных результатов целесообразно составить таблицы, диаграммы, графики, схемы, позволяющие наглядно проиллюстрировать результаты исследования.

Самой важной частью обработки эмпирических данных является стадия их анализа и выявления тенденций, прогнозирование их развития и выработка практических рекомендаций и предложений.

Эмпирические данные, полученные в результате обработки первичной информации, представляют собой, образно говоря, различных цветов и оттенков “краски”, с помощью которых предстоит получить реалистическую картину знаний о предмете исследования. Наиболее простая форма обобщения первичной информации — группировка. Она позволяет зачислить респондента в ту или иную группу в соответствии с выбранным признаком (или признаками) группировки. Подсчитывая ответы на вопросы анкеты с учетом таких признаков, исследователь осуществляет не что иное, как простую группировку респондентов с учетом их социально-демографических признаков, мнений, установок, информированности, индивидуальных оценок и т. п. Выделенные таким образом однородные по составу (по признаку группировки) группы значительно легче соотносить, сравнивать, анализировать.

Выбор признака группировки — не произвольная процедура, он диктуется задачей научного исследования, сформулированными ранее гипотезами. Ошибочный выбор признака группировки приводит к неверным выводам при анализе характеристик объекта исследования.

В зависимости от шкалы измерения, в соответствии с которой получены ответы на вопрос, группировка эмпирической информации может представлять собой:

  • — зачисление респондентов в номинальные группы (группировка опрошенных по полу, национальности и т. п.);
  • — упорядочение информации в ранжированном ряду (например, по степени удовлетворенности социальными услугами или по степени включенности в общественную работу и т. п.);
  • — группировку по количественному признаку, в результате которой группы респондентов характеризуются числовой величиной и потому количественно сравнимы между собой.

Операции с номинальными и ранжированными группами осуществляются при помощи математических приемов, соответствующих номинальной и ранговой шкалам. Что касается групп, распределенных по количественному признаку, то они могут быть подвергнуты дальнейшему изучению при помощи любых приемов математической статистики, так как такая группировка осуществляется по интервальной шкале. Когда респондентов распределяют в группы по двум или более признакам, например выделяют мужчин в возрасте до 60 лет, имеющих высшее образование (три признака -— пол, возраст, образование), то говорят о комбинационной группировке. В зависимости от решаемых задач она может быть структурной, типологической и аналитической.

Каждой выделенной группе соответствует некоторое число, отражающее ее количественный состав. Такой ряд чисел, получаемый в результате группировки, называется рядом распределения. Ряды распределений, отражающие результат группировки респондентов по качественным признакам, называются атрибутивными, а по количественным — вариационными. В соответствии с характером количественных признаков вариационные ряды бывают дискретные и непрерывные. Последние, как правило, носят интервальный характер. Это значит, что та или иная группа респондентов характеризуется по количественному признаку не одним числом, а числовым интервалом, например возрастными интервалами: 18-30 лет, 30-60 лет и т. д. Это важно учитывать при вычислении среднестатистического показателя. В соответствии с задачами группировки интервалы могут выбираться равные и неравные, с возрастающими и убывающими значениями. Числа, обозначающие интервалы, называются их границами.

Составление таблиц не представляет собой отдельный вид математической операции обобщения первичной информации. Это только форма отображения рядов распределения, имеющая преимущество в том, что в ней кратко даются пояснения числовых значений соответствующих групп. Числовые данные в таблице объясняются заголовками, подлежащим и сказуемым. Заголовки в таблице бывают общие, выступающие в качестве названия таблицы и раскрывающие структуру группировки рассматриваемой совокупности респондентов либо связь между рядами распределения. Наряду с этим в названии таблицы целесообразно указывать место и время, к которым относятся приводимые сведения, а также общие для всех показателей единицы измерения (проценты, количество человек, оценочный индекс, номинал денег и т. д.). Содержание строк и столбцов раскрывается внутренними заголовками: боковыми для строк и верхними для столбцов. Подлежащим в таблице называется объект (совокупность респондентов), характеристики которого — сказуемое — выражены в таблице в числовом виде.

Наряду с табличным широко используется графический способ отображения эмпирических данных. Чаще всего он имеет вид полигона или гистограммы. Полигон преимущественно используется для графического отображения непрерывных рядов, а гистограмма — дискретных.

Более глубокий вид математического анализа характеристик изучаемого явления — выяснение их взаимодействия и тенденций изменения. Осуществляется оно при помощи сравнения и сопоставления рядов распределения, построенных на основании группировок по различным признакам. Для решения подобной задачи существуют специальные коэффициенты. Их называют коэффициентами корреляции.

Корреляцией называют наличие статистической взаимосвязи признаков. Рассмотрим один из них — коэффициент ранговой корреляции. Он легко рассчитывается “вручную”, а применение его весьма эффективно при анализе распределения социологической информации, полученной при помощи ранговой шкалы. Коэффициенты парной корреляции призваны измерять взаимосвязь между двумя признаками исследуемого объекта. Эта взаимосвязь при изучении социальных явлений не обязательно носит причинно-следственный характер. Если при корреляции двух признаков между ними существует причинно- следственная связь, то признак, влияющий на характер вариации другого признака, принято называть факторным, а зависимый от него признак — результативным.

Наиболее простой метод выявления взаимосвязи двух признаков — группировка и сравнение средних. Корреляционная связь двух (или нескольких) признаков социального объекта носит не функциональный, а статистический характер, в связи с чем она является не строгой закономерностью, а лишь тенденцией. В процессе измерения корреляции между признаками решаются две задачи: определение формы и тесноты связи признаков. При определении формы связи выявляются вариации (характер изменения) средних параметров результативного под воздействием факторного признака при условии их независимости от других признаков. При установлении направленности и тесноты связи возможны три случая:

  • — прямая связь — увеличение (уменьшение) параметров факторного признака приводит к увеличению (уменьшению) параметров результативного признака;
  • — обратная связь — увеличение (уменьшение) параметров факторного признака приводит к уменьшению (увеличению) параметров результативного признака;
  • — изменение параметров факторного признака не приводит к изменению параметров результативного признака, т. е. корреляция отсутствует.

Самый простой метод определения связи между признаками, измеренными при помощи номинальной шкалы, — расчет коэффициента ассоциации. Наиболее совершенным для измерения взаимосвязи между двумя признаками является линейный коэффициент корреляции.

Наряду с приведенными математическими методами обобщения первичной информации и ее сведения в эмпирический показатель исследователь для решения отдельных задач может самостоятельно конструировать исследовательские индексы. Обычно индексы конструируют для решения сложных задач. Успех их построения во многом зависит от профессиональной подготовленности исследователя.

Таким образом, приведенных видов обобщения и отображения эмпирических данных в принципе достаточно, чтобы решить задачи, возникающие в ходе социологического исследования.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >