Анализ эмпирических данных социологии
С формальной точки зрения при сравнении эмпирических данных должны соблюдаться следующие правила, необходимые в логике экспериментального анализа:
- два состояния одного процесса сопоставимы, если они содержат хотя бы одно общее свойство или показатель;
- ни один фактор не может быть признан причиной сравниваемых явлений, если в одном случае при регистрации изучаемого явления он имеет место, а в другом - нет (правило согласия Милля);
- вместе с тем данный фактор не может быть причиной изучаемого явления, если в одном случае (исследовании) он имеет место, а само явление не фиксируется, хотя в другом случае (исследовании) дело обстоит так, что регистрируются и явления, и данный фактор (правило различия);
- некий фактор (условие, обстоятельства) не может достоверно считаться определяющим в отношении изучаемого процесса, если в другом случае (в другом исследовании) наряду с ним изучаемому процессу сопутствуют другие факторы.
Эти логические правила, напоминающие о строгости экспериментального вывода, нельзя игнорировать. В зависимости от программных целей исследования анализ полученных данных может быть более или менее глубоким и основательным.
Цель исследования определяет уровень анализа в том смысле, что либо позволяет, либо запрещает прекратить его на какой-то стадии. В полном же объеме, т.е. от первого до последнего шага, последовательность действий социолога при анализе эмпирических данных может быть представлена следующим образом.
Первая стадия - описание всей совокупности данных в их простейшей форме. Предварительно осуществляется общий контроль качества полученной информации: выявляются ошибки и пропуски, допущенные при сборе данных и при вводе их в компьютер для обработки, бракуются какие-то «единицы» выборочной совокупности, не отвечающие модели выборки (коррекция выборки), отсеиваются некомпетентные респонденты (изымаются их данные полностью или частично), производятся другие контрольные действия, которые на социологическом жаргоне называют «чисткой массива». Дальше следует собственно описание: используется аппарат дескриптивной статистики для упорядочения всех данных по отдельным признакам (переменным). Изучаются простые распределения, выявляются аномалии и скошенности, рассчитываются показатели средней тенденции, вариации распределений. Все это необходимо для решения двух задач:
1) общей оценки выборочной совокупности и частных подвыборок (половозрастных, социально-профессиональных и других) с тем, чтобы понять, каким образом особенности выборок будут сказываться на интерпретации того или иного частного вывода и обобщающих заключений;
2) для того чтобы в последующих операциях с данными не утратить представления о составляющих более сложных зависимостей и комбинаций, которыми впоследствии будем оперировать [1, с. 358-387].
Например, в итоговых или промежуточных выводах находят, что такие-то условия деятельности или характеристики людей более важны, чем некоторые другие. Чтобы правильно интерпретировать это заключение, следует вспомнить, каковы основные характеристики выборки, нет ли в ней заметных аномалий. Очень возможно, что в общей выборке доминируют представители определенного социального статуса, возрастной когорты, национальной принадлежности и т.п. С этими их особенностями связаны социальные функции, интересы, образ жизни. В итоге может оказаться, что суммарные выводы неосновательны: они преимущественно объясняются спецификой доминирующей подвыборки обследованных. Чтобы проверить эту рабочую гипотезу, надо расчленить массив информации на соответствующие подвыборки и повторить анализ раздельно для каждой из них, включая доминирующую.
Так устанавливаются ограничения выводов. Обращение к «простой структуре» данных нужно и для того, чтобы при всевозможных комбинациях и сложных построениях не утратить представления об их первооснове. Вдруг «выскакивает» интереснейший факт, какие-то явления неожиданно тесно коррелируют. При попытке объяснить, что происходит, возможно было забыто, что сведения об этих явлениях получены по ответам респондентов на два вопроса одинаковой конструкции, соседствующих в анкете, и что это, видимо, следствие монотонного реагирования на похожие по форме вопросы – они подобны именно в силу психологического эффекта «эхо». Открытия не состоялось. Вторая стадия – «уплотнение» исходной информации, т.е. укрупнение шкал, формирование агрегированных признаков-индексов, выявление типических групп, жестких подвыборок общего массива и т.п.