А.О. Крыштановский. Кластеры на факторах (об одном распространенном заблуждении)

Отрывок

Задача построения классификации единиц исследования является весьма распространенной как в социологических, так и в маркетинговых исследованиях. Получение однородных групп объектов (чаще всего - респондентов), то есть таких групп, которые приблизительно одинаково ведут себя в одинаковых ситуациях (чаще всего - одинаково отвечают на вопросы анкеты) - типичная задача сегментирования.

Определенной проблемой при этом является то, что количество параметров, по которым требуется достижение однородности, во многих случаях весьма велико (нередко - несколько десятков). В этой ситуации непосредственная классификация объектов (как правило, с использованием методов кластерного анализа) приводит к плохо интерпретируемым результатам. Действительно, кластерный анализ методом К-средних (без задания содержательно осмысленных центров кластеров) в качестве исходных точек выбирает максимально далеко отстоящие друг от друга точки, которые на практике часто действительно трудно интерпретируемы. Далее, весь массив разделяется на однородные группы с точки зрения близости к этим «непонятным» объектам. Нет ничего удивительного, что результат становится мало вразумительным.

Распространенным подходом в данной ситуации считается двухстадийный метод, когда на первом этапе к исходным признакам применяется факторный анализ с целью получения некоторых латентных показателей (факторов), объединяющих в некоторые группы (факторы) сами признаки. На втором шаге используют кластерный анализ для получения некоторых групп, однородных в смысле средних величин индивидуальных значений построенных факторов. На первый взгляд такой подход представляется вполне логичным и естественным.

Действительно, в данном случае мы проводим кластеризацию небольшого количества исходных признаков, при котором специфическое поведение даже одного из этих признаков может привести к сильному смещению результирующей кластеризации, а классифицируем объекты по 3-4 переменным (факторам), каждая из которых при этом имеет более или менее вразумительную интерпретацию.

Данный подход, по моим наблюдениям, достаточно широко используется в практике как социологических, так и маркетинговых исследований. Такой путь рекомендуется и в достаточно широко распространенной книге А. Бююля и Н.Цефеля . К сожалению, внешняя логичность такого подхода никак не учитывает базовых положений метода факторного анализа, которые, как нам представляется, приводят к тому, что из такого рода классификаций хоть сколь-нибудь обоснованных выводов получиться не может.

Ваша оценка: Нет Средняя: 3.2 (5 голосов)