А.О. Крыштановский. Кластеры на факторах (об одном распространенном заблуждении)

Отрывок

Задача построения классификации единиц исследования является весьма распространенной как в социологических, так и в маркетинговых исследованиях. Получение однородных групп объектов (чаще всего - респондентов), то есть таких групп, которые приблизительно одинаково ведут себя в одинаковых ситуациях (чаще всего - одинаково отвечают на вопросы анкеты) - типичная задача сегментирования.

Определенной проблемой при этом является то, что количество параметров, по которым требуется достижение однородности, во многих случаях весьма велико (нередко - несколько десятков). В этой ситуации непосредственная классификация объектов (как правило, с использованием методов кластерного анализа) приводит к плохо интерпретируемым результатам. Действительно, кластерный анализ методом К-средних (без задания содержательно осмысленных центров кластеров) в качестве исходных точек выбирает максимально далеко отстоящие друг от друга точки, которые на практике часто действительно трудно интерпретируемы. Далее, весь массив разделяется на однородные группы с точки зрения близости к этим «непонятным» объектам. Нет ничего удивительного, что результат становится мало вразумительным.

Распространенным подходом в данной ситуации считается двухстадийный метод, когда на первом этапе к исходным признакам применяется факторный анализ с целью получения некоторых латентных показателей (факторов), объединяющих в некоторые группы (факторы) сами признаки. На втором шаге используют кластерный анализ для получения некоторых групп, однородных в смысле средних величин индивидуальных значений построенных факторов. На первый взгляд такой подход представляется вполне логичным и естественным.

Действительно, в данном случае мы проводим кластеризацию небольшого количества исходных признаков, при котором специфическое поведение даже одного из этих признаков может привести к сильному смещению результирующей кластеризации, а классифицируем объекты по 3-4 переменным (факторам), каждая из которых при этом имеет более или менее вразумительную интерпретацию.

Данный подход, по моим наблюдениям, достаточно широко используется в практике как социологических, так и маркетинговых исследований. Такой путь рекомендуется и в достаточно широко распространенной книге А. Бююля и Н.Цефеля . К сожалению, внешняя логичность такого подхода никак не учитывает базовых положений метода факторного анализа, которые, как нам представляется, приводят к тому, что из такого рода классификаций хоть сколь-нибудь обоснованных выводов получиться не может.

Скачать книгу

Ваша оценка: Нет Средняя: 3.2 (5 голосов)

Комментарии

Отправить комментарий

  • Доступные HTML теги: <a> <em> <i> <strong> <b> <cite> <code> <ul> <ol> <li> <h2> <h3> <h4> <h5> <h6> <img>
  • Строки и параграфы переносятся автоматически.
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.

Подробнее о форматировании

Обновить Type the characters you see in this picture. Type the characters you see in the picture; if you can't read them, submit the form and a new image will be generated. Not case sensitive.  Switch to audio verification.
:)