Кластерный анализ

28.11.2011

Кластерный анализ

Кластерный анализ представляет собой комплекс приемов, позволяющих на основании определенных признаков из несистематизированного материала (например, результат однократного или динамического наблюдения) выделить отдельные классы, группы или типы, а также математически их описать с целью последующей интерпретации [Spath H., 1975; Bock H, 1976].

В наших исследованиях использованы 2 варианта [linger S.,Wysotzki F., 1981] алгоритма, разработанного G. Sebestyen и J. Edie (1966): гиперэллипсоид с параллельными осями и эллипсоид вращения.

Метод Sebestyen и J. Edie избран в связи с тем, что он основан на последовательном алгоритме, т. е. объекты (обнаружения) предлагаются последовательно. К тому же данный метод требует меньшего числа вычислительных операций и ячеек памяти, чем возвратные алгоритмы [Воск, 1976]. Из-за большого числа исследуемых признаков (198 психопатологических симптомов в системе СПСИ-А) и обширной информационной базы (данные о 4300 обследованных больных) для решения поставленных задач мог быть использован, с нашей точки зрения, только последовательный принцип получения результатов.

Кроме того, метод G. Sebestyen и J. Edie обладает рядом особенностей, четко соответствующих нашей концепции относительно проблем классификации.

По нашему опыту, значительное преимущество указанного метода заключается в том, что используемый алгоритм позволяет оценивать результирующие показатели кластерного анализа независимо от числа кластеров, заданных по результатам исследований. При этом число кластеров не должно устанавливаться в зависимости от техники анализа, как это принято для большинства других вопросов кластерного анализа. При заданном числе кластеров получаемая информация неизбежно распределяется по заранее избранному числу кластеров [Brauchli В., 1981; Kendell R., 1978].

Учитывая многообразие психопатологических проявлений, заранее практически невозможно установить, какое число кластеров (классов) удастся выявить. Конечно, ориентировочное число кластеров в общем поддается определению на основании специальных параметров (см. ниже ТАИ-1 и ТАИ-2). Тем не менее число кластеров при использовании данного алгоритма всегда зависит от варьирования количества исследуемых признаков.

Форма и расположение кластера определяются средним вектором и вариационными векторами. В процессе исследования, по мере введения новых данных, указанные векторы изменяются, т. е. происходит «обучение» кластера. Могут образовываться новые кластеры, а существующие распадаться. Гомогенность и разделение кластеров (классов, типов) контролируются посредством 2 радиусов — радиуса ТАИ-1 и радиуса пограничной зоны ТАИ-2. С помощью этих радиусов «мощность» (объем) кластера может изменяться и, таким образом, представляется возможность адаптировать кластер к решению конкретной задачи и достичь необходимой степени разделения исследуемых признаков. На этой же основе осуществляется распределение кластеров соответственно их величине.

Существуют следующие параметры кластерного анализа:

  • изменения максимального числа генерируемых кластеров;
  • пределы разрешающих границ малых кластеров (незначительное число заболеваний, например, изза выбывших больных, ошибочных заключений и т. д.);
  • характеристики циклов обучения, т. е. частота признаков, необходимая для обучения средних и вариационных векторов каждого кластера;
  • число накопленных промежуточных пограничных признаков, используемых впоследствии в процессе циклов обучения.

Путем варьирования этих и других параметров проводятся исследования с различной степенью разделений признаков, минимизации величины кластеров и др.

В качестве результата выдаются средние и вариационные векторы каждого кластера. Кроме того, отдельные наблюдения соотносятся с определенными кластерами. Таким образом, кластеры могут быть охарактеризованы соответственно симптоматологическим особенностям (средний вектор), а на основе добавочных данных есть возможность получения сведений относительно пола, возраста и отдельных психопатологических феноменов.

Как уже упоминалось ранее, средний вектор представляет собой своего рода «среднюю выраженность» отдельных симптомов в системе признаков определенного кластера. В качестве критериев экзогенных факторов, относящихся к кластеру, мы учитывали: возраст, пол, продолжительность лечения (или случаи, когда таковое не проводилось), эффективность психотропных средств, классификационную характеристику психопатологических нарушений по МКБ.

На этой основе может быть осуществлена детальная оценка кластеров соответственно их возрастной и половой специфичности, а также классификационной принадлежности.

Далее, с помощью критериев, отражающих экзогенные воздействия, можно установить, формируется ли кластер только из не получавших лечения больных, или на фоне психофармакотерапии, на определенном ее этапе (например, 15-й день лечения), в конце лечения, а также после его прекращения. На основе кластерного анализа в синдромальном аспекте могут быть получены данные относительно динамики психозов и осевых синдромов, о ходе терапии и ее оптимизации, а также о сравнительной эффективности различных методов лечения.

Ранее приведен пример, характеризующий результаты и возможные варианты оценки кластерного анализа.

«Фармако-терапевтические основы реабилитации психически больных»,
под ред. Р.Я.Вовина

Смотрите также:

МедБор