Кластерный анализ


Кластерный анализ

Кластерный анализ представляет собой комплекс приемов, позволяющих на основании определенных признаков из несистематизированного материала (например, результат однократного или динамического наблюдения) выделить отдельные классы, группы или типы, а также математически их описать с целью последующей интерпретации [Spath H., 1975; Bock H, 1976].

В наших исследованиях использованы 2 варианта [linger S.,Wysotzki F., 1981] алгоритма, разработанного G. Sebestyen и J. Edie (1966): гиперэллипсоид с параллельными осями и эллипсоид вращения.

Метод Sebestyen и J. Edie избран в связи с тем, что он основан на последовательном алгоритме, т. е. объекты (обнаружения) предлагаются последовательно. К тому же данный метод требует меньшего числа вычислительных операций и ячеек памяти, чем возвратные алгоритмы [Воск, 1976]. Из-за большого числа исследуемых признаков (198 психопатологических симптомов в системе СПСИ-А) и обширной информационной базы (данные о 4300 обследованных больных) для решения поставленных задач мог быть использован, с нашей точки зрения, только последовательный принцип получения результатов.

Кроме того, метод G. Sebestyen и J. Edie обладает рядом особенностей, четко соответствующих нашей концепции относительно проблем классификации.

По нашему опыту, значительное преимущество указанного метода заключается в том, что используемый алгоритм позволяет оценивать результирующие показатели кластерного анализа независимо от числа кластеров, заданных по результатам исследований. При этом число кластеров не должно устанавливаться в зависимости от техники анализа, как это принято для большинства других вопросов кластерного анализа. При заданном числе кластеров получаемая информация неизбежно распределяется по заранее избранному числу кластеров [Brauchli В., 1981; Kendell R., 1978].

Учитывая многообразие психопатологических проявлений, заранее практически невозможно установить, какое число кластеров (классов) удастся выявить. Конечно, ориентировочное число кластеров в общем поддается определению на основании специальных параметров (см. ниже ТАИ-1 и ТАИ-2). Тем не менее число кластеров при использовании данного алгоритма всегда зависит от варьирования количества исследуемых признаков.

Форма и расположение кластера определяются средним вектором и вариационными векторами. В процессе исследования, по мере введения новых данных, указанные векторы изменяются, т. е. происходит «обучение» кластера. Могут образовываться новые кластеры, а существующие распадаться. Гомогенность и разделение кластеров (классов, типов) контролируются посредством 2 радиусов — радиуса ТАИ-1 и радиуса пограничной зоны ТАИ-2. С помощью этих радиусов «мощность» (объем) кластера может изменяться и, таким образом, представляется возможность адаптировать кластер к решению конкретной задачи и достичь необходимой степени разделения исследуемых признаков. На этой же основе осуществляется распределение кластеров соответственно их величине.

Существуют следующие параметры кластерного анализа:

  • изменения максимального числа генерируемых кластеров;
  • пределы разрешающих границ малых кластеров (незначительное число заболеваний, например, изза выбывших больных, ошибочных заключений и т. д.);
  • характеристики циклов обучения, т. е. частота признаков, необходимая для обучения средних и вариационных векторов каждого кластера;
  • число накопленных промежуточных пограничных признаков, используемых впоследствии в процессе циклов обучения.

Путем варьирования этих и других параметров проводятся исследования с различной степенью разделений признаков, минимизации величины кластеров и др.

В качестве результата выдаются средние и вариационные векторы каждого кластера. Кроме того, отдельные наблюдения соотносятся с определенными кластерами. Таким образом, кластеры могут быть охарактеризованы соответственно симптоматологическим особенностям (средний вектор), а на основе добавочных данных есть возможность получения сведений относительно пола, возраста и отдельных психопатологических феноменов.

Как уже упоминалось ранее, средний вектор представляет собой своего рода «среднюю выраженность» отдельных симптомов в системе признаков определенного кластера. В качестве критериев экзогенных факторов, относящихся к кластеру, мы учитывали: возраст, пол, продолжительность лечения (или случаи, когда таковое не проводилось), эффективность психотропных средств, классификационную характеристику психопатологических нарушений по МКБ.

На этой основе может быть осуществлена детальная оценка кластеров соответственно их возрастной и половой специфичности, а также классификационной принадлежности.

Далее, с помощью критериев, отражающих экзогенные воздействия, можно установить, формируется ли кластер только из не получавших лечения больных, или на фоне психофармакотерапии, на определенном ее этапе (например, 15-й день лечения), в конце лечения, а также после его прекращения. На основе кластерного анализа в синдромальном аспекте могут быть получены данные относительно динамики психозов и осевых синдромов, о ходе терапии и ее оптимизации, а также о сравнительной эффективности различных методов лечения.

Ранее приведен пример, характеризующий результаты и возможные варианты оценки кластерного анализа.

«Фармако-терапевтические основы реабилитации психически больных»,
под ред. Р.Я.Вовина

Смотрите также: