Кластерный анализ
Кластерный анализ представляет собой комплекс приемов, позволяющих на основании определенных признаков из несистематизированного материала (например, результат однократного или динамического наблюдения) выделить отдельные классы, группы или типы, а также математически их описать с целью последующей интерпретации [Spath H., 1975; Bock H, 1976].
В наших исследованиях использованы 2 варианта [linger S.,Wysotzki F., 1981] алгоритма, разработанного G. Sebestyen и J. Edie (1966): гиперэллипсоид с параллельными осями и эллипсоид вращения.
Метод Sebestyen и J. Edie избран в связи с тем, что он основан на последовательном алгоритме, т. е. объекты (обнаружения) предлагаются последовательно. К тому же данный метод требует меньшего числа вычислительных операций и ячеек памяти, чем возвратные алгоритмы [Воск, 1976]. Из-за большого числа исследуемых признаков (198 психопатологических симптомов в системе СПСИ-А) и обширной информационной базы (данные о 4300 обследованных больных) для решения поставленных задач мог быть использован, с нашей точки зрения, только последовательный принцип получения результатов.
Кроме того, метод G. Sebestyen и J. Edie обладает рядом особенностей, четко соответствующих нашей концепции относительно проблем классификации.
По нашему опыту, значительное преимущество указанного метода заключается в том, что используемый алгоритм позволяет оценивать результирующие показатели кластерного анализа независимо от числа кластеров, заданных по результатам исследований. При этом число кластеров не должно устанавливаться в зависимости от техники анализа, как это принято для большинства других вопросов кластерного анализа. При заданном числе кластеров получаемая информация неизбежно распределяется по заранее избранному числу кластеров [Brauchli В., 1981; Kendell R., 1978].
Учитывая многообразие психопатологических проявлений, заранее практически невозможно установить, какое число кластеров (классов) удастся выявить. Конечно, ориентировочное число кластеров в общем поддается определению на основании специальных параметров (см. ниже ТАИ-1 и ТАИ-2). Тем не менее число кластеров при использовании данного алгоритма всегда зависит от варьирования количества исследуемых признаков.
Форма и расположение кластера определяются средним вектором и вариационными векторами. В процессе исследования, по мере введения новых данных, указанные векторы изменяются, т. е. происходит «обучение» кластера. Могут образовываться новые кластеры, а существующие распадаться. Гомогенность и разделение кластеров (классов, типов) контролируются посредством 2 радиусов — радиуса ТАИ-1 и радиуса пограничной зоны ТАИ-2. С помощью этих радиусов «мощность» (объем) кластера может изменяться и, таким образом, представляется возможность адаптировать кластер к решению конкретной задачи и достичь необходимой степени разделения исследуемых признаков. На этой же основе осуществляется распределение кластеров соответственно их величине.
Существуют следующие параметры кластерного анализа:
- изменения максимального числа генерируемых кластеров;
- пределы разрешающих границ малых кластеров (незначительное число заболеваний, например, изза выбывших больных, ошибочных заключений и т. д.);
- характеристики циклов обучения, т. е. частота признаков, необходимая для обучения средних и вариационных векторов каждого кластера;
- число накопленных промежуточных пограничных признаков, используемых впоследствии в процессе циклов обучения.
Путем варьирования этих и других параметров проводятся исследования с различной степенью разделений признаков, минимизации величины кластеров и др.
В качестве результата выдаются средние и вариационные векторы каждого кластера. Кроме того, отдельные наблюдения соотносятся с определенными кластерами. Таким образом, кластеры могут быть охарактеризованы соответственно симптоматологическим особенностям (средний вектор), а на основе добавочных данных есть возможность получения сведений относительно пола, возраста и отдельных психопатологических феноменов.
Как уже упоминалось ранее, средний вектор представляет собой своего рода «среднюю выраженность» отдельных симптомов в системе признаков определенного кластера. В качестве критериев экзогенных факторов, относящихся к кластеру, мы учитывали: возраст, пол, продолжительность лечения (или случаи, когда таковое не проводилось), эффективность психотропных средств, классификационную характеристику психопатологических нарушений по МКБ.
На этой основе может быть осуществлена детальная оценка кластеров соответственно их возрастной и половой специфичности, а также классификационной принадлежности.
Далее, с помощью критериев, отражающих экзогенные воздействия, можно установить, формируется ли кластер только из не получавших лечения больных, или на фоне психофармакотерапии, на определенном ее этапе (например, 15-й день лечения), в конце лечения, а также после его прекращения. На основе кластерного анализа в синдромальном аспекте могут быть получены данные относительно динамики психозов и осевых синдромов, о ходе терапии и ее оптимизации, а также о сравнительной эффективности различных методов лечения.
Ранее приведен пример, характеризующий результаты и возможные варианты оценки кластерного анализа.
«Фармако-терапевтические основы реабилитации психически больных»,
под ред. Р.Я.Вовина
- Значение разработанных методов для фармакотерапии и реабилитации психически больных
- π-Метод (оценка ошибок)
- Вычислительный классификатор
- Основной принцип методики вычислительного классификатора
- Методы вычислительного анализа терапевтического процесса
- Классификация результатов психопатологического обследования
- Способ разделения плоскостей
- СПСИ-В
- Работы по факторному анализу
- Исходные положения исследования
- СПСИ-А
- Постановка проблемы
- Методические концепции постановки диагноза в психиатрии
- Многомерная классификационная система
- Диагностические категории МКБ
- Обсуждение методов