π-Метод (оценка ошибок)
После выявления системы классов возникает вопрос о качестве полученной информации и вероятности ошибок. Критерием качества при этом может служить классификационная ошибка в отношении признаков, которые не были подвергнуты исследованию в процессе формирования классов. Ожидаемые ошибки могут быть выявлены π-методом, который, однако, основан на неоправданно сложной вычислительной процедуре [Lachenbruch P., Mickley M., 1968].
π-Метод представляет собой компромисс. Для его использования необходимо распределить информационную базу (исходные данные, полученные в результате исследования больных) на любое число однотипных групп. Например, при применении π-метода исходные данные, относящиеся к результатам 1000 обследований, можно разделить на 5 составных частей (по 200 результатов обследования каждая). В процессе расчетов каждая из 5 частей один раз исключается из разработки, а считанные 4 части подвергаются классификации.
На основе сформированных таким приемом классов затем проводится классификация исключенных вначале данных об общей группе наблюдений; число допущенных ошибок накапливается в машинной памяти. При использовании метода в случае выделения 5 групп наблюдений, следовательно, необходимы 5 обсчетов информации и соответственно получается 5 оценок частоты повторения ошибок. Итоговая величина ошибок представляет собой среднее из результатов классификации отдельных групп наблюдений. Таким образом оцениваются достоверность и воспроизводимость классификации.
Большая величина общей ошибки свидетельствует о непригодности использованного алгоритма для данного сочетания признаков или же об отсутствии в классифицируемом массиве логической структуры признаков, поддающейся строгому делению на определенные классы.
Пример кластерного анализа
Сущность метода, ценность полученных данных и приемы интерпретации результатов кластерного анализа могут быть проиллюстрированы материалами о 190 больных депрессией. В течение 4 — 6 нед проведено 1400 обследований; учтены пол, возраст, распределение диагнозов по МКБ.
Использованы данные о 43 мужчинах и 147 женщинах.
Обследовано больных: в возрасте до 20 лет — 1, 21 — 30 лет — 10, 31 — 40 лет — 27, 41 — 50 лет — 29, 51 — 60 лет — 65 и в возрасте 61 — 70 лет — 36.
Распределение по диагнозам характеризуется данными:
- шифр 2960 (по 8му пересмотру МКБ) — 250;
- шифр 2961 (по 9му пересмотру МКБ) — 638;
- шифр 2962 (по 8му пересмотру МКБ) — 344;
- шифр 2963 (по 9му пересмотру МКБ) — 130;
- шифр 2966 (по 9му пересмотру МКБ) — 9;
- шифр 2968 (по 9му пересмотру МКБ) — 29.
Данные обо всех больных подвергнуты кластерному анализу с использованием алгоритма, предложенного G. Sebestyen и J. Edie в форме гиперэллипсоида с параллельными осями. Проанализировано 198 психопатологических симптомов, включенных в систему СПСИ-А. Симптомы оценивались в альтернативной форме (симптом определяется — 1, симптом отсутствует — 0). В приводимом примере речь идет только о промежуточном результате. В этих условиях мы не ставили задачу представить новую классификацию депрессий, а ограничились лишь демонстрацией возможностей метода кластерного анализа в плане оценки и интерпретации получаемой информации. Особое внимание уделено методам анализа динамики терапевтического процесса.
Для кластерного анализа использованы следующие параметры: число обследований (п) — 1400; радиусы ТАИ1 — 12; ТАИ2 — 30; максимальное число промежуточно накопленных признаков NOM — 40; разрешающая граница малых кластеров (INF — 15; число циклов: ICLZ — 2).
В результате вычислительной процедуры сформировано 5 кластеров.
Исходя из величин среднего вектора и векторов рассеивания, т. е. из симптоматологической структуры, кластеры могут быть охарактеризованы синдромологически следующим образом:
- кластер 1 — тревожнозаторможенный, гипокинетический;
- кластер 2 — эйфорический, гиперкинетический, гипераффективный;
- кластер 3 — дисфорический, гиперкинетический, гипераффективный;
- кластер 4 — ананкастнофобический, апатический (труднодиагностируем при неосознании болезни);
- кластер 5 — тревожнозаторможенный, амнестический, гипокинетический, гипераффективный; нарушение концентрации внимания.
Все 5 кластеров клинически характеризуются отчетливыми депрессивными синдромами.
1-й кластер весьма обширен, он включает признаки, выявленные в результате 1198 обследований. Исходя из симптоматологической и синдромологической характеристик очевидно, что речь идет о неспецифической для депрессий клинической картине. Путем дальнейшего целенаправленного анализа, обеспечивающего большую степень разделения симптомов, можно добиться заметной дифференциации данных.
Представляемая выборка депрессивных состояний отражает как результаты одномоментного обследования, так и динамического наблюдения за состоянием больных. Последние позволяют судить о степени эффективности проводимого лечения. Для оценки профиля течения заболеваний в процессе терапии путем кластерного анализа мы следили за изменением синдромов.
Под профилем течения мы подразумеваем соответствие определяемых в процессе лечения изменений состояния больных определенным кластерам. Таким образом, изменения структуры кластеров свидетельствуют о характерных типах течения заболевания.
С помощью такого анализа, как видно из рассматриваемого примера, представилось возможным проследить три типичных профиля течения:
- перемещение симптомов из 1-го кластера в 4-й;
- перемещение симптомов из 1-го кластера во 2-й;
- перемещение симптомов из 1-го кластера через 2-й в 4-й.
Такой подход, т. е. наблюдение за течением клинической картины путем регистрации изменений структуры кластеров, дает возможность получить четкое представление о необходимой длительности определенных этапов лечения.
Этот же рассматриваемый пример иллюстрирует возможность определения нозологически не детерминированного типа течения заболевания, определяющего известную способность тимолептиков повышать уровень побуждений и настроений.
Метод кластерного анализа позволяет получить обширную информацию относительно типа течения и динамики заболеваний, а также о зависимости последних от возраста, пола, фармакологической характеристики используемых психотропных средств и длительности терапии.
Кластерный анализ раскрывает широкие возможности для новых перспективных исследований, относящихся к проблеме эффективности и оптимизации лечения.
«Фармако-терапевтические основы реабилитации психически больных»,
под ред. Р.Я.Вовина
- Значение разработанных методов для фармакотерапии и реабилитации психически больных
- Вычислительный классификатор
- Основной принцип методики вычислительного классификатора
- Способ разделения плоскостей
- Методы вычислительного анализа терапевтического процесса
- Классификация результатов психопатологического обследования
- Кластерный анализ
- Работы по факторному анализу
- Исходные положения исследования
- СПСИ-А
- СПСИ-В
- Постановка проблемы
- Методические концепции постановки диагноза в психиатрии
- Многомерная классификационная система
- Диагностические категории МКБ
- Обсуждение методов