π-Метод (оценка ошибок)

29.11.2011

π-Метод (оценка ошибок)

После выявления системы классов возникает вопрос о качестве полученной информации и вероятности ошибок. Критерием качества при этом может служить классификационная ошибка в отношении признаков, которые не были подвергнуты исследованию в процессе формирования классов. Ожидаемые ошибки могут быть выявлены π-методом, который, однако, основан на неоправданно сложной вычислительной процедуре [Lachenbruch P., Mickley M., 1968].

π-Метод представляет собой компромисс. Для его использования необходимо распределить информационную базу (исходные данные, полученные в результате исследования больных) на любое число однотипных групп. Например, при применении π-метода исходные данные, относящиеся к результатам 1000 обследований, можно разделить на 5 составных частей (по 200 результатов обследования каждая). В процессе расчетов каждая из 5 частей один раз исключается из разработки, а считанные 4 части подвергаются классификации.

На основе сформированных таким приемом классов затем проводится классификация исключенных вначале данных об общей группе наблюдений; число допущенных ошибок накапливается в машинной памяти. При использовании метода в случае выделения 5 групп наблюдений, следовательно, необходимы 5 обсчетов информации и соответственно получается 5 оценок частоты повторения ошибок. Итоговая величина ошибок представляет собой среднее из результатов классификации отдельных групп наблюдений. Таким образом оцениваются достоверность и воспроизводимость классификации.

Большая величина общей ошибки свидетельствует о непригодности использованного алгоритма для данного сочетания признаков или же об отсутствии в классифицируемом массиве логической структуры признаков, поддающейся строгому делению на определенные классы.

Пример кластерного анализа

Сущность метода, ценность полученных данных и приемы интерпретации результатов кластерного анализа могут быть проиллюстрированы материалами о 190 больных депрессией. В течение 4 — 6 нед проведено 1400 обследований; учтены пол, возраст, распределение диагнозов по МКБ.

Использованы данные о 43 мужчинах и 147 женщинах.

Обследовано больных: в возрасте до 20 лет — 1, 21 — 30 лет — 10, 31 — 40 лет — 27, 41 — 50 лет — 29, 51 — 60 лет — 65 и в возрасте 61 — 70 лет — 36.

Распределение по диагнозам характеризуется данными:

  • шифр 2960 (по 8му пересмотру МКБ) — 250;
  • шифр 2961 (по 9му пересмотру МКБ) — 638;
  • шифр 2962 (по 8му пересмотру МКБ) — 344;
  • шифр 2963 (по 9му пересмотру МКБ) — 130;
  • шифр 2966 (по 9му пересмотру МКБ) — 9;
  • шифр 2968 (по 9му пересмотру МКБ) — 29.

Данные обо всех больных подвергнуты кластерному анализу с использованием алгоритма, предложенного G. Sebestyen и J. Edie в форме гиперэллипсоида с параллельными осями. Проанализировано 198 психопатологических симптомов, включенных в систему СПСИ-А. Симптомы оценивались в альтернативной форме (симптом определяется — 1, симптом отсутствует — 0). В приводимом примере речь идет только о промежуточном результате. В этих условиях мы не ставили задачу представить новую классификацию депрессий, а ограничились лишь демонстрацией возможностей метода кластерного анализа в плане оценки и интерпретации получаемой информации. Особое внимание уделено методам анализа динамики терапевтического процесса.

Для кластерного анализа использованы следующие параметры: число обследований (п) — 1400; радиусы ТАИ1 — 12; ТАИ2 — 30; максимальное число промежуточно накопленных признаков NOM — 40; разрешающая граница малых кластеров (INF — 15; число циклов: ICLZ — 2).

В результате вычислительной процедуры сформировано 5 кластеров.

Исходя из величин среднего вектора и векторов рассеивания, т. е. из симптоматологической структуры, кластеры могут быть охарактеризованы синдромологически следующим образом:

  • кластер 1 — тревожнозаторможенный, гипокинетический;
  • кластер 2 — эйфорический, гиперкинетический, гипераффективный;
  • кластер 3 — дисфорический, гиперкинетический, гипераффективный;
  • кластер 4 — ананкастнофобический, апатический (труднодиагностируем при неосознании болезни);
  • кластер 5 — тревожнозаторможенный, амнестический, гипокинетический, гипераффективный; нарушение концентрации внимания.

Все 5 кластеров клинически характеризуются отчетливыми депрессивными синдромами.

1-й кластер весьма обширен, он включает признаки, выявленные в результате 1198 обследований. Исходя из симптоматологической и синдромологической характеристик очевидно, что речь идет о неспецифической для депрессий клинической картине. Путем дальнейшего целенаправленного анализа, обеспечивающего большую степень разделения симптомов, можно добиться заметной дифференциации данных.

Представляемая выборка депрессивных состояний отражает как результаты одномоментного обследования, так и динамического наблюдения за состоянием больных. Последние позволяют судить о степени эффективности проводимого лечения. Для оценки профиля течения заболеваний в процессе терапии путем кластерного анализа мы следили за изменением синдромов.

Под профилем течения мы подразумеваем соответствие определяемых в процессе лечения изменений состояния больных определенным кластерам. Таким образом, изменения структуры кластеров свидетельствуют о характерных типах течения заболевания.

С помощью такого анализа, как видно из рассматриваемого примера, представилось возможным проследить три типичных профиля течения:

  • перемещение симптомов из 1-го кластера в 4-й;
  • перемещение симптомов из 1-го кластера во 2-й;
  • перемещение симптомов из 1-го кластера через 2-й в 4-й.

Такой подход, т. е. наблюдение за течением клинической картины путем регистрации изменений структуры кластеров, дает возможность получить четкое представление о необходимой длительности определенных этапов лечения.

Этот же рассматриваемый пример иллюстрирует возможность определения нозологически не детерминированного типа течения заболевания, определяющего известную способность тимолептиков повышать уровень побуждений и настроений.

Метод кластерного анализа позволяет получить обширную информацию относительно типа течения и динамики заболеваний, а также о зависимости последних от возраста, пола, фармакологической характеристики используемых психотропных средств и длительности терапии.

Кластерный анализ раскрывает широкие возможности для новых перспективных исследований, относящихся к проблеме эффективности и оптимизации лечения.

«Фармако-терапевтические основы реабилитации психически больных»,
под ред. Р.Я.Вовина

Смотрите также:

МедБор