Снижение размерности
Третий раздел многомерного
статистического анализа – задачи снижения размерности с целью сжатия
информации. Цель их решения состоит в определении набора производных
показателей, полученных преобразованием исходных признаков, такого, что число
производных показателей значительно меньше числа исходных признаков, но они
содержат возможно большую часть информации, имеющейся в исходных статистических
данных. Задачи снижения размерности решают с помощью методов многомерного
шкалирования, главных компонент, факторного анализа и др. Например, в
простейшей модели многомерного шкалирования исходные данные – попарные
расстояния
между k объектами, а цель расчетов состоит в
представлении объектов точками на плоскости. Это дает возможность в буквальном
смысле слова увидеть, как объекты соотносятся между собой. Для достижения этой
цели необходимо каждому объекту поставить в соответствие точку на плоскости
так, чтобы попарные расстояния sij между точками, соответствующими
объектам с номерами i и j, возможно точнее воспроизводили расстояния ρij между этими объектами. Согласно
основной идее метода наименьших квадратов находят точки на плоскости так, чтобы
величина

достигала своего наименьшего
значения. Есть и многие другие постановки задач снижения размерности и
визуализации данных.