Глава 2. Статистические методы в
пространствах произвольной природы
Контрольные
вопросы и задачи
1. Как соотносятся эмпирические и
теоретические средние величины для числовых данных и в пространствах
произвольной природы?
2. Как соотносятся законы больших
чисел для числовых случайных величин и в пространствах произвольной природы?
3. Какие экстремальные статистические
задачи Вы знаете?
4. Как связаны законы больших чисел в
пространствах произвольной природы и утверждения об асимптотическом поведении
решений экстремальных статистических задач?
5. Почему одношаговые оценки
предпочтительнее оценок максимального правдоподобия?
6. Почему описание числовых данных с
помощью непараметрических оценок плотности предпочтительнее их описания с
помощью гистограмм?
7. Можно ли строить непараметрические
оценки плотности для результатов наблюдений из дискретных пространств?
8. Какие статистики интегрального
типа Вы знаете?
9. Какую роль играет условие интегрируемости
по Риману-Стилтьесу в предельной теории статистик интегрального типа?
10. Как соотносятся параметрическая
регрессия и непараметрическая регрессия?
11. Как влияет предварительное
выделение однородных групп на проведение регрессионного анализа?
12. Как соотносятся задачи
группировки и задачи кластер-анализа?
13. В таблице приведены попарные
расстояния между десятью социально-психологическими признаками способных к
математике школьников [45]. Примените к этим данным алгоритмы ближнего соседа,
средней связи и дальнего соседа. Для каждого из трех алгоритмов выделите
наиболее устойчивые разбиения на кластеры.
Таблица к задаче 13. Попарные
расстояния между признаками.
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
9 |
10 |
2 |
1028 |
|
|
|
|
|
|
|
|
3 |
1028 |
608 |
|
|
|
|
|
|
|
4 |
1050 |
688 |
610 |
|
|
|
|
|
|
5 |
1012 |
686 |
636 |
634 |
|
|
|
|
|
6 |
1006 |
566 |
538 |
616 |
562 |
|
|
|
|
7 |
1012 |
1026 |
748 |
692 |
774 |
732 |
|
|
|
8 |
960 |
1088 |
1144 |
1122 |
1120 |
1130 |
1110 |
|
|
9 |
1026 |
878 |
874 |
830 |
836 |
802 |
904 |
1040 |
|
10 |
990 |
744 |
674 |
744 |
718 |
580 |
814 |
1090 |
830 |
14. Какие Вам известны методы
наглядного представления данных, основанные на идеях шкалирования и снижения
размерности?