Оптимальный sample size
Добавлено: 27 янв 2017, 12:48
Есть большая таблица (~ 2 000 000 observations of 25 variables), полученная из серии растров: пиксель - наблюдение, значения растров - переменные (показывают, как меняется характеристика во времени). Планируется использовать часть этих данных в пакете kohonen.
На какие свойства данных нужно обратить внимание при формировании выборки и как обосновать размер (создать) наиболее репрезентативную выборку (чтобы в дальнейшем можно было экстраполировать полученные результаты на весь объем данных).
Интересуют как методические best practices (что почитать), так и конкретные функции и\или библиотеки
На какие свойства данных нужно обратить внимание при формировании выборки и как обосновать размер (создать) наиболее репрезентативную выборку (чтобы в дальнейшем можно было экстраполировать полученные результаты на весь объем данных).
Интересуют как методические best practices (что почитать), так и конкретные функции и\или библиотеки