Оптимальный sample size
Добавлено: 27 янв 2017, 12:48
				
				Есть большая таблица (~ 2 000 000 observations of 25 variables), полученная из серии растров: пиксель - наблюдение, значения растров - переменные (показывают, как меняется характеристика во времени).  Планируется использовать часть этих данных в пакете kohonen.
На какие свойства данных нужно обратить внимание при формировании выборки и как обосновать размер (создать) наиболее репрезентативную выборку (чтобы в дальнейшем можно было экстраполировать полученные результаты на весь объем данных).
Интересуют как методические best practices (что почитать), так и конкретные функции и\или библиотеки
			На какие свойства данных нужно обратить внимание при формировании выборки и как обосновать размер (создать) наиболее репрезентативную выборку (чтобы в дальнейшем можно было экстраполировать полученные результаты на весь объем данных).
Интересуют как методические best practices (что почитать), так и конкретные функции и\или библиотеки