Краткое введение в MaxEnt

Максим Дубинин

Перевели "Краткое введение в MaxEnt" - руководство начинающего пользователя этого инструмента для пространственного моделирования, использующего набор точек-образцов (presence-only) и набор переменных-гридов на входе и строящий модель объясняющую распределение этих точек на выходе.

Буду признателен критике, а лучше сразу исправлениям.

Disclaimer:
1. есть моменты которые я сам до сих плохо понимаю
2. "переводчик - раб автора", так что улучшить исходный текст местами хотелось, но этого специально не делалось
3. я местами наплевательски отнесся к переводам статистических терминов, решил что лучше закончить перевод и потом постепенно исправлять, чем бесконечное время выяснять как же по нашему p-value или boostrapping.

------------------------------------------------------------------------
28.03.2013: Статья опубликована.
------------------------------------------------------------------------

Внушительный труд, спасибо.
Подправил немного ссылки/орфографию/пунктуацию в начале статьи; зелёным повыделял "скользкие" места, где хорошо бы подправить авторам. Позже продолжу правки.

gamm · Сообщение **gamm** » 26 фев 2013, 20:03

Максим Дубинин писал(а):как же по нашему 1) p-value или 2) boostrapping

1) уровень значимости
2) методы рандомизации
3) пишите в личку, если что такого рода нужно ...

некоторые мысли по поводу терминов ...

feature — объект, в данном контексте это трудно переводимый термин, который обычно переводят как "характеристика", "количественный признак", "количественный показатель". Адекватного термина в русском языке похоже нет, сколько я ни искал. В контексте метода, feature - числовые признаки, являющиеся функциями входных данных (градиентов среды). Вид функций описан ниже
product feature — производные объекты зная метод, смею предположить, что это произведение числовых признаков, являющихся ...
hinge features — петлевые объекты зная метод, смею предположить, что это нелинейные числовые признаки
presence — присутствие
absence — отсутствие
response curve — кривая зависимости (кривая отклика)
predicted suitability — предсказанное качество suitability в контексте данного метода именно пригодность местообитаний, "хабитатность". Адекватного термина я тоже не нашел.
threshold features — пороговые объекты числовые характеристики
step function — ступенчатая функция - скорее одноступенчатая, там один переход 0->1 или 1->0
piece-wise linear function — кусочно-линейная функция
sigmoid function — сигмоидная функция
additive function — аддитивная функция
Maxent exponent — экспонента Maxent - Maxent порождает класс экспоненциальных распределений, это exp(Maxent exponent)
overfitting — излишнее соответствие, притягивание обычно это переводится как "переобучение модели", когда модель начинает воспроизводить шум и детали конкретного набора данных, теряется генерализаци (общность) модели. Слово обучение используется вместо кальки "подгонка", имеющей в русском языке отрицательный смысл.
clamping — слияние

Максим Дубинин

gamm, гран мерси, сейчас поправим что можно и еще вопросов накидаем

об feature-объект я и вправду зубы сломал...

gamm · Сообщение **gamm** » 27 фев 2013, 17:53

Максим Дубинин писал(а):еще вопросов накидаем

по поводу ROC-анализа (то, что покрашено зеленым):

Черная линия показывает ситуацию, которую можно было бы ожидать, если бы модель была не лучше случайной (это как)? . Если синяя линия находится ниже чёрной, это означает, что модель хуже, чем случайная (опять: что значит "хуже/лучше, чем случайная?") .

Отвечаю: ROC анализ используется для оценки качества бинарных (0/1) классификаторов, использующих предиктор, выдающий вероятность единицы.

Имея такой предиктор, можно создать бинарный классификатор с порогом I(p,alpha), который отвечает "Один", если вероятность p, выданная предиктором, выше порога alpha, и "Ноль" в противном случае. Очевидно, что если задать alpha=0, то при любой вероятности он будет отвечать "Один", а если задать alpha=1, то при любой вероятности он будет отвечать "Ноль". Соответствующие ошибки первого и второго рода можно отложить на осях, и меняя alpha получить кривую, характеризующую классификатор. Для идеального классификатора, который выдает вероятность либо 0, либо 1, и никогда не ошибается, эта линия, очевидно, вертикально идет вверх до упора, а потом горизонтально вправо.

Если вместо предиктора брать для ответов вероятность от равномерного генератора случайных чисел, то линия пойдет по диагонали, поэтому линия для любого осмысленного предиктора должна лежать выше диагонали, а если она лежит ниже, то наш предиктор говорит обратное, т.е. не просто ошибается, а преднамеренно говорит неправду.

Форумы GIS-Lab.info

Краткое введение в MaxEnt

Краткое введение в MaxEnt

Re: Краткое введение в MaxEnt

Re: Краткое введение в MaxEnt

Re: Краткое введение в MaxEnt

Re: Краткое введение в MaxEnt

Кто сейчас на конференции