Краткое введение в MaxEnt
- Максим Дубинин
- MindingMyOwnBusiness
- Сообщения: 9129
- Зарегистрирован: 06 окт 2003, 20:20
- Репутация: 748
- Ваше звание: NextGIS
- Откуда: Москва
- Контактная информация:
Краткое введение в MaxEnt
Перевели "Краткое введение в MaxEnt" - руководство начинающего пользователя этого инструмента для пространственного моделирования, использующего набор точек-образцов (presence-only) и набор переменных-гридов на входе и строящий модель объясняющую распределение этих точек на выходе.
Буду признателен критике, а лучше сразу исправлениям.
Disclaimer:
1. есть моменты которые я сам до сих плохо понимаю
2. "переводчик - раб автора", так что улучшить исходный текст местами хотелось, но этого специально не делалось
3. я местами наплевательски отнесся к переводам статистических терминов, решил что лучше закончить перевод и потом постепенно исправлять, чем бесконечное время выяснять как же по нашему p-value или boostrapping.
------------------------------------------------------------------------
28.03.2013: Статья опубликована.
------------------------------------------------------------------------
Буду признателен критике, а лучше сразу исправлениям.
Disclaimer:
1. есть моменты которые я сам до сих плохо понимаю
2. "переводчик - раб автора", так что улучшить исходный текст местами хотелось, но этого специально не делалось
3. я местами наплевательски отнесся к переводам статистических терминов, решил что лучше закончить перевод и потом постепенно исправлять, чем бесконечное время выяснять как же по нашему p-value или boostrapping.
------------------------------------------------------------------------
28.03.2013: Статья опубликована.
------------------------------------------------------------------------
пристегивайтесь, турбулентность прямо по курсу
-
- Гуру
- Сообщения: 5173
- Зарегистрирован: 26 сен 2009, 16:26
- Репутация: 792
- Ваше звание: званий не имею
- Откуда: Москва
Re: Краткое введение в MaxEnt
Внушительный труд, спасибо.
Подправил немного ссылки/орфографию/пунктуацию в начале статьи; зелёным повыделял "скользкие" места, где хорошо бы подправить авторам. Позже продолжу правки.
Подправил немного ссылки/орфографию/пунктуацию в начале статьи; зелёным повыделял "скользкие" места, где хорошо бы подправить авторам. Позже продолжу правки.
Редактор материалов, модератор форума
-
- Гуру
- Сообщения: 4161
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1106
- Ваше звание: программист
- Откуда: Казань
Re: Краткое введение в MaxEnt
1) уровень значимостиМаксим Дубинин писал(а):как же по нашему 1) p-value или 2) boostrapping
2) методы рандомизации
3) пишите в личку, если что такого рода нужно ...
некоторые мысли по поводу терминов ...
feature — объект, в данном контексте это трудно переводимый термин, который обычно переводят как "характеристика", "количественный признак", "количественный показатель". Адекватного термина в русском языке похоже нет, сколько я ни искал. В контексте метода, feature - числовые признаки, являющиеся функциями входных данных (градиентов среды). Вид функций описан ниже
product feature — производные объекты зная метод, смею предположить, что это произведение числовых признаков, являющихся ...
hinge features — петлевые объекты зная метод, смею предположить, что это нелинейные числовые признаки
presence — присутствие
absence — отсутствие
response curve — кривая зависимости (кривая отклика)
predicted suitability — предсказанное качество suitability в контексте данного метода именно пригодность местообитаний, "хабитатность". Адекватного термина я тоже не нашел.
threshold features — пороговые объекты числовые характеристики
step function — ступенчатая функция - скорее одноступенчатая, там один переход 0->1 или 1->0
piece-wise linear function — кусочно-линейная функция
sigmoid function — сигмоидная функция
additive function — аддитивная функция
Maxent exponent — экспонента Maxent - Maxent порождает класс экспоненциальных распределений, это exp(Maxent exponent)
overfitting — излишнее соответствие, притягивание обычно это переводится как "переобучение модели", когда модель начинает воспроизводить шум и детали конкретного набора данных, теряется генерализаци (общность) модели. Слово обучение используется вместо кальки "подгонка", имеющей в русском языке отрицательный смысл.
clamping — слияние
- Максим Дубинин
- MindingMyOwnBusiness
- Сообщения: 9129
- Зарегистрирован: 06 окт 2003, 20:20
- Репутация: 748
- Ваше звание: NextGIS
- Откуда: Москва
- Контактная информация:
Re: Краткое введение в MaxEnt
gamm, гран мерси, сейчас поправим что можно и еще вопросов накидаем
об feature-объект я и вправду зубы сломал...
об feature-объект я и вправду зубы сломал...
пристегивайтесь, турбулентность прямо по курсу
-
- Гуру
- Сообщения: 4161
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1106
- Ваше звание: программист
- Откуда: Казань
Re: Краткое введение в MaxEnt
по поводу ROC-анализа (то, что покрашено зеленым):Максим Дубинин писал(а):еще вопросов накидаем
Отвечаю: ROC анализ используется для оценки качества бинарных (0/1) классификаторов, использующих предиктор, выдающий вероятность единицы.Черная линия показывает ситуацию, которую можно было бы ожидать, если бы модель была не лучше случайной (это как)? . Если синяя линия находится ниже чёрной, это означает, что модель хуже, чем случайная (опять: что значит "хуже/лучше, чем случайная?") .
Имея такой предиктор, можно создать бинарный классификатор с порогом I(p,alpha), который отвечает "Один", если вероятность p, выданная предиктором, выше порога alpha, и "Ноль" в противном случае. Очевидно, что если задать alpha=0, то при любой вероятности он будет отвечать "Один", а если задать alpha=1, то при любой вероятности он будет отвечать "Ноль". Соответствующие ошибки первого и второго рода можно отложить на осях, и меняя alpha получить кривую, характеризующую классификатор. Для идеального классификатора, который выдает вероятность либо 0, либо 1, и никогда не ошибается, эта линия, очевидно, вертикально идет вверх до упора, а потом горизонтально вправо.
Если вместо предиктора брать для ответов вероятность от равномерного генератора случайных чисел, то линия пойдет по диагонали, поэтому линия для любого осмысленного предиктора должна лежать выше диагонали, а если она лежит ниже, то наш предиктор говорит обратное, т.е. не просто ошибается, а преднамеренно говорит неправду.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость