Краткое введение в MaxEnt

Обсуждение материалов сайта: вопросы, замечания, предложения
Ответить
Аватара пользователя
Максим Дубинин
MindingMyOwnBusiness
Сообщения: 8902
Зарегистрирован: 06 окт 2003, 20:20
Статьи: 231
Проекты: 12/6
Репутация: 642
Ваше звание: NextGIS
Откуда: Москва
Контактная информация:

Краткое введение в MaxEnt

Сообщение Максим Дубинин » 26 фев 2013, 13:35

Перевели "Краткое введение в MaxEnt" - руководство начинающего пользователя этого инструмента для пространственного моделирования, использующего набор точек-образцов (presence-only) и набор переменных-гридов на входе и строящий модель объясняющую распределение этих точек на выходе.

Буду признателен критике, а лучше сразу исправлениям.

Disclaimer:
1. есть моменты которые я сам до сих плохо понимаю
2. "переводчик - раб автора", так что улучшить исходный текст местами хотелось, но этого специально не делалось
3. я местами наплевательски отнесся к переводам статистических терминов, решил что лучше закончить перевод и потом постепенно исправлять, чем бесконечное время выяснять как же по нашему p-value или boostrapping.

------------------------------------------------------------------------
28.03.2013: Статья опубликована.
------------------------------------------------------------------------
пристегивайтесь, турбулентность прямо по курсу

Александр Мурый
Гуру
Сообщения: 4979
Зарегистрирован: 26 сен 2009, 16:26
Статьи: 3
Проекты: 5/1
Репутация: 697
Ваше звание: званий не имею
Откуда: Москва

Re: Краткое введение в MaxEnt

Сообщение Александр Мурый » 26 фев 2013, 14:31

Внушительный труд, спасибо.
Подправил немного ссылки/орфографию/пунктуацию в начале статьи; зелёным повыделял "скользкие" места, где хорошо бы подправить авторам. Позже продолжу правки.
Редактор материалов, модератор форума

gamm
Гуру
Сообщения: 2534
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 517
Ваше звание: программист
Откуда: Казань

Re: Краткое введение в MaxEnt

Сообщение gamm » 26 фев 2013, 20:03

Максим Дубинин писал(а):как же по нашему 1) p-value или 2) boostrapping
1) уровень значимости
2) методы рандомизации
3) пишите в личку, если что такого рода нужно ...

некоторые мысли по поводу терминов ...

feature — объект, в данном контексте это трудно переводимый термин, который обычно переводят как "характеристика", "количественный признак", "количественный показатель". Адекватного термина в русском языке похоже нет, сколько я ни искал. В контексте метода, feature - числовые признаки, являющиеся функциями входных данных (градиентов среды). Вид функций описан ниже
product feature — производные объекты зная метод, смею предположить, что это произведение числовых признаков, являющихся ...
hinge features — петлевые объекты зная метод, смею предположить, что это нелинейные числовые признаки
presence — присутствие
absence — отсутствие
response curve — кривая зависимости (кривая отклика)
predicted suitability — предсказанное качество suitability в контексте данного метода именно пригодность местообитаний, "хабитатность". Адекватного термина я тоже не нашел.
threshold features — пороговые объекты числовые характеристики
step function — ступенчатая функция - скорее одноступенчатая, там один переход 0->1 или 1->0
piece-wise linear function — кусочно-линейная функция
sigmoid function — сигмоидная функция
additive function — аддитивная функция
Maxent exponent — экспонента Maxent - Maxent порождает класс экспоненциальных распределений, это exp(Maxent exponent)
overfitting — излишнее соответствие, притягивание обычно это переводится как "переобучение модели", когда модель начинает воспроизводить шум и детали конкретного набора данных, теряется генерализаци (общность) модели. Слово обучение используется вместо кальки "подгонка", имеющей в русском языке отрицательный смысл.
clamping — слияние

Аватара пользователя
Максим Дубинин
MindingMyOwnBusiness
Сообщения: 8902
Зарегистрирован: 06 окт 2003, 20:20
Статьи: 231
Проекты: 12/6
Репутация: 642
Ваше звание: NextGIS
Откуда: Москва
Контактная информация:

Re: Краткое введение в MaxEnt

Сообщение Максим Дубинин » 26 фев 2013, 20:21

gamm, гран мерси, сейчас поправим что можно и еще вопросов накидаем

об feature-объект я и вправду зубы сломал...
пристегивайтесь, турбулентность прямо по курсу

gamm
Гуру
Сообщения: 2534
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 517
Ваше звание: программист
Откуда: Казань

Re: Краткое введение в MaxEnt

Сообщение gamm » 27 фев 2013, 17:53

Максим Дубинин писал(а):еще вопросов накидаем
по поводу ROC-анализа (то, что покрашено зеленым):
Черная линия показывает ситуацию, которую можно было бы ожидать, если бы модель была не лучше случайной (это как)? . Если синяя линия находится ниже чёрной, это означает, что модель хуже, чем случайная (опять: что значит "хуже/лучше, чем случайная?") .
Отвечаю: ROC анализ используется для оценки качества бинарных (0/1) классификаторов, использующих предиктор, выдающий вероятность единицы.

Имея такой предиктор, можно создать бинарный классификатор с порогом I(p,alpha), который отвечает "Один", если вероятность p, выданная предиктором, выше порога alpha, и "Ноль" в противном случае. Очевидно, что если задать alpha=0, то при любой вероятности он будет отвечать "Один", а если задать alpha=1, то при любой вероятности он будет отвечать "Ноль". Соответствующие ошибки первого и второго рода можно отложить на осях, и меняя alpha получить кривую, характеризующую классификатор. Для идеального классификатора, который выдает вероятность либо 0, либо 1, и никогда не ошибается, эта линия, очевидно, вертикально идет вверх до упора, а потом горизонтально вправо.

Если вместо предиктора брать для ответов вероятность от равномерного генератора случайных чисел, то линия пойдет по диагонали, поэтому линия для любого осмысленного предиктора должна лежать выше диагонали, а если она лежит ниже, то наш предиктор говорит обратное, т.е. не просто ошибается, а преднамеренно говорит неправду.

Ответить

Вернуться в «Материалы сайта»