На конференции SOTM Baltics 2013 сделал доклад про качество адресной базы OSM для того, чтобы понять насколько база пригодна для конкретных проектов. Сведены вместе результаты проектов по открытой полиции, детдомикам и У?Кам. Язык презентации – английский. Все материалы презентации выложены на GitHub, при желании можете попробовать воспроизвести-проверить.
Рассмотренные вопросы:
1. Что можно ожидать от базы OSM при полностью автоматическом геокодировании?
2. Как сильно может помочь постпроцессинг?
3. Каково распределение полноты адресной базы по России?
4. Насколько хороша база OSM по сравнению с другими геокодерами?
Что делает (как помогает) постпроцессинг в геокодировании ?
постпроцессинг исправляет ошибки автоматического геокодера
теоретически, если бы геокодер работал идеально, постпроцессинг был бы не нужен
Т.е. автоматически геокодер определил адрес до улицы, но нужный дом существует и теги у него все правильные, однако геокодер его не нашел и нужно вручную его ткнуть носом или как. На таком объёму вручную не проверишь каждый случай.
Так в чём теория отличается от практики ?
Да, так.
Проверяем вручную, проекты по детдомам и идущий сейчас по У?Кам – все допроверяется вручную.
Про теорию и практику не понял. Всё в презентации – чистая практика.