GIS-LAB

Географические информационные системы и дистанционное зондирование

Нормализованные данные с портала открытых данных г. Москвы

Максим Дубинин, 22.05.2013

Ворчание по поводу глюков в открытых московских данных было вызвано в меньшей мере желанием покритиковать, как многие подумали, но в большей желанием получить нормальные данные. Так как ждать их от поставщика боюсь пришлось бы еще долго, а данные открыты, были обновлены скрипты написанные ранее для учета новых проблем и произведена повторная нормализация всех наборов.

Не буду утомлять перечислением всевозможных проблем, которые пришлось преодолеть, остановлюсь только на важном, с полным списком исправлений можно ознакомиться здесь.

Чем отличается нормализованная версия от исходной:

  1. Зоопарк координат приведен в единую прекрасную EPSG: 4326
  2. Нормализованы поля, теперь поля с координатами везде называются одинаково и многие другие поля имеющие 20 вариантов названия тоже приведены к единым.
  3. Убраны странные глюки типа многочисленных пробельных последовательностей
  4. Осуществлена конвертация каждого набора с привязкой в ESRI Shape и OSM XML, добавлены VRT файлы. Теперь всё можно грузить в Г?С в один шаг.

Результаты можно взять по адресу: http://gis-lab.info/qa/data-mos.html

Принимаются замечания об ошибках и вопросы. ?мейте в виду, что некоторые из них возможно пришли из исходных данных и исправить их не удастся. Так, например, оператором удалены (или потеряны) все геоданные из наборов административно территориального деления и границ культурных объектов, МФЦ и, почему-то, пострадали ЗАГСы. Много ошибок в атрибутике, она разумеется никоим образом не редактировалась.

 

Оставьте комментарий


(Геокруг)

Если Вы обнаружили на сайте ошибку, выберите фрагмент текста и нажмите Ctrl+Enter