Встреча ГИС-Лаб и хакатон по проекту с детдомами, 4 мая, сб
Добавлено: 27 апр 2013, 12:14
Как насчет встретиться поработать?
По результатам нашего проекта по детдомикам напрашивается ряд задач, направленных на улучшение данных, которые предлагаю порешать в реале, организовав небольшой хакатон, а по совместительству встречу GIS-Lab. Приглашаются все желающие, найдутся дела и кодерам и "простым ГИСовцам" и осмо-мапперам. Что можно будет поделать на встрече:
1. Собрать список офиц. источников в отдельную статью в вики, по которым можно обновить базу данных по ДУ. Получить представление какие источники искать можно изучив таблицы комментариев некоторых регионов, где участники не ограничились просто коррективкой положения точек.
2. Продолжить улучшать данные содержательно, используя официальные источники собранные в п.1. Можно удалять, добавлять записи и в таблицы и в shape-файлы.
2.5 В связи с п. 2. Подумать, нужно ли поле "статус": удален, добавлен, поле "источник", так как данные будут видимо уже не только из одного источника.
3. Сделать небольшую веб карту с результатами, за основу можно взять карту участников GIS-Lab.
4. Придумать более подходящую систему хранения и (задача максимум) сделать редактируемую базу.
5. "Промапить" подложку OSM там, где ее не хватает для геокодирования, но где есть дополнительные материалы.
6. Написать скрипт для извлечения информации из таблиц в вики в csv файл. Достаточно полей ID, GEOCODE, COMMENT.
7. Написать скрипт для подсчета статистики по точности геокодирования, сравнить точность до и после.
8. Написать скрипт для превращения csv-файла полученного в п.6 в переструктуризированную таблицу в вики (пока нет базы) изменения таблиц в вики.
9. Написать скрипт, который проверит результат и выдаст список точек для которых нет записи в вики таблицах.
10. Как-то поанализировать данные, где сколько ДУ, как далеки они от райцентров, центров субъектов и т.п.
11. Отсортировать по ID таблицы в вики и шейпы с результатами.
12. Загрузить данные на Rynda.org
13. Придумать формат патча для будущих обновлений данных.
14. Написать в детдомики.ру (откуда бралась база), поблагодарить, предложить им карту, написать в gdeetotdom, предложить более качественные данные.
15. В разрезе п. 14, сравнить результат работы по OSM с Яндекс по среднестатистическому региону. НЕ ДЛЯ использования данных Яндекс в окончательных результатах, только для сравнения.
n. Обсудить всё вышеперечисленное, планы, придумать новое.
Когда: Суббота 4 мая
Продолжительность: целый день с 10 до 20, но, разумеется, можно придти на столько, на сколько удобно.
Где: предварительно - офис NextGIS, с него же так же пицца)
Предпочтений по используемому ПО нет, приходите с тем, что вам удобнее, разумеется нужен ноут, хотя есть пара стационарных компов (но они стоят в отдельной комнате).
Удаленно тоже можно будет поучаствовать с координацией через IRC.
Подписаться можно в дудл (регистрация не нужна): http://www.doodle.com/qq5xu3dfm68r6nzc
Или тут на форуме, где можно также обсудить и задать вопросы.
По результатам нашего проекта по детдомикам напрашивается ряд задач, направленных на улучшение данных, которые предлагаю порешать в реале, организовав небольшой хакатон, а по совместительству встречу GIS-Lab. Приглашаются все желающие, найдутся дела и кодерам и "простым ГИСовцам" и осмо-мапперам. Что можно будет поделать на встрече:
1. Собрать список офиц. источников в отдельную статью в вики, по которым можно обновить базу данных по ДУ. Получить представление какие источники искать можно изучив таблицы комментариев некоторых регионов, где участники не ограничились просто коррективкой положения точек.
2. Продолжить улучшать данные содержательно, используя официальные источники собранные в п.1. Можно удалять, добавлять записи и в таблицы и в shape-файлы.
2.5 В связи с п. 2. Подумать, нужно ли поле "статус": удален, добавлен, поле "источник", так как данные будут видимо уже не только из одного источника.
3. Сделать небольшую веб карту с результатами, за основу можно взять карту участников GIS-Lab.
4. Придумать более подходящую систему хранения и (задача максимум) сделать редактируемую базу.
5. "Промапить" подложку OSM там, где ее не хватает для геокодирования, но где есть дополнительные материалы.
6. Написать скрипт для извлечения информации из таблиц в вики в csv файл. Достаточно полей ID, GEOCODE, COMMENT.
7. Написать скрипт для подсчета статистики по точности геокодирования, сравнить точность до и после.
8. Написать скрипт для превращения csv-файла полученного в п.6 в переструктуризированную таблицу в вики (пока нет базы) изменения таблиц в вики.
9. Написать скрипт, который проверит результат и выдаст список точек для которых нет записи в вики таблицах.
10. Как-то поанализировать данные, где сколько ДУ, как далеки они от райцентров, центров субъектов и т.п.
11. Отсортировать по ID таблицы в вики и шейпы с результатами.
12. Загрузить данные на Rynda.org
13. Придумать формат патча для будущих обновлений данных.
14. Написать в детдомики.ру (откуда бралась база), поблагодарить, предложить им карту, написать в gdeetotdom, предложить более качественные данные.
15. В разрезе п. 14, сравнить результат работы по OSM с Яндекс по среднестатистическому региону. НЕ ДЛЯ использования данных Яндекс в окончательных результатах, только для сравнения.
n. Обсудить всё вышеперечисленное, планы, придумать новое.
Когда: Суббота 4 мая
Продолжительность: целый день с 10 до 20, но, разумеется, можно придти на столько, на сколько удобно.
Где: предварительно - офис NextGIS, с него же так же пицца)
Предпочтений по используемому ПО нет, приходите с тем, что вам удобнее, разумеется нужен ноут, хотя есть пара стационарных компов (но они стоят в отдельной комнате).
Удаленно тоже можно будет поучаствовать с координацией через IRC.
Подписаться можно в дудл (регистрация не нужна): http://www.doodle.com/qq5xu3dfm68r6nzc
Или тут на форуме, где можно также обсудить и задать вопросы.