Первая International Geospatial Geocoding Conference (IGGC), организованная ESRI при поддержке Navteq и University of Southern California, прошла 6-7 декабря 2011 г. в г. Redlands (США). Это первое мероприятие, целиком посвященное вопросам геокодирования и собравшее большое число видных исследователей. Я ожидал увидеть Peter Christen, но он был занят на AusDM’11.
Большая часть докладов посвящена исследованиям в области медицины и эпидемиологии (E-health), но это привычная ситуация – коммерческие сервисы геокодирования строго закрытые, а службы почтовой доставки товаров живут в своем отдельном мире. Отметились и криминалисты, хотя у них есть свои сложившиеся конференции – на 11th Crime Mapping Research Conference было 3 доклада по геокодированию (не особо примечательные).
Часть материалов, в основном – научные статьи, опубликованы в журналах [1] “Transactions in GIS” №15(6) и [2] “Spatial and Spatio-temporal Epidemiology” (в печати, март 2012 г.). Презентации выступлений обещали разместить на оф. сайте. Если это произойдет, то я дополню пост. Особенно касается докладчиков из коммерческих организаций и в первую очередь Esri – по организатору конференции я не могу представить ни одного доклада.
Также, я постарался снабдить ссылками и личными комментариями важнейших представителей промышленности и академических кругов. Уверен, что начинающим исследователям будет полезно познакомиться с их проектами и публикациями.
Внепрограммные выступления
Открытие конференции, пленарные заседания, обращения и обсуждения.
- Daniel W. Goldberg – руководитель конференции. Вступительную речь можно прочитать в [1, p. 727-733]. В блоге BioMedware совместно с Geoffrey M. Jacquez рассказывает о своих впечатлениях от конференции. Danial Goldberg написал известную книгу – “A Geocoding. Best Practices Guide” (2008). Независимо от IGGC в [1] опубликована его статья “Improving Geocoding Match Rates with Spatially-Varying Block Metrics”, посвященная интерполяции адресов (USC Geocoder).
- Donald F. Cooke (Esri) – украшение всего мероприятия (его фотографии приведены в начале статьи). “Отец” геокодирования (Geocoding and information systems, 1969 г.), разработчик DIME (предшественник TIGER). Последнее время занимает руководящие посты в Esri, Tele Atlas и GDT.
- Mark Greninger – представитель правительства (County of Los Angeles). В докладе “Using GIS to improve Addressing” рассказывает про то, где они используют геокодирование, как устроена система стандартизации адресов, поиска (matching rules, fuzzy logic) и борьбы с false matches (fishbone).
- Paul A. Zandbergen – выступил с блиц-докладом по модификации исходных данных для повышения конфиденциальности и сохранения репрезентативности. Более полная версия представлена на 2011 APHA Annual Meeting – “Validation of Masking Techniques for Location Privacy Protection of Individual-level Health Data” (pdf).
Challenges and Opportunities for Online, Media and Imprecise Textual Geocoding
- Inferring the Location of Twitter Messages Based on User Relationships
Clodoveu A. Davis Jr., Diogo Rennó Rocha de Oliveira, Gisele L. Pappa, Filipe de L. Arcanjo
[1] Если при геокодировании сообщения местоположение автора не удается определить напрямую (нет указаний на топонимы, без встроенных гео-тэгов, не заполнен профиль пользователя и т.п.), то это осуществляется через его друзей. ?сходят из предположения, что большинство друзей проживают неподалеку. - Geocoding Recommender: An Algorithm Recommend Optimal Online Geocoding Services for Applications
Hassan A. Karimi, Monir H. Sharker, Duangduen Roongpiboonsopitto
[1] Толковое сравнение он-лайн геокодеров (Virtual Earth, Google Maps, MapQuest и др.) по качеству, точности, полноте и т.п. Более ранняя публикация этих же авторов в свободном доступе – “Quality assessment of online street and rooftop geocoding services” (2010 г.). - Examining the Magnitude and Meaning of Imprecise address Proxies in Environmental and Public Health Research
Martin A. Healy and Jason A. Gilliland
[2] Влияние неравномерной точности геокодирования в городских и сельских (малонаселенных) районах на последующие исследования. Лаборатория Jason A. Gilliland занимается урбанистикой. - Geo-parsing Messages from Microtext
Judith Gelernter, Nikolai Mushegian
[1]. ?звлечение географических названий из сообщений в Twitter. Создание эталонной размеченной базы и сравнение с результатами Stanford NER. Заочный доклад.
Quality Measures and Impacts
- Evaluation of the quality of an online geocoding resource in the context of a large Brazilian city
Clodoveu A. Davis Jr. and Rafael Odon de Alencar
[1] Проверка качества геокодера Google Maps по эталонной базе точечных адресов г. Belo Horizonte. - Error propagation models to examine the effects of geocoding quality on spatial analysis of health dataset
Paul A. Zandbergen, T.C. Hart, K.E. Lenzer and M.E. Camponovo
[2] Метрики точности геокодирования. Презентация (pdf) - Spatial Error in Geocoding Physician Location Data from the AMA Physician Masterfile: Implications for Spatial Accessibility Analysis
Sara McLafferty, Vincent L. Freeman, Richard E. Barrett, Lan Luo, Alisa Shockley
[2] Оценка точности базы данных AMA Physician Masterfile, используемой в исследованиях доступности медицинской помощи.
Data Management and Analysis
- GGRS Global Grid Reference System – Addressing for the Developing World
Jamieson Murphy, John Bo Jensen (Esri)
Обсуждались преимущества GGRS и применение в геокодировании. Честно говоря, так ничего и не понял. Текст доклада отсутствует, поэтому лучшее что могу предложить сейчас – это статья Wanghong Feia и Lixu Zhi.
Geocoding in Health Science
- Investigating Impacts of Positional Error on Potential Health Care Accessibility
Scott Bell, Kathi Wilson, Tayyab Ikram Shah, Sarina Gersher, and Tina Elliott
[2] Степень доступности скорой медицинской помощи. Этот же доклад на 2011 Esri Health GIS Conference – “Neighborhood Models to Identify MAUP Effects Using Spatial Regression” (pdf). - Geostatistical analysis of health data with incomplete geocoding
Pierre Goovaerts (BioMedware)
[2] Сопоставление двух наборов (binomial kriging) медицинских данных, каждый их которых геокодировался по различным методикам: один – по почтовым индексам, второй – по переписным участкам. У Pierre много публикаций по этой тематике, например из свежего – “Geographical, temporal and racial disparities in late-stage prostate cancer incidence across Florida: a multiscale joinpoint regression analysis”. - A research agenda: Does geocoding positional error matter in health GIS studies?
Geoffrey M. Jacquez (BioMedware)
[2] Содержание доклада полностью отражено в заголовке. Рассуждения на тему назревшей проблемы в гео-медицинских исследованиях. Черновик (pdf).
Space & Time Applications
- A Hybrid Geocoding Methodology for Spatio-Temporal Data
Alan Murray, Tony H. Grubesic, Ran Wei, and Elizabeth Mack
[1] Криминалистика. Адреса регистрации правонарушителей, отбывающих условный срок, и их переезды в пределах города. - Creating Residential and Tenure Histories from Multi-Year White Pages
Kate Beard and Paul Smitherman
[1] Геокодирование адресов из телефонных справочников (по годам) с составлением истории жильцов каждого домовладения и, обратная задача – журнал переездов отдельных людей. Очень интересное исследование, рекомендую. - Georeferencing incidents from locality descriptions and its applications: A case study from Yosemite National Park Search and Rescue
Paul J. Doherty (Esri), Qinghua Guo
[1] Анализ дислокации несчастных случаев в Yosemite National Park. Paul Doherty выступает руководителем секции “спасение людей в дикой природе” на будущем AAG Annual Meeting (февраль, 2012 г.).
Заключение
Радует, что преимущество полноценных по-объектных адресов (rooftop) находит понимание в правительстве (Mark Greninger) и, хотелось бы верить, что многолетние разговоры про “интерполяцию” уйдут в прошлое. Успешный опыт Belo Horizonte должен был убедить еще в 1992 г. После землетрясения на Гаити стали активнее привлекать данные из социальных сетей – очень интересное направление с алгоритмической точки зрения.
Последнее время в целом мало работ непосредственно по технологии геокодирования. По части free-form address чуть ли не единственное – работы Peter Christen. А по описательным адресов (по приметам и направлениям) и NLP исследования ведут только китайцы – актуальная задача в силу культурных особенностей.
Все шире применяются результаты геокодирования в научных и прикладных исследованиях и доклад Pierre Goovaerts в этом плане, по-моему мнению, самый важный на прошедшей конференции.
?нтересное исследование компании Google: “Reading Digits in Natural Images with Unsupervised Feature Learning” – поиск номеров домов на фотографиях (StreetView), в том числе и для пополнения базы данных адресов.
Directions Magazine: “Geocoding Comes to the Forefront: A report from the First International Geospatial Geocoding Conference (IGGC)”
Дополнил ссылки на доклады, вышедшие в “Spatial and Spatio-temporal Epidemiology”.
Также хочется отметить две статьи из того же журнала:
– Daniel W. Goldberga, Geoffrey M. Jacquez “Advances in Geocoding for the Health Sciences”
Вводная по геокодированию в медицине.
– Daniel W. Goldberga, Myles G. Cockburn “The Effect of Administrative Boundaries and Geocoding Error on Cancer Rates in California”
?сточники ошибок в геокодировании – ошибки непосредственно геокодирования адреса, положения центроидов полигонов, источников данных, методов интерполяции и т.д.
На оф. сайте появился раздел с презентациями:
http://geocodingconference.com/proceedings/index.html
Представлены не все доклады, но тем кто не имеет доступа к журналам может быть полезно.