
Помогите, пожалуйста, составить запрос на Python/VB
-
- Активный участник
- Сообщения: 244
- Зарегистрирован: 03 мар 2015, 10:01
- Репутация: 24
- Откуда: Санкт-Петербург
Re: Помогите, пожалуйста, составить запрос на Python/VB
Спасибо! Это просто замечательно 

-
- Гуру
- Сообщения: 4231
- Зарегистрирован: 10 апр 2006, 22:34
- Репутация: -344969098
- Откуда: Париж
Re: Помогите, пожалуйста, составить запрос на Python/VB
Если у вас все получилось, то вам достались исключительно хорошие данные. Обычно 20% названий, занимаю 800% процентов времени, отпущенных для работы. И еще долго потом, вы будете находить ошибки в "безошибочных" 80%.
Если в вашем тексте действительно есть запятые, то я рекомендую начать именно с них. "Разрезать" все строки текста на то количество частей, которые они дают. И потом анализировать и агрегировать эти подстроки. Спрева добиться, что бы названия населенных пунктов были идентичны - по одному на каждый нп, в идеале - заменены кодом из любого справочника. Далее так же с "улицами", как бы они не назывались, и то же - в справочник их. С нумерацией домов так просто не выйдет, но это уже неизбежно зло. В принципе, правила написания адресов были года два-три назад стандартизированы какой то комиссией при Росреестре или еще ком-то. Правда, я еще не видел, что бы им кто то собирался следовать.
И решать эту задачу в Excel или Calc - дело крайне неблагодарное, т.к. для каждой подстроки вам будет необходимо выполнять агрегацию данных, что бы выявить ошибки или глупости в написании. Это дело для агрегирующих запросов к какой-нибудь базе данных. Симулировать базу данных на Excel - можно, он это позволяет, но это страшно неудобно и непроизводительно.
Если в вашем тексте действительно есть запятые, то я рекомендую начать именно с них. "Разрезать" все строки текста на то количество частей, которые они дают. И потом анализировать и агрегировать эти подстроки. Спрева добиться, что бы названия населенных пунктов были идентичны - по одному на каждый нп, в идеале - заменены кодом из любого справочника. Далее так же с "улицами", как бы они не назывались, и то же - в справочник их. С нумерацией домов так просто не выйдет, но это уже неизбежно зло. В принципе, правила написания адресов были года два-три назад стандартизированы какой то комиссией при Росреестре или еще ком-то. Правда, я еще не видел, что бы им кто то собирался следовать.
И решать эту задачу в Excel или Calc - дело крайне неблагодарное, т.к. для каждой подстроки вам будет необходимо выполнять агрегацию данных, что бы выявить ошибки или глупости в написании. Это дело для агрегирующих запросов к какой-нибудь базе данных. Симулировать базу данных на Excel - можно, он это позволяет, но это страшно неудобно и непроизводительно.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость