Страница 1 из 2

Оренбургская область

Добавлено: 23 янв 2014, 10:59
sadless74
Данные есть. Они в текстовом виде.
НО!! они в виде текста внутри pdf с форматированы так,
что достать их в удобном виде не получается.

решения два
1. мучатся с экспортом в текст (и получить кучу мусор, который разгребать)
2. переводить в растр и распознавать (восстановить правильный вид таблиц и обрабатывать в Calc)

Может у кого-нибудь есть опыт доставания текста из pdf?

исходные данные прилагаю во вложении

Re: Оренбургская область

Добавлено: 23 янв 2014, 11:14
sadless74
хотя некоторые оформлены не таблицами, а текстом. Такие переделываются в таблицу нормально...

врядли до 1.02 сделаю все уики Оренбургской области, если кто опередит отпишитесь.

Прогресс буду обозначать в этой теме. сделал тик 1836

Re: Оренбургская область

Добавлено: 23 янв 2014, 12:41
kalenkov
Если нужно сохранить структуру таблиц в PDF файле, то я пользуюсь вот этим бесплатным сервисом
http://go4convert.com/ToDoc_Ru
Мне он очень помог.

Проверил на файле
http://www.ik56.ru/etc/form/t004.pdf
Мне кажется, конвертация прошла более чем успешно.

Re: Оренбургская область

Добавлено: 27 янв 2014, 06:41
sadless74
сделаны 1835, 1836. 105 из 1785. 6%

Re: Оренбургская область

Добавлено: 14 фев 2014, 08:02
ginpetr
Сделал Орск и Новотроицк Оренбургской области на пробу.
по Орску: не знаю точного деления на районы по адресам, поэтому tik_id для всех поставил 1814, как для Октябрьского района города, но данные для геокодирования есть.
Если не трудно, посмотрите кто-нибудь качество выполнения.

Орск поправил и перезалил.

Re: Оренбургская область

Добавлено: 14 фев 2014, 08:26
kalenkov
Принадлежность УИКа к определенному району нужно определять по постановлению "Об установлении единой нумерации избирательных участков..". Я добавил ссылки на это постановление и на изменения в координационную таблицу. Вот эти ссылки
http://www.ik56.ru/etc/post/2012/post61_311_5.rar
http://www.ik56.ru/etc/post/2013/post62-315-5.pdf

Отличные списки! Есть несколько помарок типа "г. Орскул. Строителей, 14" (пропущена запятая), но это мигом исправляется при проверке.

Re: Оренбургская область

Добавлено: 14 фев 2014, 08:58
ginpetr
Спасибо, Орск 1809,1814,1823 поправил и перезалил!
В координационной таблице я должен что-то править? или просто могу выкладывать списки по мере готовности?

Re: Оренбургская область

Добавлено: 14 фев 2014, 09:05
kalenkov
Я бы посоветовал списаться с sadless74. Вдруг он сделал больше, чем указано на форуме?

Чтобы избежать двойной работы можно отмечать желтым те районы, которые находятся в процессе обработки. Тут выкладывать лучше сразу итоговый файл по все районам. Результаты по районам тут выкладывать не обязательно. Достаточно просто написать о том, что район сделан.

Re: Оренбургская область

Добавлено: 14 фев 2014, 11:35
ginpetr
Ладно спишусь.
Лучше буду выкладывать кусками, если никто не против.
г. Оренбург забацал: 1802,1828,1808,1802, Гай 1833, Медногорск 1800
планирую дальше города Кувандык, Соль-Илецк, Бузулук, Бугуруслан, но не гарантирую что будет свободное время...

Re: Оренбургская область

Добавлено: 17 фев 2014, 07:48
sadless74
у меня аврал. пока приостановился. рад что вы взялись

Re: Оренбургская область

Добавлено: 20 фев 2014, 09:38
ginpetr
Сделал Кувандыкский район 1836

Re: Оренбургская область

Добавлено: 20 фев 2014, 09:44
sadless74
а зачем?
27 янв 2014, 09:41
сделаны 1835, 1836. 105 из 1785. 6%
2014-01-27-uik56.ods

Re: Оренбургская область

Добавлено: 20 фев 2014, 12:04
ginpetr
Каюсь. Невнимателен.
Вот тогда СольИлецк 1790.

Перевожу в табличный вид в Мапинфо.
Копирую текст из PDF, с помощью Notepad++ привожу текстовый файл к виду
***
Избирательный участок № 1583
здание МОБУ «Казанская основная общеобразовательная школа» Соль-Илецкого района.
пос. Казанка, ул. Школьная, дом № 1
Избирательный участок № 1584
здание ФКУ КП-12 УФСИН России по Оренбургской области, класс для проведения занятий с личным составом.
пос. Чашкан, ул. Южная, дом № 2/3
Избирательный участок № 1585
здание Дома культуры.
с. Дружба, ул. Речная, дом № 33
***
сохраняю с простым именем
выполняю скрипт на Mapbasic, скорректировав в нем tik, tik_id (вместо "ТИК Соль-Илецкого района",1790)
dim txtfile,name,linestr,str,adr_uik,adr_sost,placev_v as string
dim uikv as smallint,ignor as logical


txtfile=FileOpenDlg("","Файл","txt","Открыть файл")
open file txtfile for input as #1 Charset "WindowsCyrillic"
run command "create table "+left$(pathtofilename$(txtfile),len(pathtofilename$(txtfile))-4)+" (auto_code smallint,tik char(100),tik_id smallint,uik smallint,addr_v char(100),place_v char(100),phone_v char(50),addr_o char(100),place_o char(100),phone_o char(50),territory char(400),comment char(100),g_status char(50)) file "+chr$(34)+left$(txtfile,len(txtfile)-4)+chr$(34)+" type native"
name=pathtotablename$(txtfile)



do
Line Input # 1,linestr
linestr=ltrim$(rtrim$(linestr))
if instr(1,linestr,"Избирательный участок")<>0 and instr(1,linestr,"№")<>0 then

if uikv<>0 then
insert into name (auto_code,tik,tik_id,uik,addr_v,place_v) values (56,"ТИК Соль-Илецкого района",1790,uikv,adr_uik,placev_v)
end if

uikv=val(mid$(linestr,instr(1,linestr,"№")+1,7))

Line Input # 1,linestr
linestr=ltrim$(rtrim$(linestr))
placev_v=linestr

Line Input # 1,linestr
linestr=ltrim$(rtrim$(linestr))
adr_uik=linestr
end if

loop while eof(1)<>1



end program
предлагается выбрать текстовый файл, после чего его содержимое загоняется в таблицу, которую потом экспортирую в Excel

Re: Оренбургская область

Добавлено: 24 фев 2014, 08:43
sadless74
текущее...
всего 49 тиков
12 сделано 1790, 1800, 1802, 1808, 1809, 1814, 1823, 1828, 1833, 1834, 1835, 1836
37 пока нет

ginpetr, а вы территории случайно или специально отбрасываете?

Re: Оренбургская область

Добавлено: 26 фев 2014, 08:45
ginpetr
В инструкциях обозначены приоритеты заполнения, ими и руководствуюсь.
1804, 1830