R-парсер

Не знаете, где задать вопрос? Задавайте здесь.
Ответить
pain2430
Новоприбывший
Сообщения: 4
Зарегистрирован: 23 янв 2020, 19:41
Репутация: 0
Откуда: Киев

R-парсер

Сообщение pain2430 »

Здравствуйте! В программировании полный 0, кто может объяснить как этим файлом парсить данные с сайта?
На выходе должны получится 2 csv файла.
Само R, и Rstudio скачал - установил... Буду очень благодарен!
Вложения
parsing.rar
(3.27 КБ) 314 скачиваний
trir
Гуру
Сообщения: 5355
Зарегистрирован: 09 апр 2010, 19:30
Репутация: 1021
Ваше звание: просто мимо прохожу
Откуда: Ё-бург

Re: R-парсер

Сообщение trir »

Этот код парсит конкретный сайт к конкретной структурой и сохраняет результат в конкретное место на диске
зачем для этого R?
pain2430
Новоприбывший
Сообщения: 4
Зарегистрирован: 23 янв 2020, 19:41
Репутация: 0
Откуда: Киев

Re: R-парсер

Сообщение pain2430 »

trir писал(а): 24 янв 2020, 07:07Этот код парсит конкретный сайт к конкретной структурой и сохраняет результат в конкретное место на диске
зачем для этого R?
Добрый день, trir!
Есть еще два файла, они тоже в R. Они после парсинга сайта, эти данные обрабатывают... Но пока хотел бы разобратся просто как хотя бы парсить.
А чем еще можно это сделать?(желательно чтобы этот код не переписывать)
trir
Гуру
Сообщения: 5355
Зарегистрирован: 09 апр 2010, 19:30
Репутация: 1021
Ваше звание: просто мимо прохожу
Откуда: Ё-бург

Re: R-парсер

Сообщение trir »

исправлять ошибки
pain2430
Новоприбывший
Сообщения: 4
Зарегистрирован: 23 янв 2020, 19:41
Репутация: 0
Откуда: Киев

Re: R-парсер

Сообщение pain2430 »

trir писал(а): 24 янв 2020, 13:50исправлять ошибки
То есть в коде есть ошибки? С чем связаны хотя бы? Код 5-ти летней давности...
trir
Гуру
Сообщения: 5355
Зарегистрирован: 09 апр 2010, 19:30
Репутация: 1021
Ваше звание: просто мимо прохожу
Откуда: Ё-бург

Re: R-парсер

Сообщение trir »

То есть в коде есть ошибки?
а он работает?
gamm
Гуру
Сообщения: 4168
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1107
Ваше звание: программист
Откуда: Казань

Re: R-парсер

Сообщение gamm »

trir писал(а): 25 янв 2020, 09:49а он работает?
работает, но выдает "Не шмагла" - нужна фамилия теннисиста, для которого есть данные. Я брал несколько с сайта (который забит в программе), но возвращает 404.

А так штука понятная, по фамилии тягает таблички со счетом по сетам (или геймам, я тут не копенгаген), которые парсятся, пересчитываются в числа, и сохраняются. Работать может только под Унихом, к тому есть косяки с датами.

Если у ТС есть фамилия и surface (это скорее всего покрытие, на котором играли), то пусть скажет, можно посмотреть.

А так да, парсить лучше Питоном как я понял. Молодежь лепит парсеры за полчаса ...
pain2430
Новоприбывший
Сообщения: 4
Зарегистрирован: 23 янв 2020, 19:41
Репутация: 0
Откуда: Киев

Re: R-парсер

Сообщение pain2430 »

gamm писал(а): 25 янв 2020, 12:41работает, но выдает "Не шмагла" - нужна фамилия теннисиста, для которого есть данные. Я брал несколько с сайта (который забит в программе), но возвращает 404.

А так штука понятная, по фамилии тягает таблички со счетом по сетам (или геймам, я тут не копенгаген), которые парсятся, пересчитываются в числа, и сохраняются. Работать может только под Унихом, к тому есть косяки с датами.

Если у ТС есть фамилия и surface (это скорее всего покрытие, на котором играли), то пусть скажет, можно посмотреть.

А так да, парсить лучше Питоном как я понял. Молодежь лепит парсеры за полчаса ...
Здравствуйте, gamm!
Спасибо за внятное пояснение!
Вот дословное пояснение автора кода:
parsing.R parse this website: http://www.tennisendirect.net/ , looking for the statistics of the player in the last 50 matches on a relevant surface before the given date. The "ficheFemme" function, take the name of the female player and the surface("Grass", "Hard" or "Clay") as input. The output is two csv files:
-The first one contains the date, the name of the opponent, the score of each set, the outcome ("D" for defeat and "V" for victory), the percentage of point won on her serve, percentage of point won on return and surface.
-The second one contains the expect diffrences beetwen the serve-winning probabilities of the two players for a set, given the possible scores of the previous set.

Далее идут еще 2 кода, которые полученную информацию переводят в вероятности...
В общем понял одно...что самому ничего не получится спарсить-обработать, так как знаний в области программирования - 0.
Только искать ребят которые сделают за деньги...
gamm
Гуру
Сообщения: 4168
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1107
Ваше звание: программист
Откуда: Казань

Re: R-парсер

Сообщение gamm »

pain2430 писал(а): 25 янв 2020, 13:32Только искать ребят которые сделают
если вы хотите парсить результаты теннисных матчей с этого сайта, то можно пробовать допилить и этот код, раз он работал. Если что-то другое, то лучше создать новый на Питоне. Тут на сайте есть раздел для заказов, но поскольку задача не имеет отношения к ГИС, то лучше искать помощников на профильных сайтах фрилансеров, том же fl.ru
Ответить

Вернуться в «Я новичок!»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 10 гостей