R-парсер

Не знаете, где задать вопрос? Задавайте здесь.
Ответить
pain2430
Новоприбывший
Сообщения: 4
Зарегистрирован: 23 янв 2020, 19:41
Репутация: 0
Откуда: Киев

R-парсер

Сообщение pain2430 » 23 янв 2020, 19:49

Здравствуйте! В программировании полный 0, кто может объяснить как этим файлом парсить данные с сайта?
На выходе должны получится 2 csv файла.
Само R, и Rstudio скачал - установил... Буду очень благодарен!
Вложения
parsing.rar
(3.27 КБ) 311 скачиваний

trir
Гуру
Сообщения: 5354
Зарегистрирован: 09 апр 2010, 19:30
Репутация: 1021
Ваше звание: просто мимо прохожу
Откуда: Ё-бург

Re: R-парсер

Сообщение trir » 24 янв 2020, 07:07

Этот код парсит конкретный сайт к конкретной структурой и сохраняет результат в конкретное место на диске
зачем для этого R?

pain2430
Новоприбывший
Сообщения: 4
Зарегистрирован: 23 янв 2020, 19:41
Репутация: 0
Откуда: Киев

Re: R-парсер

Сообщение pain2430 » 24 янв 2020, 13:49

trir писал(а):
24 янв 2020, 07:07
Этот код парсит конкретный сайт к конкретной структурой и сохраняет результат в конкретное место на диске
зачем для этого R?
Добрый день, trir!
Есть еще два файла, они тоже в R. Они после парсинга сайта, эти данные обрабатывают... Но пока хотел бы разобратся просто как хотя бы парсить.
А чем еще можно это сделать?(желательно чтобы этот код не переписывать)

trir
Гуру
Сообщения: 5354
Зарегистрирован: 09 апр 2010, 19:30
Репутация: 1021
Ваше звание: просто мимо прохожу
Откуда: Ё-бург

Re: R-парсер

Сообщение trir » 24 янв 2020, 13:50

исправлять ошибки

pain2430
Новоприбывший
Сообщения: 4
Зарегистрирован: 23 янв 2020, 19:41
Репутация: 0
Откуда: Киев

Re: R-парсер

Сообщение pain2430 » 24 янв 2020, 21:11

trir писал(а):
24 янв 2020, 13:50
исправлять ошибки
То есть в коде есть ошибки? С чем связаны хотя бы? Код 5-ти летней давности...

trir
Гуру
Сообщения: 5354
Зарегистрирован: 09 апр 2010, 19:30
Репутация: 1021
Ваше звание: просто мимо прохожу
Откуда: Ё-бург

Re: R-парсер

Сообщение trir » 25 янв 2020, 09:49

То есть в коде есть ошибки?
а он работает?

gamm
Гуру
Сообщения: 4168
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1107
Ваше звание: программист
Откуда: Казань

Re: R-парсер

Сообщение gamm » 25 янв 2020, 12:41

trir писал(а):
25 янв 2020, 09:49
а он работает?
работает, но выдает "Не шмагла" - нужна фамилия теннисиста, для которого есть данные. Я брал несколько с сайта (который забит в программе), но возвращает 404.

А так штука понятная, по фамилии тягает таблички со счетом по сетам (или геймам, я тут не копенгаген), которые парсятся, пересчитываются в числа, и сохраняются. Работать может только под Унихом, к тому есть косяки с датами.

Если у ТС есть фамилия и surface (это скорее всего покрытие, на котором играли), то пусть скажет, можно посмотреть.

А так да, парсить лучше Питоном как я понял. Молодежь лепит парсеры за полчаса ...

pain2430
Новоприбывший
Сообщения: 4
Зарегистрирован: 23 янв 2020, 19:41
Репутация: 0
Откуда: Киев

Re: R-парсер

Сообщение pain2430 » 25 янв 2020, 13:32

gamm писал(а):
25 янв 2020, 12:41
работает, но выдает "Не шмагла" - нужна фамилия теннисиста, для которого есть данные. Я брал несколько с сайта (который забит в программе), но возвращает 404.

А так штука понятная, по фамилии тягает таблички со счетом по сетам (или геймам, я тут не копенгаген), которые парсятся, пересчитываются в числа, и сохраняются. Работать может только под Унихом, к тому есть косяки с датами.

Если у ТС есть фамилия и surface (это скорее всего покрытие, на котором играли), то пусть скажет, можно посмотреть.

А так да, парсить лучше Питоном как я понял. Молодежь лепит парсеры за полчаса ...
Здравствуйте, gamm!
Спасибо за внятное пояснение!
Вот дословное пояснение автора кода:
parsing.R parse this website: http://www.tennisendirect.net/ , looking for the statistics of the player in the last 50 matches on a relevant surface before the given date. The "ficheFemme" function, take the name of the female player and the surface("Grass", "Hard" or "Clay") as input. The output is two csv files:
-The first one contains the date, the name of the opponent, the score of each set, the outcome ("D" for defeat and "V" for victory), the percentage of point won on her serve, percentage of point won on return and surface.
-The second one contains the expect diffrences beetwen the serve-winning probabilities of the two players for a set, given the possible scores of the previous set.

Далее идут еще 2 кода, которые полученную информацию переводят в вероятности...
В общем понял одно...что самому ничего не получится спарсить-обработать, так как знаний в области программирования - 0.
Только искать ребят которые сделают за деньги...

gamm
Гуру
Сообщения: 4168
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1107
Ваше звание: программист
Откуда: Казань

Re: R-парсер

Сообщение gamm » 25 янв 2020, 14:31

pain2430 писал(а):
25 янв 2020, 13:32
Только искать ребят которые сделают
если вы хотите парсить результаты теннисных матчей с этого сайта, то можно пробовать допилить и этот код, раз он работал. Если что-то другое, то лучше создать новый на Питоне. Тут на сайте есть раздел для заказов, но поскольку задача не имеет отношения к ГИС, то лучше искать помощников на профильных сайтах фрилансеров, том же fl.ru

Ответить

Вернуться в «Я новичок!»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 6 гостей