Страница 1 из 1
R-парсер
Добавлено: 23 янв 2020, 19:49
pain2430
Здравствуйте! В программировании полный 0, кто может объяснить как этим файлом парсить данные с сайта?
На выходе должны получится 2 csv файла.
Само R, и Rstudio скачал - установил... Буду очень благодарен!
Re: R-парсер
Добавлено: 24 янв 2020, 07:07
trir
Этот код парсит
конкретный сайт к конкретной структурой и сохраняет результат в конкретное место на диске
зачем для этого R?
Re: R-парсер
Добавлено: 24 янв 2020, 13:49
pain2430
trir писал(а): ↑24 янв 2020, 07:07
Этот код парсит конкретный сайт к конкретной структурой и сохраняет результат в конкретное место на диске
зачем для этого R?
Добрый день, trir!
Есть еще два файла, они тоже в R. Они после парсинга сайта, эти данные обрабатывают... Но пока хотел бы разобратся просто как хотя бы парсить.
А чем еще можно это сделать?(желательно чтобы этот код не переписывать)
Re: R-парсер
Добавлено: 24 янв 2020, 13:50
trir
исправлять ошибки
Re: R-парсер
Добавлено: 24 янв 2020, 21:11
pain2430
trir писал(а): ↑24 янв 2020, 13:50
исправлять ошибки
То есть в коде есть ошибки? С чем связаны хотя бы? Код 5-ти летней давности...
Re: R-парсер
Добавлено: 25 янв 2020, 09:49
trir
То есть в коде есть ошибки?
а он работает?
Re: R-парсер
Добавлено: 25 янв 2020, 12:41
gamm
trir писал(а): ↑25 янв 2020, 09:49
а он работает?
работает, но выдает "Не шмагла" - нужна фамилия теннисиста, для которого есть данные. Я брал несколько с сайта (который забит в программе), но возвращает 404.
А так штука понятная, по фамилии тягает таблички со счетом по сетам (или геймам, я тут не копенгаген), которые парсятся, пересчитываются в числа, и сохраняются. Работать может только под Унихом, к тому есть косяки с датами.
Если у ТС есть фамилия и surface (это скорее всего покрытие, на котором играли), то пусть скажет, можно посмотреть.
А так да, парсить лучше Питоном как я понял. Молодежь лепит парсеры за полчаса ...
Re: R-парсер
Добавлено: 25 янв 2020, 13:32
pain2430
gamm писал(а): ↑25 янв 2020, 12:41
работает, но выдает "Не шмагла" - нужна фамилия теннисиста, для которого есть данные. Я брал несколько с сайта (который забит в программе), но возвращает 404.
А так штука понятная, по фамилии тягает таблички со счетом по сетам (или геймам, я тут не копенгаген), которые парсятся, пересчитываются в числа, и сохраняются. Работать может только под Унихом, к тому есть косяки с датами.
Если у ТС есть фамилия и surface (это скорее всего покрытие, на котором играли), то пусть скажет, можно посмотреть.
А так да, парсить лучше Питоном как я понял. Молодежь лепит парсеры за полчаса ...
Здравствуйте, gamm!
Спасибо за внятное пояснение!
Вот дословное пояснение автора кода:
parsing.R parse this website:
http://www.tennisendirect.net/ , looking for the statistics of the player in the last 50 matches on a relevant surface before the given date. The "ficheFemme" function, take the name of the female player and the surface("Grass", "Hard" or "Clay") as input. The output is two csv files:
-The first one contains the date, the name of the opponent, the score of each set, the outcome ("D" for defeat and "V" for victory), the percentage of point won on her serve, percentage of point won on return and surface.
-The second one contains the expect diffrences beetwen the serve-winning probabilities of the two players for a set, given the possible scores of the previous set.
Далее идут еще 2 кода, которые полученную информацию переводят в вероятности...
В общем понял одно...что самому ничего не получится спарсить-обработать, так как знаний в области программирования - 0.
Только искать ребят которые сделают за деньги...
Re: R-парсер
Добавлено: 25 янв 2020, 14:31
gamm
pain2430 писал(а): ↑25 янв 2020, 13:32
Только искать ребят которые сделают
если вы хотите парсить результаты теннисных матчей с этого сайта, то можно пробовать допилить и этот код, раз он работал. Если что-то другое, то лучше создать новый на Питоне. Тут на сайте есть раздел для заказов, но поскольку задача не имеет отношения к ГИС, то лучше искать помощников на профильных сайтах фрилансеров, том же fl.ru