R vs pandas?

Все остальное, мало относящееся к ГИС.
Ответить
trir
Гуру
Сообщения: 5292
Зарегистрирован: 09 апр 2010, 19:30
Репутация: 1015
Ваше звание: просто мимо прохожу
Откуда: Ё-бург

R vs pandas?

Сообщение trir » 29 ноя 2013, 03:50

Как Python превратился в инструмент специалиста по анализу данных
По тем же причинам я совершенно не скучал по возможностям манипуляции данными, встроенным в R, с тех пор как переключился на pandas. По правде говоря, я уже обнаружил в pandas такие трюки, о которых не знал, когда использовал R. Если учесть, что pandas заметно опережает R по производительности во многих распространённых операциях, поводов возвращаться к R или другим инструментам — хотя бы от случая к случаю — остаётся всё меньше
pandas

gamm
Гуру
Сообщения: 4056
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1054
Ваше звание: программист
Откуда: Казань

Re: R vs pandas?

Сообщение gamm » 29 ноя 2013, 07:07

Исторически сложилось так, что чаще всего специалисты по анализу данных программируют на малоизвестном языке R. Его применяют, когда сложность задачи превосходит возможности обыкновенных электронных таблиц вроде Excel, производительность некритична, а объёмы данных позволяют избежать параллелизации обработки при помощи Hadoop.

Многие аспекты R оставляют желать лучшего. Его не так-то легко освоить, программы, написанные на R, трудно отлаживать, он плохо документирован
прелесть. Товарищъ рассуждает о "малоизвестном" (среди школото) языке R (который S, но школото о таком даже не слышали). И для которых эталон - Ёксель. Особенно порадовала фраза
доступные разработчикам пакеты не отличаются разнообразием: львиная их доля так или иначе связана со статистикой, анализом данных и визуализацией
а чего он ожидал увидеть в системе, предназначенной для статистики, анализа данных и визуализации? Особенно порадовал пассаж насчет эффективности - видимо товарищъ пытался на нем писать программы в привычном для школото стиле. Не говоря уже о том, что разработчики пакеты разрабатывают, под свои нужды. При желании используя код на С/С++, FORTRAN, базы данных, и т.д.

Вообще-то, специалисты во всем мире традиционно использовали такие системы, как SAS, Stata, S-PLUS, о которых наши любители Ёкселя даже не подозревают, и из них S-PLUS (клоном которого является R) имеет наиболее гибкие средства. Не говоря уже о том, что R стал де-факто стандартом для обработки данных и подготовки публикаций в научном мире.

что же касается распространенности, то
A recent survey by Rexer Analytics found that the average data miner uses five different software tools and R, the open source statistical programming language, is used by 70 percent of them. - See more at: тыц
и это не "исторически сложилось", а как раз наоборот - тенденция последнего времени. Но наша публика, как всегда, идет своим путем - раз пользоваться не умеем, то и не годится :mrgreen:

Аватара пользователя
Максим Дубинин
MindingMyOwnBusiness
Сообщения: 9128
Зарегистрирован: 06 окт 2003, 20:20
Репутация: 747
Ваше звание: NextGIS
Откуда: Москва
Контактная информация:

Re: R vs pandas?

Сообщение Максим Дубинин » 29 ноя 2013, 09:28

да, как-то многовато FUD-а в статье в направлении R
"неочевидность" синтаксиса R примерно равна "неочевидности" синтаксиса Python, особенно для начинающих
пристегивайтесь, турбулентность прямо по курсу

gamm
Гуру
Сообщения: 4056
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1054
Ваше звание: программист
Откуда: Казань

Re: R vs pandas?

Сообщение gamm » 29 ноя 2013, 09:51

Максим Дубинин писал(а):да, как-то многовато FUD-а в статье в направлении R
"неочевидность" синтаксиса R примерно равна "неочевидности" синтаксиса Python, особенно для начинающих
и оба они меркнут на фоне незабвенных Avenue и AML от ESRI :mrgreen:

если говорить серьезно, то в настоящее время происходит конвергенция синтаксиса всех языков программирования, поскольку набор основных алгоритмических примитивов ограничен и устоялся. Все остальное - это наличие библиотек (пакетов), и инструментов. И здесь все зависит от предметной области. Что удобнее, то народ и использует, причем freeware системы имеют преимущества в виде сообщества, позволяющего им развиваться более энергично.

KolesovDmitry
Гуру
Сообщения: 810
Зарегистрирован: 22 авг 2007, 14:58
Репутация: 123
Откуда: Казань

Re: R vs pandas?

Сообщение KolesovDmitry » 29 ноя 2013, 10:44

Все, что ниже -- сугубо мое мнение, полученное на личном опыте использования этих языков. Вполне допускаю, что у других опыт может быть иной и, соответственно, мнение также будет отличаться. Тем не менее:

R и Python -- языки изначально из разных ниш. Python -- язык общего назначения, который никогда не позиционировался, как язык анализа данных. R -- напротив, язык, предназначеный для анализа.

В последние годы действительно у Python появляется масса пакетов, нацеленных на интеллектуальную обработку данных, но это далеко не единственная область, в которую он "забирается". Во всяком случае, так или иначе, но Python сейчас вполне комфортно можно использовать для анализа данных.

В то же время, несмотря на быстрое развите Python, как средства обработки данных, R значительно его опережает по числу пакетов, в R можно найти много "экзотического", для чего пакетов на Python еще не создано.

Поэтому мое мнение таково: если вас интересует исключительно аналитика (получили данные, провели разведочный анализ, начинаете более глубокое исследование проблемы), то на сегодняшний день нужно использовать R. Если же анализ данных всего лишь часть вашей задачи (т.е. цель работы -- не анализ, а построение конечной системы, в которой будет использован тот или иной, пусть даже очень сложный набор аналитических методов), то нужно использовать Python.

Вообще же, глядя на то, как "ломанулся" Python в сферу обработки данных, я вполне допускаю, что через несколько лет как аналитический инструмент он станет на равных с R.

gamm
Гуру
Сообщения: 4056
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1054
Ваше звание: программист
Откуда: Казань

Re: R vs pandas?

Сообщение gamm » 29 ноя 2013, 12:47

KolesovDmitry писал(а):Вообще же, глядя на то, как "ломанулся" Python в сферу обработки данных, я вполне допускаю, что через несколько лет как аналитический инструмент он станет на равных с R.
тоже ИМХО :D

не станет, ровно по той же причине, по которой не стал Matlab (и его freeware клон Octave) - научное сообщество уже выбрало R.

Элементарные вещи на Питоне можно будет делать (как и сейчас), "мурзилки" рисовать, но не более - для специалистов R гораздо более комфортная среда. Как и SAS, и прочие аналогичные статистические пакеты, которые обеспечивают среду. Но если школото победит специалистов, то да - тут любые варианты возможны, тут главную роль будет играть красота интерфейса и наличие бантиков.

nickleb
Гуру
Сообщения: 964
Зарегистрирован: 22 май 2010, 20:20
Репутация: 154

Re: R vs pandas?

Сообщение nickleb » 30 июн 2015, 08:20

Книжку У. Маккинни "Python for Data Analysis" c описанием Pandas'а перевели и издали. См. dmkpress.com/catalog/computer/programming/978-5-97060-315-4/

Andrey Zhukov
Гуру
Сообщения: 838
Зарегистрирован: 10 дек 2009, 23:24
Репутация: 169
Ваше звание: старик-гисовик
Откуда: Москва
Контактная информация:

Re: R vs pandas?

Сообщение Andrey Zhukov » 30 июн 2015, 11:18

Судя по профильным сообществам, Python местами забарывает R среди любителей и профессионалов (исключая научные круги). Возможно, все из-за того, что школоло подросло и теперь гордо именуется датамайнерами.

Аватара пользователя
SS_Rebelious
Гуру
Сообщения: 1304
Зарегистрирован: 24 фев 2009, 16:51
Репутация: 99
Ваше звание: GIS pro-fan
Откуда: Lahti / Газ-ПУТИНбург
Контактная информация:

Re: R vs pandas?

Сообщение SS_Rebelious » 30 июн 2015, 13:41

Думается, наличие нескольких альтернативных инструментов для анализа данных, есть очень хорошо. Ведь тогда, каждый сможет подобрать инструмент, соответствующий его навыкам и задачам. Да и вообще, зачем выбирать между R и Python, когда можно использовать оба языка сразу?
Look for something long enough, and you will find it. Look for something without understanding, and it will find you...
"All paid jobs absorb and degrade the mind." Aristotle
If you take 1 step towards freedom it'll take 2 steps towards you!

Ответить

Вернуться в «Все остальное»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 25 гостей