Медицинский статистик однажды сказал мне, что они используют SAS, потому что, если они делают ошибки из-за ошибок в программном обеспечении, а это касается судебных процессов, SAS возместит их. R приходит без гарантии.
Момо
42
Правда, @Momo R поставляется без гарантии, но я хотел бы увидеть ссылку на то, что у SAS есть сильная сторона. Я не смог найти текст лицензии SAS на их веб-сайте, но смог найти что-то для одного компонента: support.sas.com/documentation/onlinedoc/sasc/doc650/common/… Это дает 90-дневную гарантию на носитель, что Программное обеспечение поставляется вместе с отказом от любых заглавных букв любой другой гарантии. Пожалуйста, дайте ссылку, кроме "кто-то сказал мне".
Брайан Диггс
13
Был просто анекдот, мне нравится прагматический цинизм комментария. Но рад, что ты проверил, я никогда не заботился.
Момо
36
На SAS распространяется та же гарантия, что и на R: нет.
Фрэнк Харрелл
Ответы:
139
Я думаю, что есть несколько вопросов (в порядке возрастания возможной действительности):
Традиция / привычка : люди привыкли к SAS и не хотят узнавать что-то новое. (Это усложняет ситуацию , когда вы думаете по-разному в SAS и R.). Это может относиться ко всем, кому, возможно, придется отправлять вам код или читать / использовать ваш код, включая менеджеров и коллег.
Недоверие к бесплатному программному обеспечению : у меня было несколько человек, которые сказали, что они не хотят принимать результаты от R, потому что у вас нет коммерческой компании, которая проверяет код, чтобы убедиться, что он дает правильные результаты, прежде чем он выйдет клиентам, чтобы они в конечном итоге потерять бизнес.
Большие данные : R выполняет операции со всем в памяти, тогда как SAS не обязательно. Таким образом, если ваши данные приближаются к пределам вашей памяти, будут проблемы.
Лично я только думаю, что # 3 имеет какие-либо законные достоинства, хотя существуют подходы к большим данным, которые были разработаны с R. Проблемы с # 1 говорят сами за себя. Я думаю, что # 2 игнорирует несколько фактов: есть некоторая проверка, которая продолжается с R, многие из основных пакетов написаны одними из самых больших имен в статистике, и были исследования, которые сравнивают точность различных статистических программ, и R имеет конечно был конкурентоспособен.
Пункт 1 становится более легитимным, если вы также включите «существующую инфраструктуру» в этот баннер инерции. Если существуют существующие бизнес-процессы, в которых уже используется SAS, то существует переходная стоимость с изменением. Если это так, то это не выбор между SAS и R, а выбор между пребыванием в SAS и переходом на R, что может привести к другому выводу.
Брайан Диггс
25
Суть пункта 2 заключается в том, что, хотя некоторые пакеты R написаны экспертами, другие - нет. Кто за них ручается? Кто их проверяет? (Я знаю, что они проверены на то, что они работают, но кто проверяет, что они работают правильно?) Я знаю, вы можете посмотреть на код, но это предполагает время и способность просматривать чужой код и проверять его, часто для методов, которые очень сложны.
Питер Флом
18
@PeterFlom, вы поднимаете разумный вопрос. Поскольку пакеты становятся более эзотерическими, гарантии меньше, чем с базовыми вещами. Но как далеко вы должны зайти? Даже SEM, который является довольно продвинутым, был написан на R Джоном Фоксом. Кроме того, StasK хорошо оценивает реальность проверки статистического программного обеспечения на практике. Наконец, R гораздо более всеобъемлющий, чем что-либо еще, поэтому, когда вы хотите делать эзотерические вещи с другим программным обеспечением, вам в основном приходится кодировать его самостоятельно. Кто гарантирует точность этого кода?
gung
33
Кто именно проверяет SAS, Stata, SPSS, код? Можно ли вообще узнать, действительно ли результаты, которые они предоставляют, с помощью методов, которые они используют, действительно реализованы? Из lme4списка рассылки , например, я знаю, что сравнения с SAS появляются довольно регулярно. Но невозможно знать, должны ли мы даже делать такие сравнения. Не имея доступа к источнику, мы должны поверить тем компаниям, что результаты их программного обеспечения действительно действительны. Честно говоря, я предпочитаю иметь возможность просматривать программный код, который я использую.
Джейсон Морган
28
Правда, но сложно наказать статистическую вычислительную систему за ее полноту. Или, говоря иначе, способ R что-то сделать лучше, чем способ другой системы не делать этого.
Фрэнк Харрелл
105
Помимо хороших ответов, я бы добавил фактор смущения. Если в прошлом году вы потратили сотни тысяч долларов на поддержку SAS и SAS, и вы предлагаете ничего не тратить на R с крайне низкими ценами на поддержку (Revolution и т. Д.), Кто-то в цепочке спросит, почему. Было ли ошибкой тратить столько денег в прошлом году, когда R существовал в прошлом году? Или это ошибка - выбрасывать профессиональное программное обеспечение для чего-то, созданного группой добровольцев?
Как только проблема сформулирована таким образом, это предложение без потерь, так что, возможно, лучше не поднимать его.
Это, пожалуй, самый циничный ответ о перекрестной проверке. +1
вероятностная
11
@probabilityislogic: Спасибо! Чтобы было ясно, это скорее комментарий о плохом управлении высшего уровня, чем о людях, которые используют программное обеспечение. Я работал в местах, где действительно было отношение (на более высоких уровнях): «Хммм… вы не потратили все деньги, которые мы заложили для вас в этом году. Очевидно, вы можете обойтись меньшими деньгами, поэтому мы Вы сокращаете свой бюджет на следующий год и отдаете дополнительные расходы департаменту, который потратил слишком много средств ». Правила Дилберта.
Уэйн
11
«Вы не тратили деньги ...» - именно так работала советская система планирования, насколько я знаю из первых рук.
StasK
5
Кто-то в цепочке должен объяснить, что за небольшую часть стоимости лицензии SAS вы можете установить R Studio Server на виртуальную машину AWS с 16 ядрами и 256 ГБ ОЗУ - в руках 2 хороших программистов на R, это больше мощнее, чем SAS. Подумайте, как быстро миллиарды записей могут быть нечетко сопоставлены друг с другом! Или в этом отношении даже PostgreSQL с открытым исходным кодом с Python + PERL будет достигать за небольшую плату.
бродяга
1
«Или это ошибка - выбрасывать профессиональное программное обеспечение для чего-то, созданного группой добровольцев?» Это ложная дихотомия!
kjetil b halvorsen
54
Помимо того, что гунг правильно определил здесь, самая большая проблема в корпоративном мире - это наследие. И когда у вас есть качественный производственный код, который, как известно, выполняет эту работу, вы не меняете его. SAS существует с 1970-х годов, и в то время это был единственный эффективный, по тогдашним стандартам, язык сценариев для сценариев. Количество производственного кода, накопленного с тех пор в SAS в фармацевтике и правительстве, немыслимо, десятки тысяч человеческих лет. Переписывание этого в R или Stata займет несколько лет, в результате код станет более гибким, более эффективным, более прозрачным, простым и дешевым в обслуживании, но никто не будет платить за такой рефакторинг. (Мой опыт показывает, что мой код Stata обычно примерно в три раза короче; у меня когда-то был проект по преобразованию кода SPSS в Stata, где я сделал его примерно в 20 раз короче.
В некотором смысле, это аналогичная история с академическими издателями: они ведут поток конечных пользователей, поддерживая свои подписки по необходимости; Университет без подписки на Природу - это не университет. Бесплатная публикация через профессиональные сообщества сделает ее более дешевой, в наши дни люди готовят свои материалы в LaTeX, поэтому они готовы к работе с камерой, и те же люди будут предоставлять экспертную оценку, поэтому не будет никакого ухудшения качества ни по одному из измерений. Но ... нет никаких фирменных знаков и факторов влияния онлайн-журналов.
У SAS ужасающий синтаксис, который начался с чего-то похожего на JCL (язык управления заданиями IBM) для отправки пакетных заданий с перфокартами в тот же день. Замечательно, что люди все еще используют это, действительно.
Уэйн
6
+1 Мне особенно понравился BlackBerry: iOS: Android: Nokia as SAS: Stata: R: SPSS по аналогии в посте рассеяния.
Jthetzel
6
Уэйн, если вы когда-нибудь задумывались над утверждением CARDS, вы понимаете, что SAS - это статистический программный пакет для работы с перфокартами. Stata работает с прямоугольными наборами данных. R работает с объектами. Поэтому в зависимости от того, с каким форматом данных вам приходится иметь дело, один может быть лучше других.
StasK
3
Одним из важных моментов в наследстве являются такие вещи, как утверждение FDA или аналогичные правила. Индустрия, с которой я говорил, не будет касаться чего-либо (TM) после того, как они пройдут через это, чтобы быть уверенными, что им не придется снова проходить весь процесс. И это большой аргумент с точки зрения денег.
cbeleites
48
Последние семь лет я работал как программист SAS, а рядом со мной коллега программировал SAS дольше, чем был жив. Как отмечалось здесь, за SAS лежит огромное количество инерции / наследства; но SAS, как и R, - это путь к средству, а не само средство.
SAS чрезвычайно эффективен при последовательном доступе к данным, а доступ к базе данных через SQL чрезвычайно хорошо интегрирован. PROC очень хорошо документированы, но, к сожалению, не полностью стандартизированы с обозначениями (PROC OPTMODEL и IML являются двумя примерами). Это немного неуклюже, когда речь идет о написании сложного кода, и не так элегантно для параллельного кода. Я также обнаружил, что импорт CSV-файлов иногда вызывает большие страдания, и я предпочитаю сначала просто сбросить его в R, а затем в базу данных.
Хотя SAS имеет интерфейсы для общих объектов и DLL, вы не получите красивый доступ к любым заголовочным файлам или чему-то в этом роде, и распространение кода также не доступно через счастливые пакеты.
Однако мало кто беспокоится о том, чтобы включить в ваш код какой-то эзотерический, теперь уже не функционирующий или поврежденный пакет, который вам сейчас нужно поддерживать, и качество кода в SAS обычно одинаково превосходно (код ядра R также превосходен, а также свободно доступно каждому).
Как упоминалось ранее, SAS также чрезвычайно дорог, но это хороший инструмент, к которому я обращаюсь, когда знаю, что существует стандартная процедура, которая хорошо подходит для моих нужд.
R + SAS + mysql с небольшим количеством Perl, чтобы склеить их вместе, работает потрясающе :)
Замечание об обслуживании старых пакетов также подходит для написанного пользователем макроса или старого процесса, который sas не обновил.
вероятностная
4
R также имеет очень хорошую поддержку SQL, полученную недавно с помощью dplyrбиблиотеки - он буквально переводит синтаксис R / dplyr в SQL и вызывает базу данных, вы можете решить, какие операции выполнять на сервере БД, а какие локально, используя тот же синтаксис: cran.r-project. org / web / packages / dplyr / vignettes / database.html
Тим
41
Поэтому я использую и R, и SAS - по общему признанию в академических кругах - но есть несколько причин, по которым я иногда склоняюсь к SAS:
Лучшая документация. R становится лучше, но документация, особенно официальная документация, часто бывает ужасной и непрозрачной. Кроме того, SAS поддерживается обширной инфраструктурой книг - использование R! серия помогает этому в R, но это еще не совсем там. Я могу обратиться к анализу выживания Пола Эллисона с использованием SAS , или категориальному анализу данных с использованием SAS, или к моей книге о методах Монте-Карло с использованием SAS, и у меня есть книга, написанная в довольно непротиворечивом стиле для языка, который я использую.
Инерция. Это не просто «компании ленивы» - инерция тоже имеет значение. Есть институциональные знания. У такого-то есть код, который делает это - и делает это хорошо.
Пакеты. Некоторые пакеты в R удивительны. Некоторые пакеты не являются. Вы должны найти их, оценить их, и даже в этом случае возникают некоторые проблемы с верой в то, что пакет настолько хорош, насколько хорош тот, кто его пишет. В это трудно поверить. По сути, SAS обладает «полной верой и авторитетом Института SAS», который имеет довольно солидный опыт.
Поддержка из одного источника. Если SAS не работает, вы звоните SAS. Если R не работает, вы звоните ....?
"Если R сломан, вы звоните ....?" Брайан Рипли :-) (+1 за этот аргументированный ответ)
chl
6
Что касается 4), я думаю, что есть смешение понятий. Если вы используете программу, и она ломается, у вас обычно есть два варианта. Вы можете заплатить за поддержку или обратиться за бесплатной поддержкой (интернет-сообщество, литература, вы сами). R и SAS можно сравнивать как статистические языки программирования. Оба имеют свободно доступную поддержку, которую также можно сравнить. R и SAS нельзя сравнивать как платные решения для поддержки ...
jthetzel
7
... Институт SAS оказывает платную поддержку SAS. Такие компании, как Revolution Analytics и TIBCO (S +), предоставляют платную поддержку R. Если вы хотите сравнить платные решения для поддержки R и SAS, вам следует сравнить SAS Institute с Revolution Analytics и TIBCO, а не R. Я полагаю, что путаница возникает из-за тесная интеграция языка SAS с Институтом SAS и отсутствие интеграции языка R с корпоративной поддержкой и образованием, связанными с R.
Jthetzel
3
@jthetzel Я не думаю, что это «путаница». SAS язык тесно связан с SAS сервисом. Любая платформа, на которой работает SAS, имеет поддержку SAS. Это не относится к R-поддержке и языку, который не связан, возможно, вам не поможет в зависимости от платформы (попробуйте поговорить с Revolution иногда, не используя Windows или RHEL ...), и они не обязательно будут нести ответственность за Ошибки RandomPackage, где SAS будет поддерживать PROC Arbitrary.
Fomite
2
@probabilityislogic Я думаю, что это не нужно оценивать, чтобы увидеть, подходит ли оно для вашего анализа. Да, оба могут ошибаться, и оба должны быть оценены. Но я доверяю команде контроля качества SAS больше, чем доверяю мне самому.
Fomite
39
Никто не предположил, что причина, по которой он предпочитает, - это простой идиотизм. Вот две цитаты, с которыми я недавно сталкивался:
«Использование программного обеспечения с открытым исходным кодом, такого как R, не могло быть и речи - мы не могли гарантировать идеально воспроизводимый результат»
а также
«Мы не сможем оказать какую-либо поддержку для этого, поскольку это программное обеспечение с открытым исходным кодом»
Две минуты с этими людьми покажут им, насколько они не правы.
Две минуты с какими людьми? Без ссылок это почти как если бы вы только что сделали эти цитаты.
Дэвид Хеффернан
4
вторая цитата выглядит хорошо из ИТ-отдела совета, от них нельзя ожидать поддержки всего возможного программного обеспечения с открытым исходным кодом, которое клиент может использовать, отсюда и общее предупреждение. Я думаю , что худший анти открытым исходным кодом цитаты я слышал от SAS говоря soemthing , как «вы доверяете аэробуса разработан с открытым исходным кодом, двигатель может упасть»
@PaulHurleyuk: Точно так же нельзя ожидать, что совет поддержит любое проприетарное программное обеспечение, которое клиент может захотеть использовать. Открытость не причина. Если они сказали, что не могут поддерживать что-либо, кроме поддерживаемого ими набора программного обеспечения, тогда все в порядке.
Spacedman
5
В двух случаях, которые я цитирую, вполне может быть рациональное решение, но приведенные причины явно не являются этими. Разумной причиной может быть «мы уже поддерживаем SAS, и мы не можем позволить себе поддерживать два пакета статистики». Но «Мы не можем поддержать это, потому что это открытый исходный код» - это не секвитур. Две части могут быть правдой, но заключение не следует. Это как сказать: «Елизавета - королева, потому что небо голубое».
Spacedman
23
Кажется, что одна проблема не была решена явно: прикрытие задницы. Если вы переходите на SAS и все рушится, лицо, принимающее решения, всегда может сказать, что он купил самое современное программное обеспечение, и откуда ему было знать, что оно сломается? Если он решил пойти с R, этот аргумент будет сложнее привести. Да, это связано с аргументом инерции, уже упомянутым здесь.
Несколько десятилетий назад они говорили, что «никто не был уволен за покупку IBM» , что называют величайшей маркетинговой фразой за всю историю.
Хотя я не уверен, что R немного менее современен, чем SAS (и что касается многих процедур, у меня сложилось впечатление, что R более современен, чем SAS). Я предполагаю, что многие пользователи SAS не знают об этом, хотя ...
Патрик Куломб
21
Как пользователь SAS и R, я бы сказал, что главная причина, по которой мы используем SAS поверх R (когда мы это делаем), - это его способность к последовательной обработке. Для обработки данных за 15 лет нам нужны только машины с ОЗУ не более 4 ГБ. Мне понадобится машина гораздо большего размера, использующая Stock R, и я не пытался перенести код SAS для работы с Revolution R.
+1, хотя стоит отметить, что в R существует несколько способов работы с наборами данных, превышающими объем памяти ( bigmemory , ff , фрагментация данных из базы данных, широкий спектр вариантов распределенных вычислений). Но все это требует настройки; SAS действительно будет просто проходить через все, что вы в него бросаете, что является реальным преимуществом.
Мэтт Паркер
21
Времена они меняются
По состоянию на 2015 год актуарии в возрасте до 35 лет предпочитают использовать R - в учебниках используется код R и SAS. Старые актуарии никогда не учились использовать R и предпочитают SAS и не используют R. Доля актуариев, фактически кодирующих в SAS, уменьшится.
Если вы будете искать в Google стипендию документы, относящиеся к SAS, то вы найдете стабильные 550 публикаций в год в течение последних нескольких лет. Если вы ищете документы с использованием R («R Фонд для статистических вычислений»), в 2014 году их было 25 100, а по состоянию на середину июля 2015 года - 16 700. Построение курса - это очень быстро растет!
SAS не помогала себе в течение нескольких лет, требуя больших лицензионных отчислений от университетов - которые они с тех пор отменили - но сейчас слишком поздно, многие университеты перешли на преподавание с использованием R, а не SAS.
Новые статистические методы публикуются в статьях вместе с пакетом R. Некоторые методы, которые были в базе R в течение многих лет, до сих пор не появились в SAS. Теперь вы можете использовать R внутри SAS.
В фармацевтической промышленности SAS используется, потому что это то, что FDA использует и любит. Есть несколько серьезных причин, хотя. Результаты прослеживаются, и у выхода есть метка времени. Статистика FDA может проверить, что вы получаете. Это очень хорошо для управления базами данных, и это надежное программное обеспечение. Конечно, можно утверждать, что многие из атрибутов SAS присутствуют в других программных пакетах, включая R и SAS. Тем не менее, я думаю, что любому, кто хочет стать прикладным статистиком, работающим в промышленности, лучше всего хотя бы научиться программировать в SAS. Используйте R или STATA, если вы предпочитаете, но знаете SAS. Когда вы работаете в компании, которая хочет, чтобы вы использовали SAS, они будут платить за лицензирование.
Я согласен с тем, что существует тенденция использовать больше R в клинических исследованиях и что многие считают, что R можно сделать столь же прослеживаемым, как и SAS.
Майкл Черник
6
FDA открыто заявляет, что НЕ одобряет или требует использования какого-либо одного программного обеспечения. Исторически верно, что большинство представленных документов использовали SAS, поэтому FDA обладает обширными знаниями по SAS, но они очень быстро освоили другие системы, используя R для довольно большого количества недавней работы, особенно в области метаанализа.
PaulHurleyuk
1
@PaulHurleyuk То, что FDA скажет публично и как они действуют на практике, не обязательно совпадает. Большинство фармацевтических компаний в основном занимаются клиническими испытаниями фазы II и III, и они, как правило, ожидают, что им придется и будет продолжать использовать SAS для анализа этих испытаний.
У нас есть клиенты, которые производят двигатели для самолетов. Я счастлив, что они не используют бесплатное программное обеспечение, когда я сажусь на самолет.
К сожалению, я думаю, что это заблуждение (свободное == низшее) распространено среди широкой публики.
(немного не по теме): если взглянуть на это с другой стороны: некоторые преимущества R в научных кругах не применимы к промышленности.
Например, в академических кругах это явное преимущество, если вы можете сказать студентам пойти и получить программное обеспечение и работать дома. В промышленности обычно не нужно брать с собой какие-либо данные ...
Также вы не должны пробовать несколько вещей (TM), загружать тонны пакетов (даже если они проверены и проверены), использовать передовые методы. Вместо этого обычно ожидается, что вы будете придерживаться методов и кода, которые использовались годами и где поведение известно уже давно. Вы не выиграете много академических заслуг с этим.
И, конечно, как уже упоминалось: никто не рискует переделывать все виды одобрения регулирующих органов ради перехода на R. Из того, что я видел, меньше о R и больше об огромных затратах + работа для получения одобрения регулирующих органов. ,
Нет ничего, что нужно сделать, чтобы повторить одобрение регулирующих органов ради перехода на R.
Фрэнк Харрелл
2
@Frank: возможно, мы думаем в разных сценариях: я думаю, что вы, возможно, думаете о новом испытании (и там вы правы) - я больше думаю с точки зрения анализа процессов (химический + статистический анализ) текущих производство. AFAIK, вы не можете просто переключить там свой анализ данных (но это не страна SAS). Но я могу ошибаться.
cbeleites
2
Я не знаком с этим миром, но подозреваю, что у ученых больше свободы, чем они думают.
Фрэнк Харрелл
13
Хотя это довольно пессимистично, мой ответ будет таким: люди, которые принимают масштабные решения в таких корпорациях, как «мы просто используем SAS», также относятся к тем людям, которые не доверяют тому, чего не понимают, и автоматически считают ценность чего-то прямо пропорционально сумме денег, которые вы тратите на это. Это заставляет их предпочитать платить за SAS, а не тратить время на изучение альтернатив.
Зачем крупной фармацевтической компании даже хотеть перейти на R с SAS? SAS стоит миллионы, но это ничего не значит для фармацевтической компании. Однако перевод всех стабильных систем отчетности с SAS на R обойдется в 50-100 раз дороже.
У SAS есть феноменальная система поддержки: каждый раз, когда мне требовалась помощь, они могли оказать ее в течение нескольких часов.
И что именно в R есть у SAS: 1) лучшая графика ... хорошо, она большая, но графика - это еще не все. Помимо R всегда можно использовать дополнительный инструмент для создания крутых графиков, а SAS не так уж и плох, когда дело доходит до графики 2) современный и более эффективный язык программирования. Многие пользователи SAS не являются программистами и не заботятся об использовании классного языка. Они просто хотят иметь возможность анализировать данные.
Я люблю R, но для большой компании было бы безумно переходить на SAS. Это может иметь смысл для небольших фирм, хотя
Согласна с тобой, @Max. Наконец, ответ приходит от кого-то в отрасли. Это дорого, чтобы переключиться на R.
Дан
3
Это неверно. Стоимость поддержки программирования для SAS намного выше, чем для R. Компании нанимают запасы программистов SAS, чтобы восполнить архаичный язык, используемый SAS.
Фрэнк Харрелл
Я в промышленности и использую оба. R может выполнять манипуляции с данными и, что более важно, анализировать с гораздо меньшим количеством строк, и, следовательно, может быть разработан гораздо быстрее. Я скажу, что некоторые фармацевтические компании тщательно разработали системы SAS для нормативного программирования, которые были успешными. Суть в том, что нужно менять (на данный момент)? Если они делали это с нуля, возможно, вместо этого.
AdamO
11
Есть несколько основных преимуществ, без определенного порядка
SAS имеет большую установленную базу и большой послужной список
Я намеренно избегаю использования уничижительных терминов, таких как «наследие» или «привычка». Многие компании используют SAS в течение 30 или 40 лет, и у них есть миллионы строк рабочего кода. Кроме того, есть все преимущества стабильной кодовой базы с миллионами пользовательских дней в области, где небольшие ошибки могут быть критическими. Это та же самая причина, по которой Unix-версии по-прежнему популярны, даже несмотря на то, что Unix более 40 лет и в некотором смысле устарели. Наконец, существует большое сообщество опытных специалистов SAS, которые привыкли решать бизнес-задачи.
SAS хорошо подходит для гетерогенных, сложных данных и операционных сред
Компании располагают множеством различных источников данных, основанных на разных типах систем, а также во многих случаях в нескольких операционных средах. R совсем недавно получил некоторые чрезвычайно базовые возможности для работы с чем-то большим, чем может храниться в памяти. Сравните это со способностью SAS поддерживать встроенную оптимизированную обработку в базе данных для terradata, приведя лишь один пример. В большинстве реальных ситуаций самая сложная часть аналитики связана с данными и операционной средой. (Вам нужно запустить код оценки модели, разработанный для Windows, на мэйнфрейме? С SAS нет проблем. С R вам не повезло.) R не решает ни одну из этих проблем.
Пользователь не должен беспокоиться о том, чтобы быть "самостоятельно"
Пользователь SAS может быть достаточно уверен, что каждый модуль кода был протестирован квалифицированными специалистами. Нет необходимости уделять время и усилия изучению происхождения кода или независимой его проверке. Кроме того, если возникают какие-либо проблемы, надежная помощь (от чего-то простого, как документация, до чего-то столь же всеобъемлющего, как подробное изучение неожиданных результатов или поведения сложного метода), пользователь может взять трубку и получить помощь.
Это "достаточно хорошо"
Язык отключает некоторых людей, потому что он отличается от современных языков для общего программирования. Сказав это, язык высокого уровня, мощный, выразительный и всеобъемлющий. Короче говоря, как только вы изучите это, оно выполнит свою работу. Для компаний элегантность решения не является чем-то особенным.
Может быть, элегантность - но стоимость? Я думаю, что компании заботятся об этом!
вероятностная
2
R может работать на любом устройстве, от мобильного телефона до суперкомпьютера, с нулевой стоимостью, а также с мэйнфреймом, также с нулевой стоимостью.
Шон
9
Служба поддержки.
Однажды я поболтал с другом, работающим в компании, специализирующейся на установке серверов, и затем он объяснил мне, почему крупные компании всегда выбирают продукты Microsoft, а не идут с открытым исходным кодом. Преимущество Microsoft над конкурентами с открытым исходным кодом - поддержка клиентов. Если что-то пойдет не так с продуктом, компания может позвонить в Microsoft, крупные компании даже имеют персональную поддержку для них. Не так с программным обеспечением с открытым исходным кодом.
Я думаю, что это та же самая причина, по которой SAS получает приоритет над R.
Я думаю, что эти комментарии не верны. В мире серверов с открытым исходным кодом веб-сервер Apache является самым популярным веб-сервером.
Фрэнк Харрелл
Я никогда не говорил, что он говорил о серверах. Скорее о таких продуктах, как Microsoft Office. Я только упомянул, что он работает в мире серверов.
Раскольников
2
Напоминает мне о компаниях, которые используют sharepoint и вики с открытым исходным кодом. Почти всегда sharepoint бесплоден и обновляется только вики.
TLJ
9
А как насчет Фронтендс? Что является эквивалентом R для SAS Enterprise Guide, Web Report Studio или Enterprise Miner? Редактировать: Эти инструменты позволяют непрограммирующему пользователю использовать СКЛАД ДАННЫХ без знания базовой технологии. Они не являются в первую очередь инструментами для использования SAS как таковой. R GUI - это просто IDE для языка / системы R, AFAIK. Они не могут предоставить помощь нетехническому пользователю, который хочет получить информацию и понимание от DWH.
Это ответ. Что делает SAS таким ценным для клиентов (как и мы), так это простота использования для людей, которым не нужно писать ни единой строки кода.
Курт
2
@ Курт, gung не хотел иметь в виду, что это не ответ, а скорее то, что ваш ответ не подходит для этого сайта (и особенно для настоящего вопроса, на самом деле)
Ну, я работал с RStudio. По сравнению с SAS Enterprise Guide у него еще очень долгий путь, пока он не достигнет простоты использования для начинающего пользователя. Добавьте тот факт, что R отсутствует эквивалент сервера метаданных. И мне совершенно не хватает готового эквивалента для WRS (возможно, я слепой :)). Красота языка и производительность, которую вы можете достичь, практически ничего не значат для компаний, где 90% «клиентов» хранилища данных не могли написать «Hello World» в любой среде программирования. Это то, на что я хотел обратить внимание, и здесь предстоит проделать большую работу.
Курт
2
Спасибо за обновление вашего ответа, @Kurt. Я думаю, что это будет более полезным для будущих читателей сейчас. Это правда, что для SAS существуют предложения типа «укажи и щелкни» и «хранилище данных», которые являются более всеобъемлющими и готовыми к работе, чем R. Это разумный вопрос. +1
банде
8
Однажды я работал в консалтинговой компании, которая оказывала помощь SAS крупному производителю микросхем в Силиконовой долине. Наш контактный сотрудник в компании сказал нам, что он получил предложение от другой компании предоставить им ту же самую консультацию, используя другое программное обеспечение, которое охватывает все области, охватываемые SAS, и которое будет стоить компании доли того, что SAS взимает с них. ( 30 000 долларов США против 1 000 000 долларов США). Контактное лицо обдумало, что делать, и отказалось информировать своего босса о предложении, потому что он боялся, что его уволят за использование SAS, а не за более дешевые альтернативы. Вместо этого он настоял на том, чтобы наша консалтинговая компания дала их компании большой перерыв в наших консультационных расходах. Наша компания согласилась.
Таким образом, ваше контактное лицо не может утверждать, что R все еще сравнительно недавно сравнивается с SAS, и он хотел подождать, чтобы убедиться, что R был установлен, прежде чем его использовать?
вероятностная
6
Я не думаю, что безопасность приложений была упомянута. Этот вопрос был поднят в Stack Overflow, но пропущен, поскольку это было не по теме.
Я сотрудничаю с Шведским национальным советом здравоохранения и социального обеспечения, который использует SAS. Когда я говорил с их статистиками (например, с R), они утверждали, что их ИТ-специалисты предпочитают SAS, поскольку они не доверяют пакетам, загруженным в R. Моя жена также работает в SAS, и ее организация часто заявляет о той же проблеме ...
Я хотел бы видеть некоторые комментарии по этому вопросу. Я сделал быстрый поиск, но не нашел хороших ссылок ...
Какова альтернатива загрузке пакета, который предоставляет новые возможности (как и большинство пакетов R)? Это для дома, чтобы расти эти возможности? Это надежнее?
Фрэнк Харрелл
2
@FrankHarrell Я согласен, но я думаю, что это может быть легкой областью для разработчиков R, чтобы нацелиться и улучшить. Простым решением могут быть разные уровни безопасности для пакетов - если пакет имеет системный вызов или самостоятельно подключается к Интернету, пакет должен иметь более высокий клиренс. Это может позволить установки только с низким уровнем очистки в тех учреждениях / компаниях, где утечка данных является серьезной проблемой. Я, как пользователь, мог бы тогда также сделать дополнительную проверку, когда я решу установить пакет с высоким разрешением. (Кстати, когда запланирована ваша книга (RMS ver 2)?)
Макс Гордон
Я надеюсь, что второе издание RMS будет доступно чуть более года.
Фрэнк Харрелл
5
Самая убедительная причина, по которой я понял, заключается в том, что в SAS имеется обширная библиотека модулей, ориентированных на конкретный бизнес, которые все люди используют в этих вертикалях, так что это в некотором роде замкнуто.
Но также и то, что SAS удовлетворяет потребности этих вертикальных сегментов в бизнесе и оптимизирует их потребности - оптимизировано в смысле «пользователю не нужно делать много дополнительной работы, чтобы получить результаты». Я не пользователь SAS, так что это не предвзятая защита бизнес-стратегии SAS.
Будучи крупным коммерческим продуктом SAS, платные продавцы прилагают активные и скоординированные усилия для его продвижения. Я не думаю, что усилия по продвижению использования R могут соответствовать этим.
Да, люди должны в какой-то степени открыть для себя R на своем. Но большая часть проблемы сводится к инерции изучения нового языка. Всегда появляются новые языки, которые имеют преимущества перед старыми языками, но пользователи цепляются за старые языки (свидетель Cobol). Программирование в SAS чрезвычайно неэффективно, и, возможно, требуется вдвое больше программистов, чтобы выполнять ту же работу, что и R, но эксперты SAS рады поучаствовать в их веселом пути, и компании боятся такого рода сбоев, которые могут сэкономить им миллионы долларов. в зарплатах.
Фрэнк Харрелл
3
Я смотрю на Open Source или лицензионное программное обеспечение, как это, будь то SAS или что-то еще. Мой ИТ-отдел готов предоставить услуги нашему бизнесу. Компания не зарабатывает деньги на ИТ, только на бизнес-поддержке ИТ. Бизнес имеет годовой доход в 16 миллиардов долларов . Она стоит около $ 200 млн в год. Если бы проблема была в деньгах, я бы сократил расходы, но если бы я сэкономил 10% ( $ 20 миллионов) из моего бюджета, бизнес будет уведомление? Они просто уменьшат мой бюджет в следующем году? Если ИТ терпит неудачу, бизнес теряет доход, насколько это будет зависеть от характера отказа. Части бизнеса больше не могут приносить доход. В случае сбоя такого продукта, как SAS, я могу подать в суд по контракту. Если продукт OSS дает сбой, я не могу. Я не верну свои $16 миллиардов, но я могу получить некоторые обратно, и реально с SAS вы вряд ли потеряете много. Разница в цене и стоимости должна оправдывать любой дополнительный предполагаемый риск для бизнеса. Иногда дешевле придерживаться SAS, чем переподготовку. Иногда возникают более приоритетные вопросы, поэтому компании остаются с SAS. Некоторые компании не нуждаются в полной функциональности, и в этом случае альтернативы являются жизнеспособными. Некоторые не нуждаются в поддержке, и снова альтернативы жизнеспособны. Если вы соответствуете бизнес-требованиям, то любой из вариантов действителен, если вы хотите обеспечить поддержку для бизнеса, вам нужно посмотреть на общую стоимость владения за 5-10 лет, возможность набирать специалистов по инструментам, стабильность в продукте. так что вам не нужно переписывать все с каждым новым выпуском, учебные курсы доступны для повышения квалификации,
Я не слежу за твоими рассуждениями. Потраченная впустую сумма, затрачиваемая программистами на программирование на архаичном языке (SAS) по сравнению с современными бесплатными языками, ошеломляет.
Фрэнк Харрелл
4
@ Франк - я должен не согласиться с твоей характеристикой. Компетентный программист SAS может быть очень продуктивным в SAS, и компетентные программисты SAS широко доступны. Я даю вам понять, что R структурирован больше как современный язык, и поэтому может быть легче выучить программиста, который знает, скажем, Java. По моему опыту во многих компаниях продуктивность разработчиков с использованием SAS редко является существенной проблемой.
JBK
9
Используя SAS в течение 23 лет и S-Plus / R в течение 22 лет, я могу сказать, что опытный программист SAS может быть очень продуктивным, но опытный программист R может быть легко в три раза продуктивнее.
Фрэнк Харрелл
2
«Я могу подать в суд по контракту», ха-ха - неправильный код, написанный сотрудниками, гораздо чаще вызывает проблемы, чем то, что делает SAS или R «самостоятельно»
вероятностный
1
Некоторые причины, которые я не видел, упоминаются:
Лучшая документация. Документация SAS является многословной, документация R краткой. Многие компании могут предпочесть подробную документацию.
Лучше сообщения об ошибках. Сообщения об ошибках R часто кажутся разработанными, чтобы доказать, что человек, пишущий сообщение, умнее, чем человек, читающий его.
Техническая поддержка. SAS обладает одними из лучших техподдержек, с которыми я когда-либо сталкивался, предоставляемых SAS. Вы можете получить помощь по R, но эта помощь разбросана по разным местам и не всегда доступна. Люди на различных сайтах, которые предоставляют помощь с R, являются добровольцами, и добровольцы не обязаны помогать. Людям службы технической поддержки SAS платят за то, что они делают, и делают это хорошо. Они не только делают это хорошо, они делают это вежливо что часто присутствует не во всех сообществах R (мое любимое? «Я получил помощь, набрав« help », почему бы вам не попробовать ввести« help »?»)
Я уверен, что есть компании, которые продают техническую поддержку R. Но как хорошо, что у меня нет опыта!
kjetil b halvorsen
1
Я думаю, что угол наследства может быть большим по следующей причине. Организация нанимает человека, назовите его человеком X. Это компьютерный гуру / волшебник / и т.д. Они создают потрясающие SAS-программы / инструменты / и т. Д. Они настолько хороши, что другие люди в организации не чувствуют, что им нужно понимать, как работают программы. Они позволяют легко нажимать кнопку, и все просто работает (волшебные черные ящики).
Человек Х покидает организацию. К сожалению, знания, которыми обладает человек X, покидают организацию (управление документацией и знаниями не было приоритетом, вместо этого были рабочие программы). Их заменяет человек Y. Человек Y отлично работает с R, но не имеет представления о SAS и, следовательно, не имеет представления о том, как на самом деле работают программы SAS. Существует огромная кривая обучения, чтобы даже выяснить, чтоСTСTзначительно выше, чем годовая лицензия на SAS. Я ожидаю, что SAS проведет некоторый анализ этого компромисса, и позволит этому влиять на то, как он устанавливает плату за лицензию (ну, если бы я работал в SAS). Также обратите внимание на то, что процедуры построения SAS намного лучше, чем десять лет назад (например, proc sgplot против proc plot). совпадение, что R сделал хороший заговор первым? Думаю, нет! Это эффективно снижает эффективность от переключения, потому что прорисовка больше не так уж отличается - R все еще лучше, но недостаточно для переключения ...
Что касается статистики промышленности, то есть специалисты по обеспечению качества, которые (как правило) не имеют опыта программирования, статистики или науки и проводят аудит статистиков, программистов и ученых. Они хотят знать: «Откуда ты знаешь, что то, что ты делаешь, правильно?» и «Если это неправильно, как мы можем обвинять кого-то и как они будут платить за это?».
Лицензия GNU / GPL Copyleft поставляется с постоянным текстом, который гласит: «R - бесплатное программное обеспечение и СЛУЧАЙНО АБСОЛЮТНО НЕ ГАРАНТИРУЕТСЯ» в тексте с полностью прописными буквами точно так же, как я написал. Это зачет. Когда качественный человек читает этот текст, он в основном дискредитирует R. Я имею в виду, если продукт хороший, стоит добавить гарантию правильно? Такие коммерческие продукты заставили нас поверить. Фактически, именно FDA заявило, что примет регулирующие представления в R, которые отражают прогресс в индустрии программного обеспечения. (Обратите внимание, что это утверждение следует после первоначальной даты публикации вопроса.)
Для тех, кто ничего не знает о компьютерах, воображаемые сценарии безопасности, невоспроизводимости и серьезных научных ошибок не ограничены в результате этого АБСОЛЮТНО НЕДОСТАТКА ГАРАНТИИ. Мы все согласны с тем, что ошибки могут иметь катастрофические последствия. Что касается вашей лицензии SAS, у SAS есть эксперты, которые могут объяснить свое программное обеспечение аудиторам, и в случае невозможного сценария, когда SAS фактически вызывает такую проблему, они могут нести ответственность за штрафы и наказания (у них также есть достаточно денег для адвокатов, чтобы гарантировать, что они будут быть полностью оправданным в таком случае). Бремя и стоимость того, чтобы аналитик / программист представил этот случай для R, в основном составляют лицензию SAS. Не то чтобы программирование в SAS полностью освобождает вас от тяжелого бремени соответствия требованиям качества!
Так в принципе, я бы сказал, litigiousness играет важную роль в требуя дорогостоящего лицензионного программного обеспечения.
Ответы:
Я думаю, что есть несколько вопросов (в порядке возрастания возможной действительности):
Лично я только думаю, что # 3 имеет какие-либо законные достоинства, хотя существуют подходы к большим данным, которые были разработаны с R. Проблемы с # 1 говорят сами за себя. Я думаю, что # 2 игнорирует несколько фактов: есть некоторая проверка, которая продолжается с R, многие из основных пакетов написаны одними из самых больших имен в статистике, и были исследования, которые сравнивают точность различных статистических программ, и R имеет конечно был конкурентоспособен.
источник
lme4
списка рассылки , например, я знаю, что сравнения с SAS появляются довольно регулярно. Но невозможно знать, должны ли мы даже делать такие сравнения. Не имея доступа к источнику, мы должны поверить тем компаниям, что результаты их программного обеспечения действительно действительны. Честно говоря, я предпочитаю иметь возможность просматривать программный код, который я использую.Помимо хороших ответов, я бы добавил фактор смущения. Если в прошлом году вы потратили сотни тысяч долларов на поддержку SAS и SAS, и вы предлагаете ничего не тратить на R с крайне низкими ценами на поддержку (Revolution и т. Д.), Кто-то в цепочке спросит, почему. Было ли ошибкой тратить столько денег в прошлом году, когда R существовал в прошлом году? Или это ошибка - выбрасывать профессиональное программное обеспечение для чего-то, созданного группой добровольцев?
Как только проблема сформулирована таким образом, это предложение без потерь, так что, возможно, лучше не поднимать его.
источник
Помимо того, что гунг правильно определил здесь, самая большая проблема в корпоративном мире - это наследие. И когда у вас есть качественный производственный код, который, как известно, выполняет эту работу, вы не меняете его. SAS существует с 1970-х годов, и в то время это был единственный эффективный, по тогдашним стандартам, язык сценариев для сценариев. Количество производственного кода, накопленного с тех пор в SAS в фармацевтике и правительстве, немыслимо, десятки тысяч человеческих лет. Переписывание этого в R или Stata займет несколько лет, в результате код станет более гибким, более эффективным, более прозрачным, простым и дешевым в обслуживании, но никто не будет платить за такой рефакторинг. (Мой опыт показывает, что мой код Stata обычно примерно в три раза короче; у меня когда-то был проект по преобразованию кода SPSS в Stata, где я сделал его примерно в 20 раз короче.
В некотором смысле, это аналогичная история с академическими издателями: они ведут поток конечных пользователей, поддерживая свои подписки по необходимости; Университет без подписки на Природу - это не университет. Бесплатная публикация через профессиональные сообщества сделает ее более дешевой, в наши дни люди готовят свои материалы в LaTeX, поэтому они готовы к работе с камерой, и те же люди будут предоставлять экспертную оценку, поэтому не будет никакого ухудшения качества ни по одному из измерений. Но ... нет никаких фирменных знаков и факторов влияния онлайн-журналов.
Это подводит итог всего этого: http://scatter.wordpress.com/2011/06/28/stata-12/ . Stata предпочитают в кругах экономики и политики, и чем больше я изучаю SAS, тем больше мне нравится Stata.
источник
Последние семь лет я работал как программист SAS, а рядом со мной коллега программировал SAS дольше, чем был жив. Как отмечалось здесь, за SAS лежит огромное количество инерции / наследства; но SAS, как и R, - это путь к средству, а не само средство.
SAS чрезвычайно эффективен при последовательном доступе к данным, а доступ к базе данных через SQL чрезвычайно хорошо интегрирован. PROC очень хорошо документированы, но, к сожалению, не полностью стандартизированы с обозначениями (PROC OPTMODEL и IML являются двумя примерами). Это немного неуклюже, когда речь идет о написании сложного кода, и не так элегантно для параллельного кода. Я также обнаружил, что импорт CSV-файлов иногда вызывает большие страдания, и я предпочитаю сначала просто сбросить его в R, а затем в базу данных.
Хотя SAS имеет интерфейсы для общих объектов и DLL, вы не получите красивый доступ к любым заголовочным файлам или чему-то в этом роде, и распространение кода также не доступно через счастливые пакеты.
Однако мало кто беспокоится о том, чтобы включить в ваш код какой-то эзотерический, теперь уже не функционирующий или поврежденный пакет, который вам сейчас нужно поддерживать, и качество кода в SAS обычно одинаково превосходно (код ядра R также превосходен, а также свободно доступно каждому).
Как упоминалось ранее, SAS также чрезвычайно дорог, но это хороший инструмент, к которому я обращаюсь, когда знаю, что существует стандартная процедура, которая хорошо подходит для моих нужд.
R + SAS + mysql с небольшим количеством Perl, чтобы склеить их вместе, работает потрясающе :)
источник
dplyr
библиотеки - он буквально переводит синтаксис R / dplyr в SQL и вызывает базу данных, вы можете решить, какие операции выполнять на сервере БД, а какие локально, используя тот же синтаксис: cran.r-project. org / web / packages / dplyr / vignettes / database.htmlПоэтому я использую и R, и SAS - по общему признанию в академических кругах - но есть несколько причин, по которым я иногда склоняюсь к SAS:
источник
Никто не предположил, что причина, по которой он предпочитает, - это простой идиотизм. Вот две цитаты, с которыми я недавно сталкивался:
а также
Две минуты с этими людьми покажут им, насколько они не правы.
источник
Кажется, что одна проблема не была решена явно: прикрытие задницы. Если вы переходите на SAS и все рушится, лицо, принимающее решения, всегда может сказать, что он купил самое современное программное обеспечение, и откуда ему было знать, что оно сломается? Если он решил пойти с R, этот аргумент будет сложнее привести. Да, это связано с аргументом инерции, уже упомянутым здесь.
Несколько десятилетий назад они говорили, что «никто не был уволен за покупку IBM» , что называют величайшей маркетинговой фразой за всю историю.
источник
Как пользователь SAS и R, я бы сказал, что главная причина, по которой мы используем SAS поверх R (когда мы это делаем), - это его способность к последовательной обработке. Для обработки данных за 15 лет нам нужны только машины с ОЗУ не более 4 ГБ. Мне понадобится машина гораздо большего размера, использующая Stock R, и я не пытался перенести код SAS для работы с Revolution R.
источник
Времена они меняются
По состоянию на 2015 год актуарии в возрасте до 35 лет предпочитают использовать R - в учебниках используется код R и SAS. Старые актуарии никогда не учились использовать R и предпочитают SAS и не используют R. Доля актуариев, фактически кодирующих в SAS, уменьшится.
Если вы будете искать в Google стипендию документы, относящиеся к SAS, то вы найдете стабильные 550 публикаций в год в течение последних нескольких лет. Если вы ищете документы с использованием R («R Фонд для статистических вычислений»), в 2014 году их было 25 100, а по состоянию на середину июля 2015 года - 16 700. Построение курса - это очень быстро растет!
SAS не помогала себе в течение нескольких лет, требуя больших лицензионных отчислений от университетов - которые они с тех пор отменили - но сейчас слишком поздно, многие университеты перешли на преподавание с использованием R, а не SAS.
Новые статистические методы публикуются в статьях вместе с пакетом R. Некоторые методы, которые были в базе R в течение многих лет, до сих пор не появились в SAS. Теперь вы можете использовать R внутри SAS.
Таким образом, все меняется и быстро меняется.
источник
В фармацевтической промышленности SAS используется, потому что это то, что FDA использует и любит. Есть несколько серьезных причин, хотя. Результаты прослеживаются, и у выхода есть метка времени. Статистика FDA может проверить, что вы получаете. Это очень хорошо для управления базами данных, и это надежное программное обеспечение. Конечно, можно утверждать, что многие из атрибутов SAS присутствуют в других программных пакетах, включая R и SAS. Тем не менее, я думаю, что любому, кто хочет стать прикладным статистиком, работающим в промышленности, лучше всего хотя бы научиться программировать в SAS. Используйте R или STATA, если вы предпочитаете, но знаете SAS. Когда вы работаете в компании, которая хочет, чтобы вы использовали SAS, они будут платить за лицензирование.
источник
Я думаю, что эта цитата от Энн Х. Милли подводит итог того, как многие люди относятся к R:
К сожалению, я думаю, что это заблуждение (свободное == низшее) распространено среди широкой публики.
источник
(немного не по теме): если взглянуть на это с другой стороны: некоторые преимущества R в научных кругах не применимы к промышленности.
Например, в академических кругах это явное преимущество, если вы можете сказать студентам пойти и получить программное обеспечение и работать дома. В промышленности обычно не нужно брать с собой какие-либо данные ...
Также вы не должны пробовать несколько вещей (TM), загружать тонны пакетов (даже если они проверены и проверены), использовать передовые методы. Вместо этого обычно ожидается, что вы будете придерживаться методов и кода, которые использовались годами и где поведение известно уже давно. Вы не выиграете много академических заслуг с этим.
И, конечно, как уже упоминалось: никто не рискует переделывать все виды одобрения регулирующих органов ради перехода на R. Из того, что я видел, меньше о R и больше об огромных затратах + работа для получения одобрения регулирующих органов. ,
источник
Хотя это довольно пессимистично, мой ответ будет таким: люди, которые принимают масштабные решения в таких корпорациях, как «мы просто используем SAS», также относятся к тем людям, которые не доверяют тому, чего не понимают, и автоматически считают ценность чего-то прямо пропорционально сумме денег, которые вы тратите на это. Это заставляет их предпочитать платить за SAS, а не тратить время на изучение альтернатив.
источник
Зачем крупной фармацевтической компании даже хотеть перейти на R с SAS? SAS стоит миллионы, но это ничего не значит для фармацевтической компании. Однако перевод всех стабильных систем отчетности с SAS на R обойдется в 50-100 раз дороже.
У SAS есть феноменальная система поддержки: каждый раз, когда мне требовалась помощь, они могли оказать ее в течение нескольких часов.
И что именно в R есть у SAS: 1) лучшая графика ... хорошо, она большая, но графика - это еще не все. Помимо R всегда можно использовать дополнительный инструмент для создания крутых графиков, а SAS не так уж и плох, когда дело доходит до графики 2) современный и более эффективный язык программирования. Многие пользователи SAS не являются программистами и не заботятся об использовании классного языка. Они просто хотят иметь возможность анализировать данные.
Я люблю R, но для большой компании было бы безумно переходить на SAS. Это может иметь смысл для небольших фирм, хотя
источник
Есть несколько основных преимуществ, без определенного порядка
Я намеренно избегаю использования уничижительных терминов, таких как «наследие» или «привычка». Многие компании используют SAS в течение 30 или 40 лет, и у них есть миллионы строк рабочего кода. Кроме того, есть все преимущества стабильной кодовой базы с миллионами пользовательских дней в области, где небольшие ошибки могут быть критическими. Это та же самая причина, по которой Unix-версии по-прежнему популярны, даже несмотря на то, что Unix более 40 лет и в некотором смысле устарели. Наконец, существует большое сообщество опытных специалистов SAS, которые привыкли решать бизнес-задачи.
Компании располагают множеством различных источников данных, основанных на разных типах систем, а также во многих случаях в нескольких операционных средах. R совсем недавно получил некоторые чрезвычайно базовые возможности для работы с чем-то большим, чем может храниться в памяти. Сравните это со способностью SAS поддерживать встроенную оптимизированную обработку в базе данных для terradata, приведя лишь один пример. В большинстве реальных ситуаций самая сложная часть аналитики связана с данными и операционной средой. (Вам нужно запустить код оценки модели, разработанный для Windows, на мэйнфрейме? С SAS нет проблем. С R вам не повезло.) R не решает ни одну из этих проблем.
Пользователь SAS может быть достаточно уверен, что каждый модуль кода был протестирован квалифицированными специалистами. Нет необходимости уделять время и усилия изучению происхождения кода или независимой его проверке. Кроме того, если возникают какие-либо проблемы, надежная помощь (от чего-то простого, как документация, до чего-то столь же всеобъемлющего, как подробное изучение неожиданных результатов или поведения сложного метода), пользователь может взять трубку и получить помощь.
Язык отключает некоторых людей, потому что он отличается от современных языков для общего программирования. Сказав это, язык высокого уровня, мощный, выразительный и всеобъемлющий. Короче говоря, как только вы изучите это, оно выполнит свою работу. Для компаний элегантность решения не является чем-то особенным.
источник
Служба поддержки.
Однажды я поболтал с другом, работающим в компании, специализирующейся на установке серверов, и затем он объяснил мне, почему крупные компании всегда выбирают продукты Microsoft, а не идут с открытым исходным кодом. Преимущество Microsoft над конкурентами с открытым исходным кодом - поддержка клиентов. Если что-то пойдет не так с продуктом, компания может позвонить в Microsoft, крупные компании даже имеют персональную поддержку для них. Не так с программным обеспечением с открытым исходным кодом.
Я думаю, что это та же самая причина, по которой SAS получает приоритет над R.
источник
А как насчет Фронтендс? Что является эквивалентом R для SAS Enterprise Guide, Web Report Studio или Enterprise Miner? Редактировать: Эти инструменты позволяют непрограммирующему пользователю использовать СКЛАД ДАННЫХ без знания базовой технологии. Они не являются в первую очередь инструментами для использования SAS как таковой. R GUI - это просто IDE для языка / системы R, AFAIK. Они не могут предоставить помощь нетехническому пользователю, который хочет получить информацию и понимание от DWH.
источник
Однажды я работал в консалтинговой компании, которая оказывала помощь SAS крупному производителю микросхем в Силиконовой долине. Наш контактный сотрудник в компании сказал нам, что он получил предложение от другой компании предоставить им ту же самую консультацию, используя другое программное обеспечение, которое охватывает все области, охватываемые SAS, и которое будет стоить компании доли того, что SAS взимает с них. ( 30 000 долларов США против 1 000 000 долларов США). Контактное лицо обдумало, что делать, и отказалось информировать своего босса о предложении, потому что он боялся, что его уволят за использование SAS, а не за более дешевые альтернативы. Вместо этого он настоял на том, чтобы наша консалтинговая компания дала их компании большой перерыв в наших консультационных расходах. Наша компания согласилась.
источник
Я не думаю, что безопасность приложений была упомянута. Этот вопрос был поднят в Stack Overflow, но пропущен, поскольку это было не по теме.
Я сотрудничаю с Шведским национальным советом здравоохранения и социального обеспечения, который использует SAS. Когда я говорил с их статистиками (например, с R), они утверждали, что их ИТ-специалисты предпочитают SAS, поскольку они не доверяют пакетам, загруженным в R. Моя жена также работает в SAS, и ее организация часто заявляет о той же проблеме ...
Я хотел бы видеть некоторые комментарии по этому вопросу. Я сделал быстрый поиск, но не нашел хороших ссылок ...
источник
Самая убедительная причина, по которой я понял, заключается в том, что в SAS имеется обширная библиотека модулей, ориентированных на конкретный бизнес, которые все люди используют в этих вертикалях, так что это в некотором роде замкнуто.
Но также и то, что SAS удовлетворяет потребности этих вертикальных сегментов в бизнесе и оптимизирует их потребности - оптимизировано в смысле «пользователю не нужно делать много дополнительной работы, чтобы получить результаты». Я не пользователь SAS, так что это не предвзятая защита бизнес-стратегии SAS.
источник
Будучи крупным коммерческим продуктом SAS, платные продавцы прилагают активные и скоординированные усилия для его продвижения. Я не думаю, что усилия по продвижению использования R могут соответствовать этим.
источник
Я смотрю на Open Source или лицензионное программное обеспечение, как это, будь то SAS или что-то еще. Мой ИТ-отдел готов предоставить услуги нашему бизнесу. Компания не зарабатывает деньги на ИТ, только на бизнес-поддержке ИТ. Бизнес имеет годовой доход в 16 миллиардов долларов . Она стоит около $ 200 млн в год. Если бы проблема была в деньгах, я бы сократил расходы, но если бы я сэкономил 10% ( $ 20 миллионов) из моего бюджета, бизнес будет уведомление? Они просто уменьшат мой бюджет в следующем году? Если ИТ терпит неудачу, бизнес теряет доход, насколько это будет зависеть от характера отказа. Части бизнеса больше не могут приносить доход. В случае сбоя такого продукта, как SAS, я могу подать в суд по контракту. Если продукт OSS дает сбой, я не могу. Я не верну свои $16 миллиардов, но я могу получить некоторые обратно, и реально с SAS вы вряд ли потеряете много. Разница в цене и стоимости должна оправдывать любой дополнительный предполагаемый риск для бизнеса. Иногда дешевле придерживаться SAS, чем переподготовку. Иногда возникают более приоритетные вопросы, поэтому компании остаются с SAS. Некоторые компании не нуждаются в полной функциональности, и в этом случае альтернативы являются жизнеспособными. Некоторые не нуждаются в поддержке, и снова альтернативы жизнеспособны. Если вы соответствуете бизнес-требованиям, то любой из вариантов действителен, если вы хотите обеспечить поддержку для бизнеса, вам нужно посмотреть на общую стоимость владения за 5-10 лет, возможность набирать специалистов по инструментам, стабильность в продукте. так что вам не нужно переписывать все с каждым новым выпуском, учебные курсы доступны для повышения квалификации,
источник
Некоторые причины, которые я не видел, упоминаются:
Лучшая документация. Документация SAS является многословной, документация R краткой. Многие компании могут предпочесть подробную документацию.
Лучше сообщения об ошибках. Сообщения об ошибках R часто кажутся разработанными, чтобы доказать, что человек, пишущий сообщение, умнее, чем человек, читающий его.
Техническая поддержка. SAS обладает одними из лучших техподдержек, с которыми я когда-либо сталкивался, предоставляемых SAS. Вы можете получить помощь по R, но эта помощь разбросана по разным местам и не всегда доступна. Люди на различных сайтах, которые предоставляют помощь с R, являются добровольцами, и добровольцы не обязаны помогать. Людям службы технической поддержки SAS платят за то, что они делают, и делают это хорошо. Они не только делают это хорошо, они делают это вежливо что часто присутствует не во всех сообществах R (мое любимое? «Я получил помощь, набрав« help », почему бы вам не попробовать ввести« help »?»)
источник
Я думаю, что угол наследства может быть большим по следующей причине. Организация нанимает человека, назовите его человеком X. Это компьютерный гуру / волшебник / и т.д. Они создают потрясающие SAS-программы / инструменты / и т. Д. Они настолько хороши, что другие люди в организации не чувствуют, что им нужно понимать, как работают программы. Они позволяют легко нажимать кнопку, и все просто работает (волшебные черные ящики).
Человек Х покидает организацию. К сожалению, знания, которыми обладает человек X, покидают организацию (управление документацией и знаниями не было приоритетом, вместо этого были рабочие программы). Их заменяет человек Y. Человек Y отлично работает с R, но не имеет представления о SAS и, следовательно, не имеет представления о том, как на самом деле работают программы SAS. Существует огромная кривая обучения, чтобы даже выяснить, чтоСT СT значительно выше, чем годовая лицензия на SAS. Я ожидаю, что SAS проведет некоторый анализ этого компромисса, и позволит этому влиять на то, как он устанавливает плату за лицензию (ну, если бы я работал в SAS). Также обратите внимание на то, что процедуры построения SAS намного лучше, чем десять лет назад (например, proc sgplot против proc plot). совпадение, что R сделал хороший заговор первым? Думаю, нет! Это эффективно снижает эффективность от переключения, потому что прорисовка больше не так уж отличается - R все еще лучше, но недостаточно для переключения ...
источник
Что касается статистики промышленности, то есть специалисты по обеспечению качества, которые (как правило) не имеют опыта программирования, статистики или науки и проводят аудит статистиков, программистов и ученых. Они хотят знать: «Откуда ты знаешь, что то, что ты делаешь, правильно?» и «Если это неправильно, как мы можем обвинять кого-то и как они будут платить за это?».
Лицензия GNU / GPL Copyleft поставляется с постоянным текстом, который гласит: «R - бесплатное программное обеспечение и СЛУЧАЙНО АБСОЛЮТНО НЕ ГАРАНТИРУЕТСЯ» в тексте с полностью прописными буквами точно так же, как я написал. Это зачет. Когда качественный человек читает этот текст, он в основном дискредитирует R. Я имею в виду, если продукт хороший, стоит добавить гарантию правильно? Такие коммерческие продукты заставили нас поверить. Фактически, именно FDA заявило, что примет регулирующие представления в R, которые отражают прогресс в индустрии программного обеспечения. (Обратите внимание, что это утверждение следует после первоначальной даты публикации вопроса.)
Для тех, кто ничего не знает о компьютерах, воображаемые сценарии безопасности, невоспроизводимости и серьезных научных ошибок не ограничены в результате этого АБСОЛЮТНО НЕДОСТАТКА ГАРАНТИИ. Мы все согласны с тем, что ошибки могут иметь катастрофические последствия. Что касается вашей лицензии SAS, у SAS есть эксперты, которые могут объяснить свое программное обеспечение аудиторам, и в случае невозможного сценария, когда SAS фактически вызывает такую проблему, они могут нести ответственность за штрафы и наказания (у них также есть достаточно денег для адвокатов, чтобы гарантировать, что они будут быть полностью оправданным в таком случае). Бремя и стоимость того, чтобы аналитик / программист представил этот случай для R, в основном составляют лицензию SAS. Не то чтобы программирование в SAS полностью освобождает вас от тяжелого бремени соответствия требованиям качества!
Так в принципе, я бы сказал, litigiousness играет важную роль в требуя дорогостоящего лицензионного программного обеспечения.
источник