0 Вопрос: Вызов R из SAS и проблемы с памятью

вопрос создан в Thu, May 2, 2019 12:00 AM

Я работаю с очень большим набором данных (~ 30 миллионов строк). Я обычно работаю с этим набором данных в SAS, но хотел бы использовать некоторые приложения машинного обучения, которые не существуют в SAS, но существуют в R. К сожалению, мой компьютер не может обрабатывать набор данных такого размера в R из-за того, как R хранит все набор данных в памяти.

Решит ли это вызов функций R из программы SAS? По крайней мере, я могу запустить SAS на сервере (я не могу сделать это с R).

    
0
  1. Нет, не будет, потому что SAS просто передает команды в R, это не какой-либо механизм преобразования. Какой тип модели ML вы пытаетесь запустить в R?
    2019-05-02 14: 46: 15Z
  2. То есть, когда вы вызываете R из SAS, вам нужно хранить набор данных в памяти? Я просто использую типичные алгоритмы ML, случайный лес, нейронные сети, svm и т. Д.
    2019-05-02 14: 53: 07Z
  3. Этот веб-сайт: blogs.sas.com/content/iml/2013/11/25/… гласит:« В SAS /IML Studio SAS и R могут работать на разных компьютерах. Вы можете запустить SAS на огромном сервере и запустить R на своем локальном ПК. " Поэтому я подумал, что это возможно. Я работаю в корпорации, где мы преимущественно используем SAS. Таким образом, у меня есть доступ к серверам, где я могу использовать SAS, но у меня есть только R на моем локальном ПК.
    2019-05-02 15: 15: 21Z
  4. @ IceCreamToucan SAS может работать в разных средах и в разных БД так, как многие другие инструменты не могут. В Base вы можете выполнять определенные шаги локально, другие - на сервере и динамически переключаться по мере необходимости. Код, который нужно сделать, также довольно минимален.
    2019-05-03 02: 30: 49Z
  5. какую версию SAS вы используете? Некоторые из более новых версий поставляются с SAS, если его установили ИТ-специалисты. Вам нужно проверить версию сервера, чтобы увидеть, установлен ли там R. Или, может быть, вы можете убедить ИТ установить его на сервере? Есть ли способ разделить какую-либо обработку, чтобы обрабатывать меньше данных за раз? Хотя, думаю, ты уже думал об этом.
    2019-05-03 02: 32: 34Z
0 ответов                              0                         
источник размещен Вот