SAS In-Memory Statistics for Hadoop: новые возможности высокопроизводительной аналитики
19.09.14
Анализ больших данных с помощью технологии in-memory, возможность использования широкого спектра аналитических алгоритмов для исследования и моделирования в распределенной среде Hadoop – это лишь некоторые из неоспоримых преимуществ, которые получат пользователи нового продукта SAS In-Memory Statistics for Hadoop, представленного компанией весной и поступившего в продажу в августе этого года.
«Эти преимущества позволяют беспрецедентно сократить время обработки аналитических запросов при работе с большими данными, – комментирует Андрей Свирщевский, руководитель направлений аналитики и гарантирования доходов компании SAS. – Так, построить дерево решений на таблице объемом 467 GB с 520 колонками и 120 млн строк теперь можно всего за 10 минут, а случайный лес из 10 деревьев строится и вовсе за 4 минуты. На текущий момент это самый быстрый инструмент применения методов углубленной аналитики во всей линейке SAS».
Пользователь SAS In-Memory Statistics for Hadoop получает доступ в режиме интерактивного программирования ко всем основным методам статистического анализа и машинного обучения. Среди них – линейная и логистическая регрессии, обобщенные линейные модели, деревья решений и случайный лес, прогнозирование временных рядов, анализ текстовых данных, кластеризация и др. При этом есть возможность выполнять вспомогательные и служебные задачи: готовить данные к анализу, выделять значимые предикторы, сравнивать модели, формировать код применения моделей. Новый продукт SAS позволяет сразу нескольким пользователям совместно изучать и анализировать данные, создавать и сравнивать модели, а также оперативно работать с большими объемами информации на базе технологии Hadoop.
Сегодня многие компании прорабатывают бизнес-кейсы использования Hadoop. При этом важно иметь возможность применять самые разные методы анализа, включая углубленную аналитику, на огромных объемах данных, для которых потенциально предполагается использовать Hadoop – именно для таких задач идеально подходит этот продукт.
Кроме того, представленная технология дает возможность строить Рекомендательные Системы, используя большой набор методов их построения. Такие системы востребованы для решения широкого класса бизнес-задач, в том числе целевого маркетинга. На основе анализа информации о том, какими продуктами и услугами воспользовался или пользуется каждый клиент, определяются типовые профили потребления продуктов и услуг, на выходе для каждого клиента выдается продукт/услуга, которые являются для него наиболее востребованными. Такой способ эффективнее классических методов Cross-Sell и хорошо подходит для реализации концепции Next Best Offer в условиях широкого спектра предлагаемых продуктов и услуг. Этот метод особенно понравится тем, у кого нет возможности построить отдельные модели Up-Sell для каждого продукта.
Согласно прогнозам компании IDC, объем продаж Hadoop к 2016 году достигнет $812,8 млн при среднегодовом темпе роста 60,2 %. Эксперты SAS уверены, что заказчики и в дальнейшем продолжат использовать эту архитектуру хранения больших данных с целью их анализа и получения скрытой в них ценнейшей информации.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор мышки Ugreen M751: офисная классика
Компания Ugreen выпустила новую мышку для офисных задач. Любопытно, что ее дизайн сразу отсылает нас к одной из классических моделей более высокого ценового диапазона. Заметно более высокого. Посмотрим, удастся ли сэкономить, не слишком потеряв в удобстве работы.
Threads набрала 20 млн пользователей, всего у социально сети 320 млн социальные сети
Threads от Meta продолжает наращивать аудиторию. По данным, представленным в отчете для инвесторов, число ежемесячных активных пользователей достигло 320 миллионов
Doom запустили в PDF-файле Doom игры
Doom продолжает появляться на самых неожиданных устройствах — от банкоматов и принтеров до калькуляторов и даже бензопил. Теперь культовый шутер удалось запустить в формате PDF