Какой вид анализа используют при обработке Big Data?

Ответить
Ответить
Комментировать
1
Подписаться
0
1 ответ
Поделиться

Существует несколько видов анализа данных, и почти все они используются в Big Data.

1) Дескриптивный анализ. Это анализ на уровне средних значений, медиан, квартилей, средних отклонений и т.д. Используется для первончального понимание имеющихся данных + контроль над качеством данных.

2) Разведочный анализ. Его можно рассматривать как продолжение дескриптивного анализа. В нем зачастую используются разные виды визуализаций. Существует прекрасный пример того, как ряды, имеющие одинаковые дескриптивные статистики, по сути обладают разными распределениями - Квартет Энскомба

3) Предиктивный анализ. Тот вид анализа, который приносит конечную ценность. В рамках него мы прогнозируем значение какой-то переменной, используя инструменты машинного обучения. Можем, например, прогнозировать стоимость недвижимости по имеющимся данными, или прогнозировать пол, возрастную категорию, уровень дохода только по логам посещения пользователя в интернете.

Большой объем данных скорее накладывает ограничения в выборе инструментов, при помощи которых эти данные анализируются, и алгоритмов. А в остальном - используется те же самые виды анализа.

1
0
Прокомментировать
Ответить
Читайте также на Яндекс.Кью
Читайте также на Яндекс.Кью