Что такое Big Data? И почему ЭТО становится таким актуальным? Объясните популярно!

5066
4
0
4 сентября
15:41
сентябрь
2015

В буквальном понимании термин Big Data, действительно, означает большие по объему (в терабайтах, петабайтах и экзобайтах) данные. Но суть в другом.

Более точной формулировка может служить "сложные данные".

Когда говорят Big Data подразумевают данные с такими характеристиками:

* их сложно и дорого анализировать, необходимы значительные человеческие и вычислительные ресурсы.

* в них может находится информация. использование которой приведет к конкретному, измеримому увеличению бизнес показателей компании

Примером Big Data может служить набор данных очень крупного интернет-магазина, аналитическая система которого собирает действия пользователей на сайте: каждую посещенную страницу, источник трафика, движения мышки, клики по ссылкам, статистику из социальных профилей пользователей, историю покупок и т.д.

Результатом успешного анализа такого набора данных будет увеличение продаж, среднего чека или повторных покупок, что приведет к отслеживаемому росту дохода магазина.

О Big Data говорят, потому что эта методология работает. Компании ( и не только ) принимают стратегические решения на основании результатов анализа. На данный момент количество необработанных данных значительно превышает количество специалистов и вычислительные мощность серверов для их анализа. Спрос на анализ Big Data рождает предложение.

Именно коммерческое использование Big Data генерирует такой интерес вокруг этой области знании. Но Big Data очень важна и для науки. Большой Адронный Коллайдер, к примеру, генерирует невообразимо огромные объемы данных. И именно успешный анализ и обработа этих данных позволяет ученым открывать новые элементарные частицы (бозон Хиггса).

17
0
сентябрь
2015

Как уже сказали выше Big Data - это большие данные. Они обладают тремя главными свойствами: 1) Они невероятно больших размеров. 2) Они должны быстро обрабатываться. 3) Они разнородны и неупорядоченны. Например, банковские сведения нельзя считать большими данными, потому что они достаточно систематизированы, а сайт, на котором люди составляют свои генеалогические древа и ищут своих дальних родственников посредством ДНК-тестов можно было бы считать Big Data, потому что велика вероятность незнания точной информации о своих прапрапрадедушках(бабушках), при это система быстро находит предположительных родственников. Я думаю, что это направление становится все популярней, потому что информации становится все больше и больше, а значит и данные увеличиваются в размерах. Их нужно уметь обрабатывать, чтобы не утонуть в них.

4
1
сентябрь
2015

Как уже было сказано, Big Data - это большие объемы данных. Я считаю, что главной причиной популярности технологий работы с ними является растущий в геометрической прогрессии объем создаваемой человечеством информации. А также то, что на столь больших выборках начинают действовать законы больших чисел, что позволяет выявлять многие до этого скрытые закономерности, что в свою очередь открывает большой простор для их разностороннего анализа.

3
0
показать ещё 2 ответа
Если вы знаете ответ на этот вопрос и можете аргументированно его обосновать, не стесняйтесь высказаться
Ответить самому
Выбрать эксперта