Apache Flink - Платформа больших данных

Прогресс данных за последние 10 лет был огромным; это дало начало термину «большие данные». Не существует фиксированного размера данных, который можно назвать большими данными; любые данные, которые ваша традиционная система (СУБД) не может обработать, являются большими данными. Эти большие данные могут быть в структурированном, полуструктурированном или неструктурированном формате. Изначально данные имели три измерения - объем, скорость, разнообразие. Размеры теперь вышли за рамки трех Vs. Теперь мы добавили другие V - достоверность, достоверность, уязвимость, ценность, изменчивость и т. Д.

Большие данные привели к появлению множества инструментов и фреймворков, которые помогают в хранении и обработке данных. Существует несколько популярных фреймворков для работы с большими данными, например Hadoop, Spark, Hive, Pig, Storm и Zookeeper. Это также дало возможность создавать продукты нового поколения во многих областях, таких как здравоохранение, финансы, розничная торговля, электронная коммерция и другие.

Будь то MNC или стартап, все используют большие данные для их хранения и обработки и принятия более разумных решений.

ja/tutorial