Учебник HCatalog
HCatalog - это инструмент управления хранилищем таблиц для Hadoop, который предоставляет табличные данные метастора Hive другим приложениям Hadoop. Он позволяет пользователям с различными инструментами обработки данных (Pig, MapReduce) легко записывать данные в сетку. HCatalog гарантирует, что пользователям не нужно беспокоиться о том, где и в каком формате хранятся их данные. Это небольшой учебник, который объясняет только основы HCatalog и способы его использования.
Это руководство предназначено для профессионалов, стремящихся сделать карьеру в области анализа больших данных с помощью Hadoop Framework. Разработчики ETL и профессионалы, которые занимаются аналитикой в целом, также могут использовать это руководство для хорошего результата.
Прежде чем приступить к изучению этого руководства, вам потребуются базовые знания Core Java, концепции баз данных SQL, файловой системы Hadoop и любых разновидностей операционной системы Linux.