Tutorial HCatalog
HCatalog é uma ferramenta de gerenciamento de armazenamento de tabela para Hadoop que expõe os dados tabulares do metastore Hive para outros aplicativos Hadoop. Ele permite que os usuários com diferentes ferramentas de processamento de dados (Pig, MapReduce) gravem dados facilmente em uma grade. HCatalog garante que os usuários não tenham que se preocupar com onde ou em que formato seus dados são armazenados. Este é um pequeno tutorial que explica apenas os fundamentos do HCatalog e como usá-lo.
Este tutorial é destinado a profissionais que desejam fazer carreira em Big Data Analytics usando o Hadoop Framework. Os desenvolvedores e profissionais de ETL que estão em análise em geral também podem usar este tutorial com bons resultados.
Antes de prosseguir com este tutorial, você precisa de um conhecimento básico de Core Java, conceitos de banco de dados de SQL, sistema de arquivos Hadoop e qualquer um dos sabores de sistema operacional Linux.