Samouczek HCatalog
HCatalog to narzędzie do zarządzania magazynem tabel dla Hadoop, które udostępnia dane tabelaryczne metastore Hive innym aplikacjom Hadoop. Umożliwia użytkownikom z różnymi narzędziami do przetwarzania danych (Pig, MapReduce) łatwe zapisywanie danych w siatce. HCatalog zapewnia, że użytkownicy nie muszą martwić się o to, gdzie lub w jakim formacie są przechowywane ich dane. To jest mały poradnik, który wyjaśnia tylko podstawy HCatalog i jak go używać.
Ten samouczek jest przeznaczony dla profesjonalistów, którzy chcą zrobić karierę w Big Data Analytics przy użyciu Hadoop Framework. Programiści ETL i profesjonaliści zajmujący się ogólnie analityką mogą równie dobrze wykorzystać ten samouczek z dobrym skutkiem.
Zanim przejdziesz do tego samouczka, potrzebujesz podstawowej wiedzy o rdzeniu Java, pojęciach baz danych SQL, systemie plików Hadoop i dowolnych odmianach systemu operacyjnego Linux.