Hive Tutorial

Hive to narzędzie infrastruktury hurtowni danych do przetwarzania ustrukturyzowanych danych na platformie Hadoop. Znajduje się na szczycie Hadoop, aby podsumować Big Data i ułatwia wykonywanie zapytań i analizowanie.

To jest krótki samouczek, który zawiera wprowadzenie do korzystania z Apache Hive HiveQL z rozproszonym systemem plików Hadoop. Ten samouczek może być pierwszym krokiem w kierunku zostania odnoszącym sukcesy programistą Hadoop z Hive.

Ten samouczek jest przeznaczony dla profesjonalistów, którzy chcą zrobić karierę w Big Data Analytics przy użyciu Hadoop Framework. Programiści ETL i specjaliści zajmujący się ogólnie analityką mogą równie dobrze wykorzystać ten samouczek z dobrym skutkiem.

Przed przystąpieniem do tego samouczka potrzebujesz podstawowej wiedzy o rdzeniu Java, koncepcjach baz danych SQL, systemie plików Hadoop i dowolnych odmianach systemu operacyjnego Linux.