Samouczek dotyczący analizy dużych zbiorów danych
Ilość danych, z którymi trzeba się zmierzyć, eksplodowała w ciągu ostatniej dekady do niewyobrażalnych poziomów, a jednocześnie cena ich przechowywania systematycznie spada. Prywatne firmy i instytucje badawcze przechwytują terabajty danych o interakcjach ich użytkowników, biznesie, mediach społecznościowych, a także czujniki z urządzeń takich jak telefony komórkowe i samochody. Wyzwaniem tej epoki jest zrozumienie tego morza danychbig data analytics pojawia się obraz.
Big Data Analytics w dużej mierze polega na zbieraniu danych z różnych źródeł, gromadzeniu ich w taki sposób, aby były dostępne do wykorzystania przez analityków, a na końcu dostarczaniu produktów danych przydatnych w działalności organizacji.
Proces przekształcania dużych ilości nieustrukturyzowanych nieprzetworzonych danych, pobranych z różnych źródeł w produkt danych przydatny dla organizacji, stanowi rdzeń Big Data Analytics.
W tym samouczku omówimy najbardziej podstawowe pojęcia i metody analizy dużych zbiorów danych.
Ten samouczek został przygotowany dla programistów, którzy chcą poznać podstawy analizy dużych zbiorów danych. Specjaliści zajmujący się ogólnie analityką mogą równie dobrze skorzystać z tego samouczka z dobrym skutkiem.
Zanim zaczniesz korzystać z tego samouczka, zakładamy, że masz wcześniejszą styczność z obsługą ogromnych ilości nieprzetworzonych danych na poziomie organizacyjnym.
W tym samouczku opracujemy mini projekt, aby przedstawić prawdziwy problem i dowiedzieć się, jak go rozwiązać za pomocą analizy Big Data. Możesz pobrać niezbędne pliki tego projektu z tego linku:http://www.tools.tutorialspoint.com/bda/