Analiza danych - przegląd

Analiza danych to proces sprawdzania, czyszczenia, przekształcania i modelowania danych w celu odkrycia przydatnych informacji, sugerowania wniosków i wspierania podejmowania decyzji

.

Rodzaje analizy danych

Istnieje kilka technik analizy danych obejmujących różne dziedziny, takie jak biznes, nauka, nauki społeczne itp. O różnych nazwach. Główne podejścia do analizy danych to:

  • Eksploracja danych
  • Business Intelligence
  • Analiza statystyczna
  • Predictive Analytics
  • Analiza tekstu

Eksploracja danych

Data Mining to analiza dużych ilości danych w celu wydobycia nieznanych wcześniej, interesujących wzorców danych, nietypowych danych i zależności. Należy pamiętać, że celem jest wydobycie wzorców i wiedzy z dużych ilości danych, a nie samo wyodrębnianie danych.

Analiza eksploracji danych obejmuje metody informatyczne na styku sztucznej inteligencji, uczenia maszynowego, statystyki i systemów baz danych.

Wzorce uzyskane w wyniku eksploracji danych można uznać za podsumowanie danych wejściowych, które można wykorzystać w dalszej analizie lub w celu uzyskania dokładniejszych wyników prognozowania przez system wspomagania decyzji.

Business Intelligence

Techniki i narzędzia Business Intelligence służą do pozyskiwania i przekształcania dużych ilości nieustrukturyzowanych danych biznesowych, aby pomóc w identyfikowaniu, rozwijaniu i tworzeniu nowych strategicznych możliwości biznesowych.

Celem analityki biznesowej jest umożliwienie łatwej interpretacji dużych ilości danych w celu zidentyfikowania nowych możliwości. Pomaga we wdrażaniu skutecznej strategii opartej na spostrzeżeniach, które mogą zapewnić firmom konkurencyjną przewagę rynkową i długoterminową stabilność.

Analiza statystyczna

Statystyka to nauka o zbieraniu, analizie, interpretacji, prezentacji i organizacji danych.

W analizie danych wykorzystywane są dwie główne metodologie statystyczne -

  • Descriptive statistics - W statystyce opisowej dane z całej populacji lub próbki są podsumowywane za pomocą deskryptorów liczbowych, takich jak -

    • Średnia, odchylenie standardowe dla danych ciągłych

    • Częstotliwość, procent dla danych kategorycznych

  • Inferential statistics- Wykorzystuje wzorce w danych próbki do wyciągania wniosków na temat reprezentowanej populacji lub do uwzględnienia losowości. Te wnioski mogą być -

    • udzielanie odpowiedzi tak / nie na pytania dotyczące danych (testowanie hipotez)

    • szacowanie liczbowych charakterystyk danych (estymacja)

    • opisywanie powiązań w danych (korelacja)

    • modelowanie relacji w danych (np. analiza regresji)

Predictive Analytics

Predictive Analytics wykorzystuje modele statystyczne do analizowania aktualnych i historycznych danych w celu prognozowania (przewidywania) przyszłych lub w inny sposób nieznanych zdarzeń. W biznesie analityka predykcyjna służy do identyfikacji ryzyk i szans, które pomagają w podejmowaniu decyzji.

Analiza tekstu

Analiza tekstu, nazywana również eksploracją tekstu lub eksploracją danych tekstowych, to proces uzyskiwania wysokiej jakości informacji z tekstu. Eksploracja tekstu zwykle obejmuje proces strukturyzowania tekstu wejściowego, wyprowadzania wzorców w uporządkowanych danych przy użyciu takich środków, jak uczenie się wzorców statystycznych, a na końcu ocenę i interpretację wyników.

Proces analizy danych

Analiza danych została zdefiniowana przez statysta Johna Tukeya w 1961 roku jako „Procedury analizy danych, techniki interpretacji wyników takich procedur, sposoby planowania gromadzenia danych, aby ich analiza była łatwiejsza, bardziej precyzyjna lub dokładniejsza, a wszystkie maszyny oraz wyniki statystyk (matematycznych), które mają zastosowanie do analizy danych. ”

Zatem analiza danych jest procesem uzyskiwania dużych, nieustrukturyzowanych danych z różnych źródeł i przekształcania ich w informacje przydatne do:

  • Odpowiadanie na pytania
  • Testuj hipotezy
  • Decision-making
  • Obalające teorie

Analiza danych w programie Excel

Microsoft Excel zapewnia kilka sposobów i sposobów analizy i interpretacji danych. Dane mogą pochodzić z różnych źródeł. Dane można konwertować i formatować na kilka sposobów. Można go analizować za pomocą odpowiednich poleceń, funkcji i narzędzi programu Excel - obejmujących formatowanie warunkowe, zakresy, tabele, funkcje tekstowe, funkcje daty, funkcje czasowe, funkcje finansowe, podsumowania, szybką analizę, audyt formuł, narzędzie zapytań, analizę warunkową, Solwery, model danych, PowerPivot, PowerView, PowerMap itp.

Nauczysz się tych technik analizy danych za pomocą programu Excel w ramach dwóch części -

  • Analiza danych za pomocą programów Excel i
  • Zaawansowana analiza danych w programie Excel