Uczenie maszynowe do analizy danych

Uczenie maszynowe to dziedzina informatyki, która zajmuje się takimi zadaniami, jak rozpoznawanie wzorców, widzenie komputerowe, rozpoznawanie mowy, analiza tekstu i ma silne powiązanie ze statystyką i optymalizacją matematyczną. Aplikacje obejmują między innymi rozwój wyszukiwarek, filtrowanie spamu, optyczne rozpoznawanie znaków (OCR). Granice między eksploracją danych, rozpoznawaniem wzorców i dziedziną uczenia się statystyki nie są jasne i zasadniczo wszystkie odnoszą się do podobnych problemów.

Uczenie maszynowe można podzielić na dwa rodzaje zadań -

Nadzorowana nauka
Uczenie się bez nadzoru

Nadzorowana nauka

Uczenie nadzorowane odnosi się do rodzaju problemu, w którym istnieją dane wejściowe zdefiniowane jako macierz X, a my jesteśmy zainteresowani przewidywaniem odpowiedzi y . Gdzie X = {x ₁ , x ₂ ,…, x _n } ma n predyktorów i ma dwie wartości y = {c ₁ , c ₂ } .

Przykładową aplikacją mogłoby być przewidywanie prawdopodobieństwa kliknięcia reklam przez użytkownika sieci na podstawie cech demograficznych jako predyktorów. Jest to często wywoływane w celu przewidywania współczynnika klikalności (CTR). Wtedy y = {klik, nie - klik}, a predyktorami mogą być użyty adres IP, dzień wejścia na stronę, miasto użytkownika, kraj oraz inne funkcje, które mogą być dostępne.

Uczenie się bez nadzoru

Uczenie się bez nadzoru dotyczy problemu znajdowania grup, które są do siebie podobne, bez konieczności posiadania klasy, z której można by się uczyć. Istnieje kilka podejść do zadania uczenia się mapowania od predyktorów do znajdowania grup, które mają podobne wystąpienia w każdej grupie i różnią się między sobą.

Przykładowym zastosowaniem uczenia się bez nadzoru jest segmentacja klientów. Na przykład w branży telekomunikacyjnej częstym zadaniem jest segmentacja użytkowników według sposobu korzystania z telefonu. Pozwoliłoby to działowi marketingu skierować do każdej grupy inny produkt.