Uczenie maszynowe a uczenie głębokie: jaka jest różnica?

Sztuczna inteligencja jest obecnie wszędzie, ale podstawy działania tej wpływowej nowej technologii mogą być mylące. Dwie najważniejsze dziedziny rozwoju sztucznej inteligencji to „uczenie maszynowe” i jego poddziedzina, „głębokie uczenie się”. Oto krótkie wyjaśnienie, czym są te dwie ważne dyscypliny i jak przyczyniają się do ewolucji automatyzacji.
powiązana zawartość
Po pierwsze, czym jest sztuczna inteligencja?
Warto sobie przypomnieć, czym właściwie jest sztuczna inteligencja. Zwolennicy sztucznej inteligencji mówią, że mają nadzieję stworzyć pewnego dnia maszynę, która będzie w stanie „myśleć” samodzielnie. Ludzki mózg jest wspaniałym instrumentem, zdolnym do wykonywania obliczeń znacznie przekraczających możliwości jakiejkolwiek obecnie istniejącej maszyny . Inżynierowie oprogramowania zaangażowani w rozwój sztucznej inteligencji mają nadzieję, że w końcu stworzą maszynę, która będzie w stanie zrobić wszystko, co człowiek potrafi intelektualnie, ale może też to przewyższyć. Obecnie zastosowania sztucznej inteligencji w biznesie i rządzie w dużej mierze sprowadzają się do algorytmów predykcyjnych , czyli takich, które podpowiadają Ci następny utwór na Spotify lub próbują sprzedać Ci produkt podobny do tego, który kupiłeś na Amazonie w zeszłym tygodniu . Jednak zwolennicy sztucznej inteligencji uważają, że technologia ta w końcu będzie w stanie rozumować i podejmować znacznie bardziej skomplikowane decyzje. Tutaj wkraczają ML i DL.
powiązana zawartość
- Wyłączony
- język angielski
Wyjaśnienie uczenia maszynowego
Uczenie maszynowe (ML) to szeroka kategoria sztucznej inteligencji, która odnosi się do procesu, w ramach którego „uczy się” oprogramowanie, jak dokonywać przewidywań lub „decyzji”. Inżynier IBM, Jeff Crume, wyjaśnia uczenie maszynowe jako „bardzo wyrafinowaną formę analizy statystycznej”. Według Crume’a analiza ta umożliwia maszynom dokonywanie „przewidań lub decyzji na podstawie danych”. Im więcej informacji „wprowadzi się do systemu, tym bardziej będzie on w stanie dostarczyć nam dokładnych prognoz” – mówi.
W przeciwieństwie do ogólnego programowania, w którym maszyna jest projektowana tak, aby wykonywała bardzo konkretne zadanie , uczenie maszynowe polega na szkoleniu algorytmu, aby samodzielnie identyfikował wzorce w danych. Jak już wspomniano, uczenie maszynowe obejmuje szeroką gamę działań.
Wyjaśnienie głębokiego uczenia się
Głębokie uczenie się to uczenie maszynowe. Jest to jedna z wcześniej wspomnianych podkategorii uczenia maszynowego, która podobnie jak inne formy uczenia maszynowego koncentruje się na uczeniu sztucznej inteligencji „myślenia”. W przeciwieństwie do innych form uczenia maszynowego, DL stara się pozwolić algorytmom na wykonanie dużej części ich pracy. DL opiera się na modelach matematycznych znanych jako sztuczne sieci neuronowe (ANN). Sieci te starają się naśladować procesy, które naturalnie zachodzą w ludzkim mózgu – takie jak podejmowanie decyzji i identyfikacja wzorców.
Kluczowa różnica między ML i DL
Jedną z największych różnic między głębokim uczeniem się a innymi formami uczenia maszynowego jest poziom „nadzoru” zapewnianego maszynie. W mniej skomplikowanych formach uczenia maszynowego komputer prawdopodobnie uczestniczy w nadzorowanym uczeniu się — procesie, w którym człowiek pomaga maszynie rozpoznawać wzorce w oznaczonych etykietami, ustrukturyzowanych danych, a tym samym poprawiać jej zdolność do przeprowadzania analizy predykcyjnej.
Uczenie maszynowe opiera się na ogromnych ilościach „danych szkoleniowych”. Takie dane są często gromadzone przez ludzi poprzez etykietowanie danych (wielu z tych ludzi nie zarabia zbyt dobrze ). W ramach tego procesu tworzony jest zbiór danych szkoleniowych, który można następnie wprowadzić do algorytmu sztucznej inteligencji i wykorzystać do nauczenia go identyfikowania wzorców. Na przykład, jeśli firma trenowała algorytm rozpoznawania określonej marki samochodu na zdjęciach , dostarczała algorytmowi ogromne transze zdjęć tego modelu samochodu, które zostały ręcznie oznaczone przez personel. Tworzony jest także „testowy zbiór danych” w celu pomiaru dokładności mocy predykcyjnych maszyny po jej przeszkoleniu.
Tymczasem w przypadku DL maszyna angażuje się w proces zwany „uczeniem się bez nadzoru ”. Uczenie się bez nadzoru polega na tym, że maszyna wykorzystuje swoją sieć neuronową do identyfikowania wzorców w tak zwanych danych nieustrukturyzowanych lub „surowych” , czyli danych, które nie zostały jeszcze oznaczone etykietą ani zorganizowane w bazę danych. Firmy mogą używać zautomatyzowanych algorytmów do przesiewania niezorganizowanych danych, unikając w ten sposób dużej ilości pracy ludzkiej.
Jak działają sieci neuronowe
SSN składają się z tak zwanych „węzłów”. Według MIT jedna SNN może mieć „tysiące, a nawet miliony” węzłów. Węzły te mogą być nieco skomplikowane, ale skrótowe wyjaśnienie jest takie, że – podobnie jak węzły w ludzkim mózgu – przekazują i przetwarzają informacje. W sieci neuronowej węzły są ułożone w zorganizowaną formę zwaną „warstwami”. Zatem sieci „głębokiego” uczenia się obejmują wiele warstw węzłów. Informacje przemieszczają się w sieci i wchodzą w interakcję z różnymi jej otoczeniami, co przyczynia się do procesu decyzyjnego maszyny, gdy jest poddawana działaniu podpowiedzi człowieka.
Innym kluczowym pojęciem w SSN jest „waga”, którą jeden z komentatorów porównuje do synaps w ludzkim mózgu. Wagi, które są po prostu wartościami liczbowymi, są rozdzielane w sieci neuronowej sztucznej inteligencji i pomagają określić ostateczny wynik końcowego wyniku systemu sztucznej inteligencji. Wagi to dane wejściowe, które pomagają skalibrować sieć neuronową, aby mogła podejmować decyzje. Głębokie zanurzenie się MIT w sieci neuronowe wyjaśnia to w ten sposób:
Do każdego połączenia przychodzącego węzeł przypisuje liczbę zwaną „wagą”. Gdy sieć jest aktywna, węzeł otrzymuje inny element danych – inną liczbę – w każdym ze swoich połączeń i mnoży go przez powiązaną wagę. Następnie sumuje powstałe produkty, uzyskując jedną liczbę. Jeśli liczba ta jest niższa od wartości progowej, węzeł nie przekazuje żadnych danych do następnej warstwy. Jeśli liczba przekracza wartość progową, węzeł „odpala”, co w dzisiejszych sieciach neuronowych zazwyczaj oznacza wysłanie liczby – sumy ważonych wejść – wszystkimi połączeniami wychodzącymi.
W skrócie: struktury sieci neuronowych pomagają algorytmowi wyciągać własne wnioski na temat dostarczonych mu danych. Na podstawie swojego programowania algorytm może identyfikować przydatne powiązania w dużych transzach danych, pomagając ludziom wyciągać własne wnioski na podstawie analizy.
Dlaczego uczenie maszynowe jest ważne dla rozwoju sztucznej inteligencji?
Uczenie maszynowe i głębokie uczenie się pomagają szkolić maszyny w wykonywaniu działań predykcyjnych i interpretacyjnych, które wcześniej były domeną tylko ludzi. Może to mieć wiele zalet, ale oczywistą wadą jest to, że te maszyny mogą (i, bądźmy szczerzy, będą) nieuchronnie wykorzystywane do nikczemnych, a nie tylko przydatnych celów – takich jak rządowe i prywatne systemy nadzoru oraz ciągła automatyzacja działalność militarną i obronną. Ale są też oczywiście przydatne w przypadku sugestii konsumentów lub kodowania, a w najlepszym wypadku badań medycznych i zdrowotnych. Jak każde inne narzędzie, to, czy sztuczna inteligencja będzie miała dobry, czy zły wpływ na świat, w dużej mierze zależy od tego, kto z niej korzysta.

