Apache Flink - przetwarzanie wsadowe vs przetwarzanie w czasie rzeczywistym
Jeśli chodzi o Big Data, istnieją dwa rodzaje przetwarzania -
- Przetwarzanie wsadowe
- Przetwarzanie w czasie rzeczywistym
Przetwarzanie na podstawie danych gromadzonych w czasie nazywa się przetwarzaniem wsadowym. Na przykład menedżer banku chce przetworzyć dane z ostatniego miesiąca (zebrane w czasie), aby poznać liczbę czeków, które zostały anulowane w ciągu ostatniego miesiąca.
Przetwarzanie oparte na natychmiastowych danych w celu uzyskania natychmiastowych wyników nazywa się przetwarzaniem w czasie rzeczywistym. Na przykład menedżer banku otrzymujący alert o oszustwie natychmiast po wystąpieniu oszustwa (natychmiastowy wynik).
Poniższa tabela przedstawia różnice między przetwarzaniem wsadowym i przetwarzaniem w czasie rzeczywistym -
Przetwarzanie wsadowe | Przetwarzanie w czasie rzeczywistym |
---|---|
Pliki statyczne |
Strumienie wydarzeń |
Przetwarzane okresowo w minutach, godzinach, dniach itp. |
Przetwarzane natychmiast nanosekund |
Wcześniejsze dane na dysku |
W pamięci |
Przykład - generowanie rachunku |
Przykład - alert transakcji w bankomacie |
Obecnie każda organizacja często wykorzystuje przetwarzanie w czasie rzeczywistym. Przypadki użycia, takie jak wykrywanie oszustw, alerty w czasie rzeczywistym w służbie zdrowia i ostrzeżenia o atakach sieciowych, wymagają natychmiastowego przetwarzania danych w czasie rzeczywistym; opóźnienie nawet kilku milisekund może mieć ogromny wpływ.
Idealnym narzędziem do takich przypadków użycia w czasie rzeczywistym byłoby to, które może wprowadzać dane jako strumień, a nie wsad. Apache Flink to narzędzie do przetwarzania w czasie rzeczywistym.