La grande bugia sui dati

Dec 05 2022

Dì qualcosa abbastanza frequentemente e puoi convincere chiunque a crederci. Le migliori bugie sono spesso le più grandi... Il valore dei dati è nelle intuizioniIl valore dei dati è nelle intuizioniIl valore dei dati è nelle intuizioni Milioni di carriere e miliardi di capitalizzazione di mercato dipendono dai sistemi di dati classici: data warehouse, motori di query ad alte prestazioni e software di visualizzazione dei dati.

Dì qualcosa abbastanza frequentemente e puoi convincere chiunque a crederci. Le migliori bugie sono spesso le più grandi...

Figura 1: La grande bugia sui dati, DALL*E 2

Il valore dei dati è nelle intuizioni
Il valore dei dati è nelle intuizioni
Il valore dei dati è nelle intuizioni

Milioni di carriere e miliardi di capitalizzazione di mercato dipendono dai sistemi di dati classici: data warehouse, motori di query ad alte prestazioni e software di visualizzazione dei dati. I sistemi di dati classici si fondano su questa storia. Tuttavia, la verità sta lentamente cominciando ad emergere...

Il valore dei dati non è nelle intuizioni

La maggior parte dei dashboard non riesce a fornire informazioni utili e diventa rapidamente abbandonata. Un report sull'utilizzo di qualsiasi portale di business intelligence online rivelerà rapidamente che l'80-90% di tutti i dashboard è raramente, se non mai, accessibile.

Nel frattempo, quei pochi dashboard che offrono spunti utili raramente forniscono una base concreta per l'azione. Spesso sono necessarie più analisi aggiuntive nelle settimane e nei mesi successivi, molte delle quali non riescono a fornire le basi necessarie per l'azione.

La dura realtà è che l'intelligenza dei sistemi di dati classici è limitata e distruggono la maggior parte del valore informativo dei dati che elaborano. Alcune intuizioni che forniscono hanno valore e alcune sono attuabili, ma purtroppo solo una manciata si traduce in azione. Plasmiamo la nostra coscienza insistendo che le nostre intuizioni sono "perseguibili", mentre raramente mettiamo in atto misure per valutare se sono veramente "perseguibili". La verità sta iniziando a emergere...

Il valore dei dati è nelle azioni

Tuttavia, se la verità è così ovvia, perché qualcuno crede nella grande bugia sui dati ?

La sfida è che passare dai dati alle azioni è difficile. La maggior parte dei sistemi di dati classici non dispone dell'intelligenza richiesta. La maggior parte dei sistemi di dati classici è in grado di fornire solo informazioni di base e fornire un valore limitato.

Abbiamo scelto di accettare la grande bugia sui dati , non perché ci crediamo. Abbiamo scelto di accettare la grande bugia sui dati perché è più facile lavorare con i limiti dei sistemi di dati classici piuttosto che sfidarli e superarli. Abbiamo scelto di accettare la grande bugia sui dati perché è conveniente.

Per fortuna stanno arrivando nuovi sistemi di dati che superano queste limitazioni. Questi sistemi futuri hanno l'intelligenza per superare le "intuizioni attuabili" del passato e passare direttamente dai dati alle azioni.

Tuttavia, se intendiamo comprendere questi futuri sistemi di dati, dobbiamo confrontarli con i sistemi di dati classici. Forse il modo migliore per illustrare le loro differenze è prendere un semplice problema aziendale ed esaminare come potremmo affrontarlo con ogni tipo di sistema.

Immaginiamo di voler migliorare la distribuzione delle polizze assicurative sanitarie. In un sistema di dati classico potremmo iniziare con una semplice query utilizzando SQL (Structured Query Language):

SELECT
  policy_year as year,
  policy_type as policy,
  COUNT(*) as volume
FROM policies 
GROUP BY
  year,
  policy;
+------+--------+------------+ 
| year | policy | volume     | 
+------+--------+------------+ 
| 2019 | Alpha  | 20,637,609 | 
| 2019 | Beta   | 15,234,792 | 
| 2020 | Alpha  | 17,840,839 | 
| 2020 | Beta   | 18,840,839 | 
| 2021 | Alpha  | 16,998,797 | 
| 2021 | Beta   | 20,223,711 | 
+------+--------+------------+   
6 rows in set (3.7 sec)

Figura 2: Emissione polizze per anno e tipologia

Vediamo che le polizze emesse per Alpha sono in calo, mentre quelle per Beta sono in aumento. Prima emettevamo più Alpha e ora stiamo emettendo più Beta. Questa è un'intuizione, ma quale azione dovremmo intraprendere?

Forse possiamo indirizzare gli agenti verso Alpha per ridurre il declino, o forse indirizzare gli agenti verso Beta perché è popolare? La sfida con questa analisi è che è molto difficile da dire. La nostra analisi è stata in grado di descrivere il passato, ma non è stata in grado di prevedere in che modo ogni azione potrebbe avere un impatto sul futuro. Mentre potremmo certamente produrre analisi migliori, la situazione di avere intuizioni, ma nessuna azione chiara, è molto comune.

Quindi qual è la fonte del problema? Abbiamo iniziato con tre anni di dati dettagliati sulle politiche con oltre un miliardo di punti dati e li abbiamo compressi in soli sei punti dati. Abbiamo scartato quasi tutto il valore informativo di questi dati: ad esempio quale tipo di polizza preferisce ciascun cliente, come si connette e di quali coperture aggiuntive potrebbe aver bisogno? Allora perché l'abbiamo fatto?

La sfida fondamentale è che nessun essere umano è in grado di guardare un miliardo di dati e dar loro un senso. Riassumiamo i dati in sei, sessanta o forse seicento punti dati per assicurarci di avere la capacità di consumarli. Il vincolo fondamentale è il potere dell'intelligenza umana.

Purtroppo, gli strumenti che utilizziamo nei sistemi di dati classici per comprimere i dati semplicemente non sono abbastanza intelligenti da conservare un valore di informazioni sufficiente. Questa è la ragione fondamentale per cui così poche intuizioni sono utilizzabili.

Per fortuna, stanno arrivando nuovi sistemi di dati che superano queste limitazioni. Questi sono alimentati da una gamma di tecnologie come machine learning, deep learning, metodi statistici e altri. Ci riferiamo sempre più a queste tecnologie collettivamente come Intelligenza Artificiale (AI). In un numero crescente di casi, l'intelligenza artificiale ora ci consente di superare i limiti dell'intelligenza umana.

Quindi, come potremmo applicare l'IA per affrontare la sfida della polizza assicurativa? La differenza fondamentale è che invece di iniziare con un'intuizione mirata, iniziamo con un'azione mirata. Un'azione ben collaudata per questo caso d'uso è una raccomandazione politica personalizzata per ogni cliente.

Utilizziamo l'intelligenza artificiale per comprendere ogni singolo cliente: quali tipi di polizze e copertura aggiuntiva potrebbero aver bisogno, e forse il messaggio e il miglior canale di comunicazione. Utilizziamo questa intelligenza per effettuare comunicazioni mirate individualmente e aumentare i premi; un cliente alla volta.

Figura 3: Macro-approfondimenti contro macro azioni

Con i sistemi di dati classici, comprimiamo milioni di punti dati in una manciata di macroinsight. Lo facciamo per lavorare entro i limiti dell'intelligenza umana. Tuttavia, nel processo di compressione, perdiamo la maggior parte del valore informativo dei dati originali.

Con i sistemi di dati basati sull'intelligenza artificiale, adottiamo un approccio diverso. Utilizziamo l'intelligenza artificiale per estrarre fino all'ultima goccia di informazioni dai dati per sviluppare una comprensione dettagliata e completa. Usiamo questa comprensione per alimentare milioni di micro-azioni.

Questo nuovo approccio ai dati richiede nuovi strumenti e nuove competenze. Tuttavia, sblocca un nuovo valore; valore dimostrabile attraverso test controllati. La verità sta iniziando a emergere...