Die große Lüge über Daten

Dec 05 2022
Sagen Sie etwas oft genug, und Sie können jeden dazu bringen, es zu glauben. Die besten Lügen sind oft die größten… Der Wert von Daten liegt in ErkenntnissenDer Wert von Daten liegt in ErkenntnissenDer Wert von Daten liegt in Erkenntnissen Millionen von Karrieren und Milliarden von Marktkapitalisierungen hängen von klassischen Datensystemen ab: Data Warehouses, leistungsstarke Abfrage-Engines und Datenvisualisierungssoftware.

Sagen Sie etwas oft genug, und Sie können jeden dazu bringen, es zu glauben. Die besten Lügen sind oft die größten…

Abbildung 1: Die große Lüge über Daten, DALL*E 2

Der Wert von Daten liegt in Erkenntnissen
Der Wert von Daten liegt in Erkenntnissen
Der Wert von Daten liegt in Erkenntnissen

Millionen von Karrieren und Milliarden von Marktkapitalisierungen hängen von klassischen Datensystemen ab: Data Warehouses, leistungsstarke Abfragemaschinen und Datenvisualisierungssoftware. Klassische Datensysteme basieren auf dieser Geschichte. Trotzdem kommt die Wahrheit langsam ans Licht …

Der Wert von Daten liegt nicht in Erkenntnissen

Die meisten Dashboards liefern keine nützlichen Einblicke und verfallen schnell. Ein Nutzungsbericht eines beliebigen Online-Business-Intelligence-Portals zeigt schnell, dass auf 80–90 % aller Dashboards selten oder nie zugegriffen wird.

In der Zwischenzeit bieten die wenigen Dashboards, die nützliche Einblicke bieten, selten eine konkrete Handlungsgrundlage. Oftmals sind in den folgenden Wochen und Monaten mehrere zusätzliche Analysen erforderlich, von denen viele nicht die erforderlichen Handlungsgrundlagen liefern.

Die harte Realität ist, dass die Intelligenz klassischer Datensysteme begrenzt ist und sie den größten Teil des Informationswerts der von ihnen verarbeiteten Daten zerstören. Einige Erkenntnisse, die sie liefern, sind wertvoll und einige wenige sind umsetzbar, aber leider führen nur eine Handvoll zu Maßnahmen. Wir beruhigen unser Gewissen, indem wir darauf bestehen, dass unsere Erkenntnisse „umsetzbar“ sind, während wir selten Maßnahmen ergreifen, um zu beurteilen, ob sie wirklich „umsetzbar“ sind. Die Wahrheit kommt langsam ans Licht…

Der Wert von Daten liegt in Aktionen

Wenn die Wahrheit jedoch so offensichtlich ist, warum glaubt dann irgendjemand an die große Lüge über Daten ?

Die Herausforderung besteht darin, dass es schwierig ist, von Daten zu Aktionen zu gelangen. Den meisten klassischen Datensystemen fehlt die erforderliche Intelligenz. Die meisten klassischen Datensysteme sind nur in der Lage, grundlegende Erkenntnisse zu liefern und einen begrenzten Wert zu liefern.

Wir haben uns entschieden, die große Lüge über Daten zu akzeptieren , nicht weil wir daran glauben. Wir haben uns entschieden, die große Lüge über Daten zu akzeptieren, weil es einfacher ist, mit den Einschränkungen klassischer Datensysteme zu arbeiten, als sie herauszufordern und zu überwinden. Wir haben uns entschieden, die große Lüge über Daten zu akzeptieren, weil es praktisch ist.

Glücklicherweise kommen neue Datensysteme auf den Markt, die diese Einschränkungen überwinden. Diese zukünftigen Systeme verfügen über die Intelligenz, um die „umsetzbaren Erkenntnisse“ der Vergangenheit zu übertreffen und direkt von Daten zu Maßnahmen zu gelangen.

Wenn wir jedoch diese zukünftigen Datensysteme verstehen wollen, müssen wir sie mit klassischen Datensystemen vergleichen. Der vielleicht beste Weg, ihre Unterschiede zu veranschaulichen, besteht darin, ein einfaches Geschäftsproblem zu nehmen und zu untersuchen, wie wir es mit jedem Systemtyp angehen könnten.

Stellen Sie sich vor, wir versuchen, den Vertrieb von Krankenversicherungspolicen zu verbessern. In einem klassischen Datensystem könnten wir mit einer einfachen Abfrage mit SQL (Structured Query Language) beginnen:

SELECT
  policy_year as year,
  policy_type as policy,
  COUNT(*) as volume
FROM policies 
GROUP BY
  year,
  policy;
+------+--------+------------+ 
| year | policy | volume     | 
+------+--------+------------+ 
| 2019 | Alpha  | 20,637,609 | 
| 2019 | Beta   | 15,234,792 | 
| 2020 | Alpha  | 17,840,839 | 
| 2020 | Beta   | 18,840,839 | 
| 2021 | Alpha  | 16,998,797 | 
| 2021 | Beta   | 20,223,711 | 
+------+--------+------------+   
6 rows in set (3.7 sec)

Abbildung 2: Ausstellung von Policen nach Jahr und Art

Wir sehen, dass die für Alpha ausgegebenen Policen zurückgehen, während die für Beta zunehmen. Früher haben wir mehr Alpha herausgegeben und jetzt geben wir mehr Beta heraus. Das ist eine Erkenntnis, aber was sollten wir tun?

Vielleicht können wir Agenten auf Alpha verweisen, um den Rückgang zu verringern, oder vielleicht auf Beta verweisen, weil es beliebt ist? Die Herausforderung bei dieser Analyse besteht darin, dass es sehr schwer zu sagen ist. Unsere Analyse war in der Lage, die Vergangenheit zu beschreiben, war jedoch nicht in der Lage, vorherzusagen, wie sich jede Aktion auf die Zukunft auswirken könnte. Wir könnten sicherlich bessere Analysen erstellen, aber die Situation, Erkenntnisse zu haben, aber keine klaren Maßnahmen, ist sehr verbreitet.

Was ist also die Ursache des Problems? Wir haben mit drei Jahren detaillierter Policendaten mit über einer Milliarde Datenpunkten begonnen und diese auf nur sechs Datenpunkte komprimiert. Wir haben fast den gesamten Informationswert dieser Daten verworfen: zum Beispiel welche Art von Police bevorzugt jeder Kunde, wie schließt er ab und welche zusätzliche Deckung benötigt er möglicherweise? Warum haben wir es getan?

Die grundlegende Herausforderung besteht darin, dass kein Mensch in der Lage ist, sich eine Milliarde Datenpunkte anzusehen und sie zu verstehen. Wir fassen die Daten zu sechs, sechzig oder vielleicht sechshundert Datenpunkten zusammen, um sicherzustellen, dass wir die Kapazität haben, sie zu verarbeiten. Die grundlegende Einschränkung ist die Kraft der menschlichen Intelligenz.

Leider sind die Tools, die wir in klassischen Datensystemen zum Komprimieren von Daten verwenden, einfach nicht intelligent genug, um einen ausreichenden Informationswert zu erhalten. Dies ist der grundlegende Grund, warum so wenige Erkenntnisse umsetzbar sind.

Glücklicherweise kommen neue Datensysteme auf den Markt, die diese Einschränkungen überwinden. Diese basieren auf einer Reihe von Technologien wie maschinellem Lernen, Deep Learning, statistischen Methoden und anderen. Wir bezeichnen diese Technologien zunehmend zusammenfassend als künstliche Intelligenz (KI). KI erlaubt es uns heute in immer mehr Fällen, die Grenzen der menschlichen Intelligenz zu überwinden.

Wie können wir also KI anwenden, um die Herausforderung der Versicherungspolice anzugehen? Der grundlegende Unterschied besteht darin, dass wir nicht mit einer Zielerkenntnis, sondern mit einer Zielhandlung beginnen. Eine bewährte Maßnahme für diesen Anwendungsfall ist eine personalisierte Richtlinienempfehlung für jeden Kunden.

Wir verwenden KI, um jeden einzelnen Kunden zu verstehen: welche Arten von Policen und zusätzlichen Versicherungsschutz er möglicherweise benötigt, und vielleicht die Botschaft und den besten Kommunikationskanal. Wir nutzen diese Informationen, um individuell zielgerichtete Kommunikation zu betreiben und Prämien zu erhöhen; jeweils ein Kunde.

Abbildung 3: Makroeinblicke versus Makroaktion

Mit klassischen Datensystemen komprimieren wir Millionen von Datenpunkten zu einer Handvoll Makroerkenntnissen. Wir tun dies, um innerhalb der Grenzen der menschlichen Intelligenz zu arbeiten. Bei der Komprimierung verlieren wir jedoch den größten Teil des Informationswerts der Originaldaten.

Bei KI-gestützten Datensystemen verfolgen wir einen anderen Ansatz. Wir verwenden KI, um jeden letzten Tropfen Informationen aus den Daten zu extrahieren, um ein detailliertes und umfassendes Verständnis zu entwickeln. Wir nutzen dieses Verständnis, um Millionen von Mikroaktionen voranzutreiben.

Dieser neue Umgang mit Daten erfordert neue Tools und neue Fähigkeiten. Es setzt jedoch neue Werte frei; Wert, der durch kontrollierte Tests nachgewiesen werden kann. Die Wahrheit kommt langsam ans Licht…

Der Wert von Daten liegt in Aktionen Der Wert von Daten wird durch
KI erschlossen

Abbildung 4: Menschliche und künstliche Intelligenz verbinden, DALL*E 2