Hackathon di giornalismo strutturato

Dec 15 2022
Come vogliamo offrire contenuti regionali con l'aiuto dell'intelligenza artificiale
Alla BBC #Newshack, il BR AI + Automation Lab ha sviluppato il prototipo "Remix Regional". L'obiettivo è offrire notizie regionali dalla radio in modo personalizzato e basato sulla posizione tramite un'app.

Alla BBC #Newshack, il BR AI + Automation Lab ha sviluppato il prototipo "Remix Regional". L'obiettivo è offrire notizie regionali dalla radio in modo personalizzato e basato sulla posizione tramite un'app. L'idea segue il principio del giornalismo strutturato. E il mix di notizie personalizzate ha molto a che fare con Lego, tra l'altro.

Alla BBC #Newshack, il BR AI + Automation Lab ha sviluppato un prototipo per offrire notiziari radiofonici regionali basati sulla posizione tramite un'app. L'idea segue il principio del giornalismo strutturato.

Il BR è un fornitore regionale. La diversità delle regioni bavaresi si riflette nel nostro programma, che viene spesso prodotto in loco negli studi regionali o dai nostri corrispondenti in molte località della Baviera. Ecco perché all'inizio dell'AI + Automation Lab ci è stato chiaro che la regionalizzazione dei contenuti sarebbe stata al centro del nostro lavoro.

Hacking con la BBC

La BBC ha ospitato il BBC #Newshack "Modular Content" il 3 e 4 dicembre . La domanda chiave era " Come potremmo utilizzare i contenuti modulari per personalizzare le esperienze di notizie?" above the hackathon: come possiamo utilizzare i contenuti modulari per personalizzare l'esperienza delle notizie?

Il BBC #Newshack, organizzato da BBC Connected Studio, è stato il primo hack remoto puro per il nostro team. (da sinistra a destra Cécile Schneider, Sebastian Bayerl, Uli Köppen, Morteza Shahrezaye, Christina Elmer (Der Spiegel), Michael Kreil, Rebecca Ciesielski, Steffen Kühne)

L'hackathon segue quindi il principio del giornalismo strutturato . Il giornalismo strutturato è una forma di giornalismo guidata dai metadati e dalle nuove tecnologie. Si presuppone che ciascun contributo sia costituito essenzialmente da singoli blocchi di informazioni. I giornalisti possono quindi utilizzare l'intelligenza artificiale (AI) e l'automazione per riassemblare questi blocchi in nuovi pezzi, formati o persino nuovi prodotti.

Una delle maggiori sfide è produrre contenuti in modo modulare fin dall'inizio o suddividere automaticamente i contenuti esistenti in blocchi di informazioni più piccoli e salvare le migliori informazioni possibili sul contenuto dei singoli blocchi come metadati leggibili dalla macchina. Qui vengono spesso utilizzati metodi di elaborazione del linguaggio (PNL) o intelligenza artificiale.

Come i mattoncini Lego di diversi colori, i contenuti correttamente etichettati possono essere messi insieme per creare nuove offerte. Foto: Bonneval Sebastien su Unsplash

Il principio Lego nel giornalismo

Utilizzando i metadati, i blocchi di informazioni possono essere ricomposti più e più volte come i mattoncini Lego, ad esempio per formare serie temporali, per raggruppare contenuti su un argomento specifico o per concentrarsi su una posizione specifica. Per la BBC #Newshack abbiamo deciso di esaminare la dimensione dei dati regionali.

In termini di contenuti, abbiamo scelto le notizie regionali nel programma mattutino di Bayern 1, prodotto negli studi regionali e trasmesso in cinque finestre regionali per Alta Baviera, Bassa Baviera/Alto Palatinato, Svevia, Franconia e Main Franconia.

Il prototipo del nostro esperimento di hackathon “Remix Regional” è disponibile in versione web da provare al seguente link. Attualmente funziona per un giorno nel mese di novembre e si svolge in Oberbayern, Niederbayern/Oberpfalz e nel distretto di Svevia in Baviera.

“Remix Regional”: notizie regionali personalizzate

Abbiamo sviluppato il nostro prototipo "Remix Regional" per BBC #Newshack in meno di 48 ore. La soluzione, concepita come un'app, consente agli utenti di selezionare una località in Baviera e ascoltare notizie regionali personalizzate dal programma della radio bavarese. Ad esempio, gli utenti di Landsberg am Lech non ricevono solo notizie dall'Alta Baviera, come nel caso del programma radiofonico, ma anche, ad esempio, da Memmingen nel vicino distretto amministrativo della Svevia.

Ciò è garantito da un algoritmo in background dell'app, che compila il pacchetto di messaggi in base a fattori quali distanza, dimensione della posizione e granularità spaziale. Un algoritmo vettoriale determina quindi la sequenza delle clip selezionate, che raggruppa i report in base alla loro somiglianza tematica. In questo modo, possiamo evitare salti di argomenti che gli utenti non possono comprendere, ad esempio da Corona allo sport fino a Corona.

Niente funziona senza metadati

"Remix Regional" mostra un'idea di come possiamo riprodurre contenuti modulari dal programma radiofonico lineare in un'app in modo personalizzato. Un'altra implementazione con contenuti lungo un percorso di viaggio è mostrata dal prototipo Drive by Bayern, presentato anche qui nel blog .

Tali approcci sono possibili solo se il contenuto sottostante - nel nostro caso i singoli servizi delle notizie regionali - è disponibile in una forma specifica con metadati adeguati. Per questo motivo, prima dell'hackathon, abbiamo contattato gli archivi BR per ottenere la materia prima adatta alla nostra idea.

Infrastruttura dati per il giornalismo strutturato

I nostri colleghi dell'archivio ci hanno procurato le notizie regionali dalla Svevia, Alta Baviera e Bassa Baviera/Alto Palatinato, le hanno tagliate in singole clip per rapporto e ci hanno fornito metadati estesi per ogni clip, alcuni dei quali sono stati creati a mano, che, tra l'altro, luoghi, regioni, argomenti creati e automaticamente con trascrizioni di estrazione audio incluse. Ciò ha fornito ai nostri algoritmi punti dati sufficienti per riorganizzare le clip secondo i nostri criteri. L'esempio seguente mostra un piccolo estratto dei nostri metadati.

NUMBER: 82940
CLASS: “News”
TITLE: “Der Münchner Großmarkt”
LANGUAGE: “de”
RESSORT: “Regionalreda. Oberbayern”
PROGRAM: “Bayern 1”
BROADCASTDATE: “2020–11–27”
BROADCASTTIME: “10:02:17”
AUTHOR: “Hülsmann, Lenja”
EDITOR: “go / Leidl, Barbara”
SOURCE: “BR München”
CHANGEUSER: “GOSSP”
CHANGEDATE: “2020–11–29”
CHANGETIME: “09:12:48”

Questa è una sfida tecnica e organizzativa che le case dei media possono risolvere solo nel loro insieme attraverso l'interazione di reparti editoriali, tecnologia e archivi. La prospettiva di un approccio nuovo, strutturato e di facile utilizzo al materiale di alta qualità che è già stato prodotto rende l'impresa meritevole. In futuro, la creazione dei metadati potrà anche essere parzialmente o completamente automatizzata.

Un altro approccio al tema del giornalismo strutturato con riferimento alla regionalizzazione è offerto dalle banche dati già disponibili in maniera strutturata a livello regionale. Con tali dati su argomenti come il tempo o il traffico, i contenuti regionalizzati possono anche essere integrati in modo eccellente con informazioni aggiornate.

Dati regionali per voce

All'AI + Automation Lab, sperimentiamo dati come questo dall'inizio dell'anno. Due dei nostri progetti si basano su tali database, ma li utilizzano in modi molto diversi All'inizio di settembre 2020, abbiamo rilasciato la nostra applicazione vocale Biowetter per Alexa . Ciò consente agli utenti di interrogare il meteo organico per tutte le località in Germania semplicemente tramite comando vocale. Biowetter emette quindi le influenze per la posizione selezionata nella voce di Alexa.

Immagine: BR/Herbert Ebner/Cécile Schneider

L'abilità si basa su previsioni biometeo liberamente utilizzabili dal servizio meteorologico tedesco (DWD). I dati sono disponibili per undici aree tedesche in base alle condizioni topografiche. Troviamo questo tipo di dati interessante perché ci consente di fare ogni giorno nuove offerte basate sulla posizione per gli utenti.

Al BR24 c'è una vasta gamma di grafici, testi e mappe creati automaticamente per la pandemia di corona. Utilizziamo anche dati strutturati a livello regionale per questo, ad esempio per la mappa del distretto per l'incidenza di 7 giorni in Baviera .

Con l'aiuto di pipeline di dati automatizzate, il Robert Koch Institute e il dipartimento della sanità statale traducono il numero di infezioni da corona in mappe e grafici aggiornati. Grafica: BR

Una volta creato questo contenuto regionale basato sui dati, possiamo anche utilizzarlo con AI e automazione secondo il principio del giornalismo strutturato in contesti molto diversi, ad esempio come componente aggiuntivo individuale per un'applicazione di notizie come "Remix Regional ” prototipo, tramite smart speaker e molto altro.

Contenuto dal programma lineare

Il nostro prototipo “Remix Regional” di BBC Newshack, la voice skill Biowetter e i numeri Corona per Baviera e Germania sono tre progetti dell'AI+ Automation Lab che rendono fruibili dati e contenuti regionali in contesti molto diversi. Alcuni di questi sono contenuti del programma lineare, che può essere utilizzato anche in applicazioni personalizzate non lineari, e altri sono dati rilevanti su ciò che sta accadendo sul posto.

Le esperienze che siamo stati in grado di acquisire con le applicazioni regionali e il riferimento locale delle informazioni costituiscono una base importante per i progetti futuri in BR e ci aiutano a comprendere meglio le esigenze dei nostri utenti e della casa. Allo stesso tempo, possiamo fornire un feed back alla strategia, ad esempio per progettare l'infrastruttura tecnica in modo lungimirante.

Il prototipo del nostro esperimento di hackathon “Remix Regional” è disponibile in versione web da provare al seguente link .

Squadra Hackathon: Sebastian Bayerl, Michael Kreil, Morteza Shahrezaye, Uli Köppen, Cécile Schneider, Rebecca Ciesielski, Steffen Kühne (tutti BR AI + Automation Lab), Christina Elmer (Der Spiegel)