Excel corregge automaticamente la ricerca scientifica. E non va bene

Aug 26 2016
Dopo aver esaminato migliaia di articoli di genetica pubblicati, i ricercatori hanno scoperto che quasi un quinto aveva errori causati da Microsoft Excel nei loro file supplementari. Uh Oh.
Excel corregge automaticamente la ricerca scientifica. E non va bene ORA

È probabile che tu abbia inviato o ricevuto un messaggio confuso grazie alla correzione o al completamento automatico. Esistono centinaia di meme in cui questi errori causano problemi di comunicazione, spesso con risultati esilaranti. Come questo . O questo . O questo .

Ma non è così divertente quando succede al tuo articolo scientifico. I documenti accademici includono spesso file supplementari con dati, grafici e grafici a supporto della conclusione del documento. Molti di questi file sono fogli di calcolo.

Dal 2004, gli scienziati hanno notato che Microsoft Excel, il popolare programma di fogli di calcolo, ha la cattiva abitudine di cambiare alcuni nomi di geni in altri tipi di dati. Ad esempio, i genetisti usano MARZO1 come scorciatoia per il dito anulare 1 di tipo CH associato alla membrana. Ma Excel interpreta MARZO1 come una data, convertendolo automaticamente in 1 marzo o un'altra designazione per il primo marzo.

Excel identifica erroneamente alcuni altri nomi di geni come coordinate o punti mobili. Potresti essere in grado di scoprire che 1-Mar è in realtà MARZO1, ma che ne dici di 2.31E+13? Ecco come Excel converte l'identificatore RIKEN 2310009E13. RIKEN è un enorme istituto di ricerca in Giappone che, tra le altre cose, conduce progetti sul genoma. (Per la cronaca, abbiamo provato a collegare l'identificatore RIKEN in un foglio di calcolo Excel e l'abbiamo convertito automaticamente in 2.31E + 19, ancora sbagliato e ancora non quello che è inteso in quei documenti accademici.)

Nonostante il fatto che i ricercatori abbiano identificato per la prima volta questo problema più di un decennio fa, persiste ancora oggi. I ricercatori Mark Ziemann, Yotam Eren e Assam El-Osta hanno esaminato più di 35.000 file supplementari per vedere quanto fosse effettivamente diffuso il problema. Hanno sviluppato un software automatizzato che cercava tutti i dati che sembravano essere un elenco di nomi di geni. Hanno identificato 7.467 liste di geni che rappresentano i dati supplementari per 3.597 articoli pubblicati in 18 diverse riviste. Si è scoperto che 704 di quei documenti pubblicati includevano file con errori di formato Excel in essi. Questo è un tasso di errore del 19,6%. In altre parole, quasi un documento pubblicato su cinque include file supplementari con errori di formattazione di Excel.

Questo non è solo un inconveniente. I ricercatori fanno affidamento sui lavori pubblicati per guidare i propri progetti. Se i file includono errori, può essere difficile e richiedere molto tempo risolvere il problema e trovare i dati pertinenti.

Perché non disattivare semplicemente le funzioni di formattazione automatica? Secondo il team di ricerca, non c'è modo di disabilitare permanentemente le funzionalità in Excel. Potresti essere in grado di modificare manualmente ciascuna opzione ogni volta che crei un nuovo file, ma è inefficiente. Hanno fatto notare, tuttavia, che Fogli Google non segue lo stesso approccio alla formattazione. Inoltre, se prima inserisci tutti i tuoi dati in Fogli Google e poi li copi in un programma di fogli di lavoro diverso, la formattazione rimane invariata.

È un po' comico che una funzione destinata ad aiutare le persone a utilizzare i fogli di calcolo stia causando un tale mal di testa nei circoli accademici. Forse le versioni future di Excel includeranno un'opzione per disabilitare le funzionalità di formattazione automatica a tempo indeterminato. Fino ad allora, i genetisti dovrebbero ricontrollare il loro lavoro o considerare di passare a Fogli Google.