Parole come guardiani: misurazione di termini e significati specifici della disciplina nelle pubblicazioni accademiche

May 09 2023
Il testo accademico è spesso carico di gergo o linguaggio specializzato che può facilitare una comunicazione efficiente all'interno dei campi ma ostacolare la comprensione per gli estranei. Il gergo si evolve naturalmente in modo che ricercatori e studiosi possano trasmettere il significato in modo succinto, ma può essere una barriera tra i campi e tra gli scienziati e il pubblico in generale.
Misuriamo il gergo accademico, che consiste in tipi di parole specifici per disciplina (blu) e sensi (arancione), nel Semantic Scholar Open Research Corpus (S2ORC). L'estratto in alto a sinistra è tratto da un articolo di optoelettronica di Satishkumar et al. (2000). Colleghiamo queste misurazioni a due importanti implicazioni sociali che coinvolgono la progettazione del pubblico e il successo scientifico.

Il testo accademico è spesso carico di gergo o linguaggio specializzato che può facilitare una comunicazione efficiente all'interno dei campi ma ostacolare la comprensione per gli estranei. Il gergo si evolve naturalmente in modo che ricercatori e studiosi possano trasmettere il significato in modo succinto, ma può essere una barriera tra i campi e tra gli scienziati e il pubblico in generale.

Ad esempio, parole come junction , diode e bias sono specifiche del campo dell'optoelettronica, come mostrato nella figura sopra. In particolare, il pregiudizio è sovraccarico di diversi significati, o sensi , in tutti i campi, in quanto può riferirsi a discriminazione sociale, errata stima statistica o correnti elettriche. Nel nostro articolo , utilizziamo un approccio di elaborazione del linguaggio naturale (PNL) chiamato induzione del senso delle parole per districare i sensi delle parole e mostrare che possono essere specializzati quanto i tipi di parole specifici del campo. Definiamo il gergo come parole specifiche della disciplina e significati specifici della disciplina. Consulta il nostro documento Findings of ACL 2023per una descrizione dettagliata di come rendiamo operativo e convalidiamo la nostra misura del gergo.

Esempi di tipi di parole specifici della disciplina (sopra) e sensi delle parole specifici della disciplina (sotto). Riesci a capire quali significati sovraccarichi hanno le parole nella metà inferiore nelle loro due discipline? Guarda le tabelle complete nel nostro documento per verificare se la tua intuizione è giusta!

Misuriamo il gergo negli abstract in inglese in trecento campi di studio dal Semantic Scholar Open Research Corpus (S2ORC). Scopriamo che mentre le scienze biologiche usano tipi di parole molto distintivi, come nomi di molecole e sostanze chimiche, i sottocampi in matematica, tecnologia, fisica ed economia tendono a riutilizzare parole esistenti con significati specializzati. Ad esempio, i matematici riutilizzano parole comuni come potenza , polo , unione , superficie e origine.

Colleghiamo queste misurazioni del gergo accademico a due implicazioni sociali chiave, per mostrare l'utilità delle nostre metriche per la ricerca sulla "scienza della scienza" e la sociolinguistica computazionale, che è lo studio di come i fattori sociali si relazionano al linguaggio.

L'asse x è l'indice, o dove siamo in astratto, dall'inizio a 0 alla 100a parola. L'asse y è il "gergo" massimo medio della parola in quell'indice. Il divario tra i diversi tipi di rivista è maggiore per gli abstract in ingegneria e informatica che per quelli in medicina e biologia.

Innanzitutto, misuriamo il design del pubblico o se gli studiosi diminuiscono il loro uso del gergo a seconda di chi scrivono. Scopriamo che la maggior parte dei campi riduce il gergo quando pubblica in riviste multidisciplinari di uso generale come Nature , ma alcuni campi lo fanno più di altri. Ad esempio, nella figura sopra, l'informatica regola il contenuto pubblicato in base alla sede più di quanto non facciano la medicina e la biologia. Una possibile spiegazione di questo comportamento è che i luoghi di uso generale hanno una storia di essere guidati e dominati dalle scienze biologiche e fisiche.¹ Quindi, sebbene i luoghi di "uso generico" possano intendere essere per tutta la scienza,² ci si aspetta che alcuni campi adattare la loro lingua più di altri.

Le colonne "tipi" e "sensi" mostrano i coefficienti di regressione per le frazioni di parole o sensi specifici della disciplina negli abstract. Le variabili dipendenti sono il conteggio delle citazioni e l'impatto interdisciplinare. Vengono evidenziati i coefficienti significativamente negativi e "# obv". è il numero di osservazioni. L'entità dei coefficienti non è confrontabile tra le righe, poiché ciascuna è regressione separata. La "correzione Bonferroni" si riferisce a un tipo di correzione statistica per tenere conto di confronti multipli.

In secondo luogo, esaminiamo come il linguaggio specifico della disciplina sia associato a due distinte misure di successo scientifico: il conteggio delle citazioni e l'impatto interdisciplinare . L'impatto interdisciplinare misura la diversità dei campi che citano un documento. Abbiamo eseguito modelli di regressione separati per ogni campo, per vedere come la relazione tra gergo e successo può differire tra di loro. Sebbene la direzione della correlazione tra gergo e tassi di citazione vari, il gergo è quasi sempre correlato negativamente con l'impatto interdisciplinare.³

Combinati, i nostri risultati suggeriscono che sebbene alcuni campi non riducano il loro uso del gergo tanto quanto altri in luoghi generici, questa pratica può ostacolare la comunicazione interdisciplinare. Ciò apre una potenziale opportunità per la riconsiderazione delle norme di scrittura astratta, in particolare per i luoghi che intendono collegare le discipline.

[1] La lettera di fondazione di PLOS One e il lancio iniziale di Scientific Reports di Nature sono due esempi delle origini dei luoghi per uso generico.

[2] Ad esempio, vedi " Scopo e scopo " di Nature .

[3] Il nostro studio non è causale, ma fornisce un percorso per studi futuri sugli effetti del gergo sulle connessioni interdisciplinari.

Segui @allen_ai e @semanticscholar su Twitter e iscriviti alla newsletter di AI2 per rimanere aggiornato sulle notizie e le ricerche provenienti da AI2.