Słowa jako strażnicy: mierzenie terminów i znaczeń specyficznych dla danej dyscypliny w publikacjach naukowych
Tekst naukowy jest często pełen żargonu lub specjalistycznego języka, który może ułatwić skuteczną komunikację w danej dziedzinie, ale utrudnia zrozumienie osobom z zewnątrz. Żargon naturalnie ewoluuje, aby badacze i naukowcy mogli zwięźle przekazywać znaczenie, ale może to stanowić barierę między dziedzinami oraz między naukowcami a ogółem społeczeństwa.
Na przykład słowa takie jak złącze , dioda i polaryzacja są specyficzne dla dziedziny optoelektroniki, jak pokazano na powyższym rysunku. W szczególności stronniczość jest przeładowana różnymi znaczeniami lub sensami w różnych dziedzinach, ponieważ może odnosić się do dyskryminacji społecznej, błędnej oceny statystycznej lub prądów elektrycznych. W naszym artykule używamy metody przetwarzania języka naturalnego (NLP) zwanej indukcją sensu słów , aby rozplątać znaczenia słów i pokazać, że mogą one być tak wyspecjalizowane, jak typy słów specyficzne dla danej dziedziny. Definiujemy żargon zarówno jako słowa specyficzne dla danej dyscypliny, jak i jej specyficzne znaczenia. Zobacz naszą analizę dokumentu ACL 2023aby uzyskać szczegółowy opis tego, jak operacjonalizujemy i sprawdzamy naszą miarę żargonu.
Mierzymy żargon w angielskich abstraktach z trzystu dziedzin nauki z Semantic Scholar Open Research Corpus (S2ORC). Odkryliśmy, że podczas gdy nauki biologiczne używają bardzo charakterystycznych typów słów, takich jak nazwy cząsteczek i chemikaliów, poddziedziny matematyki, technologii, fizyki i ekonomii mają tendencję do ponownego wykorzystywania istniejących słów o specjalistycznych znaczeniach. Na przykład matematycy zmieniają znaczenie popularnych słów, takich jak potęga , biegun , suma , powierzchnia i pochodzenie.
Łączymy te pomiary żargonu naukowego z dwoma kluczowymi implikacjami społecznymi, aby pokazać użyteczność naszych wskaźników dla badań „naukowych” i socjolingwistyki obliczeniowej, która jest badaniem, w jaki sposób czynniki społeczne odnoszą się do języka.
Po pierwsze, mierzymy projekt publiczności lub to, czy uczeni zmniejszają użycie żargonu w zależności od tego, dla kogo piszą. Odkryliśmy, że większość dziedzin ogranicza żargon podczas publikowania w multidyscyplinarnych czasopismach ogólnego przeznaczenia, takich jak Nature , ale niektóre dziedziny robią to częściej niż inne. Na przykład na powyższym rysunku informatyka dostosowuje publikowane treści w oparciu o miejsce bardziej niż medycyna i biologia. Możliwym wyjaśnieniem tego zachowania jest to, że obiekty ogólnego przeznaczenia mają historię kierowania i zdominowania przez nauki biologiczne i fizyczne¹. Tak więc, chociaż obiekty „ogólnego przeznaczenia” mogą być przeznaczone dla całej nauki², oczekuje się, że niektóre dziedziny dostosować swój język bardziej niż inni.
Po drugie, badamy, w jaki sposób język specyficzny dla danej dyscypliny jest powiązany z dwiema różnymi miarami sukcesu naukowego: liczbą cytowań i oddziaływaniem interdyscyplinarnym . Wpływ interdyscyplinarny mierzy różnorodność dziedzin, w których artykuł jest cytowany. Przeprowadziliśmy osobne modele regresji dla każdej dziedziny, aby zobaczyć, jak mogą się różnić relacje między żargonem a sukcesem. Chociaż kierunek korelacji między żargonem a wskaźnikami cytowań jest różny, żargon jest prawie zawsze ujemnie skorelowany z oddziaływaniem interdyscyplinarnym³.
Podsumowując, nasze odkrycia sugerują, że chociaż niektóre dziedziny nie ograniczają używania żargonu tak bardzo, jak inne w miejscach ogólnego przeznaczenia, praktyka ta może utrudniać komunikację interdyscyplinarną. Otwiera to potencjalną okazję do ponownego rozważenia norm pisania abstrakcyjnego, zwłaszcza w miejscach, które zamierzają łączyć dyscypliny.
[1] List założycielski PLOS One i pierwsze wydanie raportów naukowych przez Nature to dwa przykłady pochodzenia miejsc ogólnego przeznaczenia.
[2] Na przykład patrz „ Cel i zakres ” Nature .
[3] Nasze badanie nie jest przyczynowe, ale wskazuje drogę do przyszłych badań nad wpływem żargonu na interdyscyplinarne połączenia.
Śledź @allen_ai i @semanticscholar na Twitterze i subskrybuj biuletyn AI2 , aby być na bieżąco z wiadomościami i badaniami AI2.