門番としての言葉: 学術出版物における専門分野固有の用語と意味の測定

May 09 2023
学術文書には専門用語や専門用語が多く含まれていることが多く、分野内での効率的なコミュニケーションは促進されますが、部外者にとっては理解を妨げる可能性があります。専門用語は、研究者や学者が意味を簡潔に伝えることができるように自然に進化しますが、分野間、および科学者と一般の間の障壁となる場合があります。
私たちは、Semantic Sc​​holar Open Research Corpus (S2ORC) で、専門分野固有の単語の種類 (青) と語義 (オレンジ) で構成される学術専門用語を測定します。左上の抜粋は、Satishkumar らによるオプトエレクトロニクス論文からのものです。(2000年)。私たちはこれらの測定結果を、視聴者設計と科学的成功に関わる 2 つの重要な社会的影響と関連付けます。

学術文書には専門用語や専門用語が多く含まれていることが多く、専門用語は分野内での効率的なコミュニケーションを促進しますが、部外者にとっては理解を妨げる可能性があります。専門用語は、研究者や学者が意味を簡潔に伝えることができるように自然に進化しますが、分野間、および科学者と一般の間の障壁となる場合があります。

たとえば、上の図に示すように、接合ダイオード、バイアスなどの単語はオプトエレクトロニクスの分野に特有のものです。特に、バイアスは社会的差別、統計上の誤った推定、または電流を指す場合があるため、分野を超えてさまざまな意味や意味が詰め込まれています。私たちの論文では、語義誘導と呼ばれる自然言語処理 (NLP) アプローチを使用して語の意味を解きほぐし、分野固有の語の種類と同じように特殊化できることを示します。私たちは専門用語を専門分野固有の単語と専門分野固有の意味の両方として定義します。ACL 2023 の調査結果に関する論文をご覧ください。専門用語の測定方法を運用および検証する方法について詳しく説明します。

専門分野固有の単語の種類 (上) と専門分野固有の語義 (下) の例。下半分の単語が 2 つの分野にわたってどのような過剰な意味を持っているか理解できますか? あなたの直感が正しいかどうかを確認するには、論文の全表を参照してください。

私たちは、Semantic Sc​​holar Open Research Corpus (S2ORC)の 300 の研究分野にわたる英語の抄録内の専門用語を測定します。生物科学では分子や化学物質の名前など、非常に特徴的な単語の種類が使用されますが、数学、技術、物理学、経済学のサブ分野では、特殊な意味を持つ既存の単語が再利用される傾向があることがわかりました。たとえば、数学者は、powerpoleunionsurfaceorigin などの一般的な単語を再利用します。

私たちは、学術用語のこれらの測定値を 2 つの重要な社会的意味に結び付け、「科学の科学」研究と、社会的要因が言語にどのように関係するかを研究する計算社会言語学に対する私たちの測定基準の有用性を示します。

X 軸はインデックス、つまり要約のどこにいるのか、先頭の 0 から 100 番目の単語までです。y 軸は、そのインデックスにおける単語の最大「専門用語らしさ」の平均値です。ジャーナルの種類間のギャップは、医学や生物学の抄録よりも工学やコンピュータ サイエンスの抄録の方が大きくなります。

まず、読者のデザイン、つまり学者が誰に向けて書いているかに応じて専門用語の使用を減らすかどうかを測定します。Natureなどの汎用の学際的なジャーナルに掲載する際、ほとんどの分野では専門用語が削減されていますが、一部の分野では他の分野よりも専門用語が削減されていることがわかりました。たとえば、上の図では、コンピュータ サイエンスは医学や生物学よりも開催地に基づいて公開コンテンツを調整しています。この行動について考えられる説明は、汎用会場には生物科学と物理科学が主導し、支配してきた歴史があるということです¹。つまり、「汎用」会場は科学全体を対象とするつもりかもしれませんが、¹ 一部の分野は期待されています。彼らの言語を他の人よりも適応させるためです。

「タイプ」と「センス」の列には、要約内の専門分野固有の単語またはセンスの部分の回帰係数が表示されます。従属変数は引用数と学際的な影響です。著しく負の係数は強調表示され、「# obv.」と表示されます。観測値の数です。それぞれが個別の回帰であるため、係数の大きさは行間で比較できません。「ボンフェローニ補正」とは、多重比較を考慮した統計補正の一種を指します。

次に、専門分野固有の言語が科学的成功の 2 つの異なる尺度、つまり引用数と学際的な影響とどのように関連しているかを検証します。学際的な影響力は、論文を引用する分野の多様性を測定します。私たちは分野ごとに個別の回帰モデルを実行し、専門用語と成功の関係が分野間でどのように異なるかを確認しました。専門用語と引用率の相関関係の方向はさまざまですが、専門用語はほぼ常に、学際的な影響力と負の相関関係にあります。

総合すると、私たちの調査結果は、一部の分野では専門用語の使用が他の一般的な目的の場ほど減少していないにもかかわらず、この慣行が学際的なコミュニケーションを妨げる可能性があることを示唆しています。これは、特に分野間の橋渡しを目的とする会場にとって、要約執筆の規範を再考する潜在的な機会を開きます。

[1] PLOS Oneの設立書簡と Nature によるScientific Reportsの最初の立ち上げは、汎用会場の起源の 2 つの例です。

[2] たとえば、Natureの「目的と範囲」を参照してください。

[3] 私たちの研究は因果関係ではありませんが、専門用語が学際的なつながりに及ぼす影響に関する将来の研究への道筋を提供します。

Twitter で@allen_ai@semanticscholarをフォローし、 AI2 ニュースレターを購読して、AI2 から発信されるニュースや研究の最新情報を入手してください。