Pythonでの並行性-はじめに
この章では、Pythonでの並行性の概念を理解し、さまざまなスレッドとプロセスについて学習します。
並行性とは何ですか?
簡単に言うと、並行性とは、2つ以上のイベントが同時に発生することです。多くのイベントが常に同時に発生するため、並行性は自然現象です。
プログラミングの観点から、並行性とは、2つのタスクの実行が重複する場合です。並行プログラミングを使用すると、前の要求が完了するのを待つのではなく、要求を同時に処理できるため、アプリケーションとソフトウェアシステムのパフォーマンスを向上させることができます。
並行性の歴史的レビュー
以下のポイントは、並行性の簡単な歴史的レビューを提供します-
鉄道の概念から
並行性は、鉄道の概念と密接に関連しています。鉄道では、すべての列車が目的地に安全に到着できるように、同じ鉄道システムで複数の列車を処理する必要がありました。
アカデミアにおける並行コンピューティング
コンピュータサイエンスの並行性への関心は、1965年にEdsger W. Dijkstraによって発行された研究論文から始まりました。この論文では、並行性制御の特性である相互排除の問題を特定して解決しました。
高レベルの並行性プリミティブ
最近、プログラマーは、高レベルの並行性プリミティブの導入により、改善された並行性ソリューションを取得しています。
プログラミング言語との並行性の向上
GoogleのGolang、Rust、Pythonなどのプログラミング言語は、より優れた並行ソリューションの取得に役立つ分野で驚異的な発展を遂げました。
スレッド&マルチスレッドとは何ですか?
Threadは、オペレーティングシステムで実行できる実行の最小単位です。それ自体はプログラムではありませんが、プログラム内で実行されます。言い換えれば、スレッドは互いに独立していません。各スレッドは、コードセクションやデータセクションなどを他のスレッドと共有します。それらは軽量プロセスとしても知られています。
スレッドは次のコンポーネントで構成されています-
次の実行可能命令のアドレスで構成されるプログラムカウンタ
Stack
レジスタのセット
一意のID
Multithreading一方、CPUは、複数のスレッドを同時に実行することにより、オペレーティングシステムの使用を管理できます。マルチスレッドの主なアイデアは、プロセスを複数のスレッドに分割することによって並列処理を実現することです。マルチスレッドの概念は、次の例を使用して理解できます。
例
MSWordを開いてコンテンツを入力する特定のプロセスを実行しているとします。1つのスレッドがMSWordを開くために割り当てられ、別のスレッドがコンテンツを入力するために必要になります。そして今、既存のものを編集したい場合は、編集タスクなどを行うために別のスレッドが必要になります。
プロセス&マルチプロセッシングとは何ですか?
Aprocessは、システムに実装される基本的な作業単位を表すエンティティとして定義されます。簡単に言うと、コンピュータプログラムをテキストファイルで記述し、このプログラムを実行すると、プログラムに記載されているすべてのタスクを実行するプロセスになります。プロセスのライフサイクル中に、開始、準備、実行、待機、終了などのさまざまな段階を通過します。
次の図は、プロセスのさまざまな段階を示しています-
プロセスは、プライマリスレッドと呼ばれる1つのスレッドのみ、または独自のレジスタ、プログラムカウンタ、およびスタックのセットを持つ複数のスレッドを持つことができます。次の図は違いを示しています-
Multiprocessing,一方、単一のコンピュータシステム内で2つ以上のCPUユニットを使用することです。私たちの主な目標は、ハードウェアから最大限の可能性を引き出すことです。これを実現するには、コンピューターシステムで利用可能なCPUコアの全数を利用する必要があります。マルチプロセッシングは、そうするための最良のアプローチです。
Pythonは、最も人気のあるプログラミング言語の1つです。以下は、並行アプリケーションに適した理由です。
シンタックスシュガー
シンタックスシュガーは、プログラミング言語内の構文であり、読みやすく、表現しやすくするように設計されています。それは言語を人間が使用するために「より甘く」します:物事はより明確に、より簡潔に、または好みに基づいた代替スタイルで表現することができます。Pythonには、オブジェクトに作用するように定義できるMagicメソッドが付属しています。これらのMagicメソッドは、構文糖衣構文として使用され、より理解しやすいキーワードにバインドされます。
大規模なコミュニティ
Python言語は、AI、機械学習、ディープラーニング、定量分析の分野で活躍するデータサイエンティストや数学者の間で、非常に多くの採用率を誇っています。
並行プログラミングに役立つAPI
Python 2および3には、並列/並行プログラミング専用の多数のAPIがあります。それらの中で最も人気があるのはthreading, concurrent.features, multiprocessing, asyncio, gevent and greenlets, 等
並行アプリケーションの実装におけるPythonの制限
Pythonには、並行アプリケーションの制限があります。この制限はGIL (Global Interpreter Lock)Python内に存在します。GILではCPUの複数のコアを利用することはできません。したがって、Pythonには真のスレッドはないと言えます。GILの概念は次のように理解できます-
GIL(グローバルインタープリターロック)
これは、Pythonの世界で最も物議を醸しているトピックの1つです。CPythonでは、GILはミューテックス(相互排除ロック)であり、スレッドセーフになります。言い換えれば、GILは複数のスレッドがPythonコードを並行して実行することを防いでいると言えます。ロックは一度に1つのスレッドのみが保持でき、スレッドを実行する場合は、最初にロックを取得する必要があります。以下に示す図は、GILの動作を理解するのに役立ちます。
ただし、Pythonには次のようないくつかのライブラリと実装があります。 Numpy, Jpython そして IronPytbhon. これらのライブラリは、GILとの相互作用なしで機能します。