NPU とは何ですか? 大手テクノロジー企業が突然 NPU に夢中になっているのはなぜですか?

May 31 2024

「ニューラルプロセッシングユニット」は、「AI PC」や「AI スマートフォン」の次なる目玉として推進されていますが、クラウドベースの AI の必要性がなくなるわけではありません。

ニューラルプロセッシングユニットは現在 CPU の一部であり、機械学習プロセスを処理するように特別に設計されています。

ジャンプ

NPU とは何ですか? NPU はどのくらい前から存在していますか? NPU の話題

CPU があります。GPU があります。過去 1 年間、あらゆるテクノロジー企業が「NPU」について語ってきました。最初の 2 つを知らなかった人は、3 つ目について、そしてテクノロジー業界全体がニューラルプロセッシングユニットの利点を称賛する理由について、おそらく困惑しているでしょう。ご想像のとおり、これはすべて AI をめぐる進行中の誇大宣伝サイクルによるものです。しかし、テクノロジー企業はこれらの NPU の機能や、なぜユーザーが関心を持つべきかを説明するのがかなり苦手です。

NPUと「TOPS」の説明

Qualcomm は、Snapdragon X Elite チップがライブ文字起こしなどの AI プロセスをどのように処理できるかを公開しました。

そこでまず、裏で働いている人たちに、通常の PC のコンピューティング能力について簡単に説明しましょう。CPU、つまり「中央処理装置」は、基本的に、ユーザーのタスクのほとんどを処理するコンピューターの「頭脳」です。GPU、つまり「グラフィック処理装置」は、3D オブジェクトのレンダリングやビデオゲームのプレイなど、大量のデータを必要とするタスクの処理に特化しています。GPU は、PC 内の独立したユニットである場合もあれば、CPU 自体に同梱されている場合もあります。

このように、NPU は特殊性という点では GPU に近いですが、少なくとも現時点では、中央処理装置またはグラフィック処理装置の外部に独立したニューラルプロセッサはありません。これは、機械学習アルゴリズムに特有の数学的計算を処理するように設計されたプロセッサの一種です。これらのタスクは「並列」に処理されます。つまり、リクエストを小さなタスクに分割し、それらを同時に処理します。これは、他のシステムのプロセッサを一切利用せずに、ニューラルネットワークの厳しい要求を処理するように特別に設計されています。

NPU の速度を判断する基準は TOPS、つまり「1 秒あたり兆回の演算」です。現在、これは大手テクノロジー企業が自社のニューラル処理能力を互いに比較する唯一の方法です。また、これは処理速度を比較する非常に簡略化された方法でもあります。CPU と GPU は、コアの数や種類から一般的なクロック速度やテラフロップスまで、さまざまな比較ポイントを提供しますが、それでもチップアーキテクチャに伴う複雑さの表面をかすめるだけです。Qualcomm は、 TOPS はニューラルプロセッサの速度と精度を組み合わせた簡単な数式にすぎないと説明しています。

おそらくいつか、CPU や GPU と同じ粒度の NPU が登場するでしょうが、それは現在の AI の誇大宣伝サイクルが終わった後かもしれません。そしてその時でも、プロセッサの区分はどれも確定していません。また、基本的に GPU と NPU の機能を組み合わせた GPNPU というアイデアもあります。すぐに、小型の AI 対応 PC の機能を、数百または数千の TOPS を処理できる大型の PC に分割する必要が出てくるでしょう。

NPUは数年前から携帯電話とPCの両方で使われてきました

Apple は、M4 より何年も前から M シリーズチップに NPU 機能を搭載していました。

スマートフォンも、ほとんどの人や企業が関心を持つずっと前から NPU を使っていた。Google はPixel 2 の頃から NPU と AI 機能について語っていた。中国中心の Huawei と Asus は、2017 年のMate 10 や 2018 年のZenphone 5 などのスマートフォンで NPU を初めて採用した。当時、両社は両デバイスで AI 機能を推進しようとしたが、顧客やレビュー担当者は、現在よりもその機能に懐疑的だった。

確かに、今日の NPU は 6 年前や 8 年前よりもはるかに強力になっていますが、注意を払っていなければ、これらのデバイスのほとんどのニューラル能力は見逃されていたでしょう。

コンピュータチップは、2023年より何年も前からニューラルプロセッサを搭載している。たとえば、AppleのMシリーズCPU、同社独自のARCベースチップは、2020年にすでにニューラル機能をサポートしていた。M1チップは11 TOPS、M2とM3はそれぞれ15.8 TOPSと19 TOPSだった。Appleが最新のニューラルエンジンの38 TOPSの速度を自慢する必要があると判断したのは、新しいiPad Pro 2024に搭載されたM4チップになってからである。では、どのiPad Pro AIアプリケーションがその新しい機能を本当に活用しているのだろうか？正直なところ、多くはない。おそらく数週間後のWWDC 2024でさらに詳しく見られるだろうが、それは待って見るしかない。

現在のNPUへの執着は、ハードウェアと誇大広告の両方である

Google は今年の I/O で、AI ベースの新しい「Ask Photos」機能を披露した。

NPU の背後にある考え方は、デバイス上の AI を実行する負担を CPU や GPU から取り除き、ユーザーが AI アートジェネレーターやチャットボットなどの AI プログラムを PC の速度を低下させることなく実行できるようにすることです。問題は、私たち全員が、強化された AI 機能を使用できる真の AI プログラムをまだ探し求めているということです。

Gizmodo は過去 1 年間、主要なチップメーカーと話し合いを重ねてきましたが、ハードウェアメーカーは今回初めて、ソフトウェアの需要を上回ったと感じている、という声が聞こえてきます。長い間、その逆でした。ソフトウェアメーカーは、消費者向けハードウェアで利用できるものの限界を押し広げ、チップメーカーに追いつこうと迫っていました。

しかし、2023年以降、デバイス上で実行できるAIアプリケーションはごくわずかしか見られなくなりました。QualcommやIntelのチップのAI機能のデモのほとんどは、通常、Zoomの背景ぼかし機能の実行を伴います。最近では、Audacityなどの既存のアプリケーションでAI音楽ジェネレーターモデルRiffusionを使用したり、OBS Studioのライブキャプションを使用してNPUをベンチマークしている企業を見ました。もちろん、デバイス上で実行できるチャットボットを実行しているアプリはいくつかありますが、それほど機能がなく、ニュアンスに富んでいないLLMは、最新の新しいスマートフォンや「AI PC」をみんなが買い求めるような巨大なキラーアプリのようには思えません。

代わりに、 PixelスマートフォンのGemini Nanoでは、テキストや音声の要約など、比較的単純なアプリケーションしか使用できません。GoogleのAIの最小バージョンは、Pixel 8とPixel 8a に搭載されます。かつてはGalaxy S24専用だったSamsungのAI機能は、すでに古いスマートフォンに搭載されており、まもなく同社のウェアラブルにも搭載される予定です。古いデバイスでのこれらのAI機能の速度をベンチマークしたことはありません。しかし、2021年までさかのぼる古いデバイスにはすでに十分なニューラル処理能力があったことを示しています。

デバイス上の AI は、依然として消費者向け製品の処理能力不足によって妨げられている。Microsoft、OpenAi、Google は、より高度な LLM や、Gemini Advanced や GPT 4o などのモデルを使用したチャットボットを処理するために、H100 などのNvidia の高度な AI GPU を数百基搭載した大規模なデータセンターを運用する必要がある(Microsoft と他の企業は独自の AI チップに取り組んでいると報じられている ) 。これは、お金の面でも、電力や水などのリソースの面でも安くはないが、だからこそ、消費者が支払える高度な AI の多くがクラウドで実行されているのだ。デバイス上で AI を実行することは、ユーザーと環境の両方に利益をもたらす。消費者が最新かつ最高の AI モデルを求めていると企業が考えれば、ソフトウェアは消費者向けデバイスで可能な範囲を超え続けるだろう。

NPU とは何ですか? 大手テクノロジー企業が突然 NPU に夢中になっているのはなぜですか?

関連性のあるコンテンツ

関連性のあるコンテンツ

NPUと「TOPS」の説明

NPUは数年前から携帯電話とPCの両方で使われてきました

現在のNPUへの執着は、ハードウェアと誇大広告の両方である