Copilot+ PCのDell 14 Plus 2-in-1をモニターしたので、Bonsai 8B を OpenVINO で NPU で使ってみた

2026/06/06 10:06

Dell 14 Plus 2-in-1でBonsai 8BをOpenVINO経由でCPU/GPU/NPU比較し、速度と温度を検証した記録です。

Copilot+ PCは内蔵NPUを使って、Windows標準アプリのAI対応機能を利用できるPCです。今回は、最新のAIモデルであるBonsai 8Bを使って、NPUがどの程度活かせるかを検証しました。

環境

OS: Windows
作業ディレクトリ: c:\home\bonsai
仮想環境: c:\home\bonsai\.venv
OpenVINO が認識したデバイス: CPU, GPU, NPU
主なバージョン:
- openvino 2026.1.0
- openvino-genai 2026.1.0.0
- optimum-intel 1.27.0

URL: https://docs.openvino.ai/2026/openvino-workflow-generative/inference-with-optimum-intel.html
確認した内容:
- OpenVINO で Hugging Face 系モデルを扱う方法
- OVModelForCausalLM や optimum-cli export openvino の基本
- device="GPU" のように推論デバイスを切り替える考え方

URL: https://github.com/helena-intel/readmes/blob/main/openvino_llm_model_export_npu.md
確認した内容:
- NPU 向けには static shape 前提
- INT4 + symmetric が推奨
- 大きめモデルでは --group-size -1 が推奨
- 推論時は openvino_genai.LLMPipeline と llm_chat.py を使う流れ

10回版の計測結果:

Device	Total Time	Avg / Iter	Chars / Sec
CPU	134.10s	13.410s	74
GPU	73.41s	7.341s	128
NPU	125.10s	12.510s	81

出力量の目安:

CPUパッケージの温度変化:

CPUとNPUはほぼ同じ速度でしたが、CPUパッケージ温度だけ見るとNPUの方が低く、電力効率の観点では有利そうでした。CPUコアとは独立して動作できる点も、並列処理の観点で魅力があります。

一方で内蔵GPUは、温度はNPUより少し高いものの、性能面では圧倒的でした。今後NPU向けの軽量ビルド済みモデルが増えてくると、Copilot+ PCはさらに使いやすい選択肢になりそうです。