技術用語

ollama

オラマ

ローカル PC で LLM を 1 コマンド実行できる配布・実行ツールです。

体験区分：触った推奨読者レベル：Level 3-5

`ollama run llama3` の 1 行でモデルを取得・起動します。NVIDIA CUDA・Mac Metal など GPU 高速化にも対応します。

API 課金なしでローカル LLM を試したい場面で登場します。Claude Code や MCP の呼び出し先として設定でき OpenAI 互換 API も提供します。

イメージ

開発フローでの位置

モデル取得

→

起動確認

→

API 接続

→

ツール連携

2026.04·needs_review

「ollama でローカルに Llama 3 を入れたら、API 課金なしで補助が効きました。」

ollamaの見方

363

この用語の見どころ

役割

ローカル PC 上で LLM を取得・実行する配布ランタイムです。

うれしさ

API 課金なしでモデルを試せ、オフライン環境でも動作します。

注意点

大きいモデルは VRAM 不足でクラッシュするため、量子化バリアント選びが重要です。

どこで役立つか

Claude Code や MCP サーバーのローカル LLM 連携先として機能します。

はじめに

`ollama run llama3` で動作確認し、`ollama list` でサイズを確認します。

深掘り先

llama.cpp、VRAM、GGUF 量子化

非エンジニアのつまずき

私のコメント