`ollama run llama3` の 1 行でモデルを取得・起動します。NVIDIA CUDA・Mac Metal など GPU 高速化にも対応します。
`ollama run llama3` の 1 行でモデルを取得・起動します。NVIDIA CUDA・Mac Metal など GPU 高速化にも対応します。
API 課金なしでローカル LLM を試したい場面で登場します。Claude Code や MCP の呼び出し先として設定でき OpenAI 互換 API も提供します。
ローカル PC 上で LLM を取得・実行する配布ランタイムです。
API 課金なしでモデルを試せ、オフライン環境でも動作します。
大きいモデルは VRAM 不足でクラッシュするため、量子化バリアント選びが重要です。
Claude Code や MCP サーバーのローカル LLM 連携先として機能します。
`ollama run llama3` で動作確認し、`ollama list` でサイズを確認します。
llama.cpp、VRAM、GGUF 量子化
モデルの提供状況(対応モデル名・バリアント)は頻繁に変わる時変情報のため、具体的なモデル名列挙は避けブリーフ記載の代表例にとどめた OpenAI 互換エンドポイントのデフォルトポートは `11…