AI - Page 4 - Rost Glukhov | 個人サイトとテクニカルブログ

AIの未来は、単にスマートなモデルだけでなく、スマートなシリコンによっても決まる。LLM推論専用のハードウェアは、ビットコインマイニングがASICに移行したときと同様の革命をもたらしている。

「DGX Spark vs. Mac Studio: NVIDIAの個人用AIスーパーコンピュータの価格比較」

NVIDIA DGX Spark は現実のものであり、2025年10月15日に販売開始され、CUDA開発者向けに、統合されたNVIDIA AIスタックを使用してローカルLLM作業を行う必要がある人を対象としています。US MSRPは**$3,999**; UK/DE/JPの小売価格はVATとチャネルの影響で高くなっています。AUD/KRWの公開価格はまだ広く掲載されていません。

このガイドでは、利用可能な Go SDK for Ollama の包括的な概要を提供し、それらの機能セットを比較します。

ここに Qwen3:30b と GPT-OSS:20b の比較を示します。指示の遵守とパフォーマンスのパラメータ、仕様、速度に焦点を当てています。

OllamaのGPT-OSSモデルは、LangChainやOpenAI SDK、vllmなどのフレームワークと使用する際に、構造化された出力を処理する際に繰り返し問題が発生しています。

構造化された出力でLLMを制約する：Ollama、Qwen3およびPythonまたはGo

大規模言語モデル（LLM）は強力ですが、実運用では自由な形式の段落はほとんど使いません。代わりに、予測可能なデータ：属性、事実、またはアプリにフィードできる構造化されたオブジェクトを望みます。それはLLM構造化出力です。

Ollama 新バージョン v0.12.1 におけるメモリ割り当てとモデルスケジューリング

ここでは、新しいバージョンのOllamaがモデルに対してどのくらいのVRAMを割り当てているかについて、Ollama VRAM割り当てと以前のOllamaバージョンを比較しています。新しいバージョンは、以前のバージョンよりも劣っています。

Ollama は、LLM をローカルで実行するためのツールとして、非常に人気のあるツールの一つとなっています。
シンプルな CLI と、モデル管理の簡素化により、クラウド外で AI モデルと仕事をしたい開発者にとっての定番のオプションとなっています。

ローカルにホストされた Ollama は、あなたのマシン上で大規模言語モデルを実行できるが、コマンドライン経由での使用はユーザーにとって使いにくい。
以下に、ローカルの Ollama に接続するための、いくつかのオープンソースプロジェクトが提供する ChatGPTスタイルのインターフェース がある。