AI - Rost Glukhov | 個人サイトとテクニカルブログ

Open WebUIは、拡張性が高く、機能豊富な自己ホスト型のウェブインターフェースで、大規模言語モデルとやり取りするのに最適です。

メルボルンのテクノロジーコミュニティは2026年においても、ソフトウェア開発、クラウドコンピューティング、AI、サイバーセキュリティ、そして新興技術にわたる会議、ミートアップ、ワークショップの豊富なラインナップにより、活気に満ちています。

vLLM は、UC BerkeleyのSky Computing Labが開発した、大規模言語モデル（LLM）向けの高スループットでメモリ効率の良い推論およびサービングエンジンです。

DGX Spark AUの価格：主要小売店では6,249ドルから7,999ドルまで

NVIDIA DGX Spark (GB10 Grace Blackwell)はオーストラリアで今すぐ購入可能の主要PC小売店で在庫あり。

グローバルDGX Sparkの価格と入手方法をご存知の方は、オーストラリアの価格がストレージ構成や小売店によって 6,249〜7,999オーストラリアドル と幅があることをご存知でしょう。

AI生成コンテンツの増加により、新たな課題が生じています。それは、本物の人の書き方と「AIスロップ」（https://www.glukhov.org/ja/post/2025/12/ai-slop-detection/ “AIスロップ”）を区別することです。AIスロップとは、低品質で大量生産された合成テキストのことです。

CogneeはPythonフレームワークで、LLMを使用してドキュメントから知識グラフを構築するためのものです。しかし、これは自社ホストされたモデルと互換性があるのでしょうか？

LLM（大規模言語モデル）を本番環境で使用する際には、構造化された、型安全な出力を得ることが極めて重要です。
BAMLおよびInstructorという2つの人気のあるフレームワークは、この問題に対して異なるアプローチを取ります。

最適なLLMの選定は、グラフ構築の品質、幻覚率、ハードウェアの制約をバランスよく考慮する必要があります。
Cogneeは、Ollama](https://www.glukhov.org/ja/post/2024/12/ollama-cheatsheet/ “Ollama cheatsheet”)を通じて32B以上の低幻覚モデルで優れたパフォーマンスを発揮しますが、軽量な構成では中規模のオプションも利用可能です。

Jupyter Notebookの生産性を飛躍的に向上させるために、データサイエンスおよび開発体験を変革するための必須のショートカット、マジックコマンド、ワークフローのヒントをご活用ください。

OllamaのPythonライブラリは、今やOLlama web searchのネイティブな機能を含んでいます。わずか数行のコードで、ローカルのLLMをインターネット上のリアルタイム情報を補完し、幻覚を減らし、正確性を向上させることができます。

正しいベクトルストアを選択することで、RAGアプリケーションの性能、コスト、拡張性が大きく左右されます。この包括的な比較では、2024年～2025年の最も人気のあるオプションをカバーしています。

OllamaのWeb検索APIは、ローカルLLMにリアルタイムのウェブ情報を補完する機能を提供します。このガイドでは、GoでのWeb検索の実装について、単純なAPI呼び出しからフル機能の検索エージェントまでの実装方法を示します。

2025年後半にかけて、メモリ市場はかつてない価格のボラティリティに直面しています。すべてのセグメントにわたってRAMの価格が急騰しており、RAM価格の急騰が深刻な状況となっています。

ローカルLLMホスティング：2025年完全ガイド - Ollama、vLLM、LocalAI、Jan、LM Studio など

ローカルでのLLMの展開は、開発者や組織がプライバシーの向上、レイテンシーの低減、AIインフラストラクチャの制御の強化を求めるにつれて、ますます人気になっています。

AIおよび機械学習（ML）ワークロードがますます複雑になるにつれて、強固なオーケストレーションシステムの必要性が高まっています。Goのシンプルさ、パフォーマンス、並行処理能力は、MLパイプラインのオーケストレーションレイヤーを構築する際に理想的な選択肢です。モデル自体がPythonで書かれている場合でも、Goは理想的な選択肢です。https://www.glukhov.org/ja/post/2025/11/go-microservices-for-ai-ml-orchestration-patterns/ “Go in ML orchestration pipelines”。

クロスモーダル埋め込みは、人工知能において画期的な進展をもたらし、統一された表現空間内で異なるデータタイプ間の理解と推論を可能にします。

AI

オープンウェブUI: 自己ホスト型LLMインターフェース

2026年にメルボルンで参加すべきテクノロジーイベント

vLLMクイックスタート: 高性能LLMサービング

DGX Spark AUの価格：主要小売店では6,249ドルから7,999ドルまで

AIスロープの検出：技術と警鐘

セルフホスティングされたCognee：LLM性能テスト

「BAML 対インストラクター：構造化されたLLM出力」

「Cogneeに最適なLLMの選定：ローカルでのOllamaセットアップ」

Jupyter Notebook チートシート

PythonでOllama Web Search APIを使用する

RAG用ベクターストアの比較

GoでOllama Web Search APIを使用する

RAM価格の急騰：2025年には最大619％上昇

ローカルLLMホスティング：2025年完全ガイド - Ollama、vLLM、LocalAI、Jan、LM Studio など

AI/MLオーケストレーション用のGoマイクロサービス

クロスモーダル埋め込み: AIモダリティの橋渡し