Ollama

このテストでは、Ollama上でホストされているさまざまなLLMがHugoページを英語からドイツ語に翻訳する方法を比較しています。英語からドイツ語への翻訳。

Qwen3 埋め込みモデルとreranker モデルは、Qwen ファミリー最新リリースであり、高度なテキスト埋め込み、検索、再ランク付けタスクに特じて設計されています。

PCIe レーンがLLM性能に与える影響? タスクによります。トレーニングやマルチGPUの推論では、パフォーマンスの低下が顕著です。

Ollama モデルライブラリには、HTML コンテンツを Markdown に変換できるモデルが存在します。これはコンテンツ変換タスクに役立ちます。このガイドは、2026年のドキュメンテーションツール: Markdown、LaTeX、PDFおよび印刷ワークフローハブの一部です。

ここに、AI 支援コーディングツールと AI コーディングアシスタントの良い点についていくつかリストアップします。

私はある仮説をテストしたいと思っています。すなわち、「インテルCPUのすべてのコアを活用することで、LLMの速度が向上するか？」というものです。このテストについては、ALL cores on Intel CPU would raise the speed of LLMs?をご覧ください。

新しいgemma3 27bitモデル（gemma3:27b、ollama上では17GB）が私のGPUの16GB VRAMに収まらず、部分的にCPU上での実行に頼っているという点が気になります。

このガイドでは、Ollamaが並列リクエストをどのように処理するか（並行処理、キューイング、リソース制限）および**OLLAMA_NUM_PARALLEL環境変数**（および関連する設定）を使用してチューニングする方法を説明します。

DeepSeekの 1世代目の推論モデルで、OpenAI-o1と同等の性能を備えています。これは、LlamaおよびQwenに基づいてDeepSeek-R1から蒸留された6つの密結合モデルです。

この Ollama CLI チートシート は、毎日使用するコマンド（ollama ls、ollama serve、ollama run、ollama ps、モデル管理、一般的なワークフローなど）に焦点を当てており、コピー＆ペーストできる例を備えています。

Reranking は、Retrieval Augmented Generation (RAG) システムにおける 2 番目のステップであり、Retrieval（検索）と Generation（生成）の間に位置します。

素晴らしい料理は目でも楽しむことができます。しかし、この記事では、2 つの AI ベースの検索システム、Farfalle と Perplexica を比較します。

それはとても素晴らしいことです！ Copilot や Perplexity.ai を呼び出して、世界中に何を求めているかを知られる代わりに、今ではご自身の PC やラップトップで同様のサービスをホストできるようになりました！

最近、いくつかの新しいLLMがリリースされました。
非常にエキサイティングな時代です。
論理的誤謬の検出能力を確認するためにテストしてみましょう。

まだ、LLMがあなたの意図を理解しようとする際に混乱しないようにするための、良いプロンプトを書くためのいくつかの一般的なアプローチがあります。

Hugoページ翻訳品質の比較 - Ollama上のLLM