Ollama

开放 WebUI：自托管 LLM 界面

Open WebUI 是一个功能强大、可扩展且功能丰富的自托管网页界面，用于与大型语言模型进行交互。

DGX Spark AU 价格：主要零售商处为 6,249 至 7,999 美元

NVIDIA DGX Spark (GB10 Grace Blackwell) 现已在澳大利亚 now available in Australia 主要电脑零售商处有现货销售。如果你一直在关注全球 DGX Spark 价格和供货情况, 你可能会对澳大利亚的价格感兴趣，价格范围从 6,249 至 7,999 澳元，具体取决于存储配置和零售商。

自托管 Cognee：LLM 性能测试

Cognee 是一个 Python 框架，用于使用 LLM 从文档中构建知识图谱。但它能与自托管模型一起使用吗？

BAML 与 Instructor：结构化大语言模型输出

在生产环境中使用大型语言模型时，获取结构化、类型安全的输出至关重要。
两个流行的框架——BAML 和 Instructor——采用不同的方法来解决这个问题。

为Cognee选择合适的LLM：本地Ollama设置

选择最适合 Cognee 的 LLM 需要平衡图构建质量、幻觉率和硬件限制。
Cognee 在使用较大且低幻觉模型（32B+）时表现优异，例如通过 Ollama，但中等规模的模型也适用于较轻量的设置。

在 Python 中使用 Ollama Web Search API

Ollama 的 Python 库现在包含原生的 OLlama 网络搜索功能。只需几行代码，你就可以使用网络上的实时信息增强本地 LLM，从而减少幻觉并提高准确性。

在 Go 中使用 Ollama Web Search API

Ollama 的 Web 搜索 API 可以让您将本地 LLM 与实时网络信息相结合。本指南将向您展示如何在 Go 中实现网络搜索功能，从简单的 API 调用到功能齐全的搜索代理。

本地LLM部署：2025完整指南 - Ollama、vLLM、LocalAI、Jan、LM Studio等

本地部署大型语言模型随着开发人员和组织寻求增强的隐私性、减少延迟和对AI基础设施的更大控制权，变得越来越流行。

消费硬件上的 AI 基础设施

人工智能的民主化已经到来。
借助像 Llama 3、Mixtral 和 Qwen 这样的开源大语言模型（LLM），团队现在可以使用消费级硬件构建强大的 AI 基础设施 - 在降低成本的同时，仍能完全控制数据隐私和部署。

NVIDIA DGX Spark 与 Mac Studio 与 RTX-4080：Ollama 性能对比

我找到了一些关于GPT-OSS 120b在三个不同平台上运行的性能测试结果：NVIDIA DGX Spark、Mac Studio和RTX 4080。Ollama库中的GPT-OSS 120b模型大小为65GB，这意味着它无法装入RTX 4080（或更新的RTX 5080的16GB显存中。

Docker Model Runner 与 Ollama：该如何选择？

在本地运行大型语言模型 (LLMs) 已成为隐私保护、成本控制和离线功能的重要趋势。 2025 年 4 月，Docker 推出了 Docker Model Runner (DMR)，这是其用于 AI 模型部署的官方解决方案，标志着该领域的重大转变。

Ollama 的 Go 客户端：SDK 对比与 Qwen3/GPT-OSS 示例

本指南全面概述了可用于 Ollama 的 Go SDK，并比较了它们的功能集。

对比：Qwen3:30b 与 GPT-OSS:20b

以下是 Qwen3:30b 和 GPT-OSS:20b 的比较，重点聚焦于指令遵循和性能参数、规格和速度：

将 Ollama 集成到 Python 中：REST API 和 Python 客户端示例

在本文中，我们将探讨两种连接您的 Python 应用程序到 Ollama 的方法：1. 通过 HTTP REST API；2. 通过 官方 Ollama Python 库。

Ollama GPT-OSS 结构化输出问题

Ollama的GPT-OSS模型在处理结构化输出时经常出现问题，尤其是在与LangChain、OpenAI SDK、vllm等框架一起使用时。

通过结构化输出约束大语言模型：Ollama、Qwen3 与 Python 或 Go

大型语言模型（LLMs）功能强大，但在生产环境中，我们很少希望得到自由形式的段落。相反，我们希望获得可预测的数据：属性、事实或可以输入到应用程序中的结构化对象。这就是LLM结构化输出。

1/3 »