RAG

使用 Ollama 和 Qwen3 Embedding LLM 对文本进行重排序 - Go 语言实现

这个小的 Go代码示例重新排序调用Ollama生成嵌入用于查询和每个候选文档，然后按余弦相似度降序排序。

Ollama 上的 Qwen3 嵌入与重排序模型：最先进的性能

Qwen3 Embedding 和 Reranker 模型是 Qwen 系列的最新发布，专为高级文本嵌入、检索和重排序任务而设计。

Go 语言中 Beautiful Soup 的替代方案

若要在 Go 中寻找一个与 Beautiful Soup 直接对应的库，请使用 soup。
若需要支持 CSS 选择器，请考虑使用 goquery。
若需要使用 XPath 查询，请使用 htmlquery。
若需要另一个受 Beautiful Soup 启发的选项，请查看 Node。

如果您正在寻找 Go 中的 Beautiful Soup 等效库，有多个库提供了类似的 HTML 解析和抓取功能：

使用LLM和Ollama将HTML内容转换为Markdown

在 Ollama 模型库中，有一些模型可以将 HTML 内容转换为 Markdown，这对内容转换任务非常有用。

云大语言模型提供商

使用大型语言模型（LLM）的成本并不高，可能不需要购买新的高性能GPU。
以下是一份云上LLM提供商列表，列出了他们托管的LLM。

Ollama 如何处理并行请求

当 Ollama 服务器同时收到两个请求时，其行为取决于其配置和可用的系统资源。

使用嵌入模型进行重排序

Reranking 是检索增强生成 (RAG) 系统的第二步，位于检索和生成之间。

为大型语言模型编写有效的提示

仍然有一些常见的方法可以编写良好的提示，使大语言模型（LLM）在理解你的需求时不会感到困惑。

对比大模型的摘要能力

测试不同参数数量和量化模型的行为。

« 2/2