Ollama

I denna test jämför jag hur olika LLM:er som är värd på Ollama översätter Hugo-sidor från engelska till tyska: jämföra hur olika LLM:er värd på Ollama översätter Hugo-sida.

Omrankning av texter med Ollama och Qwen3 Embedding LLM – i Go

Detta lilla Reranking-kodexempel i Go anropar Ollama för att generera inbäddningar för frågan och för varje kandidatdokument, och sorterar sedan i fallande ordning baserat på kosinussimilaritet.

Qwen3-inbäddnings- och omklassificeringsmodeller på Ollama: branschledande prestanda

Qwen3-inkapslings- och omklassificeringsmodeller är de senaste tillägg i Qwen-familjen, specifikt utformade för avancerade uppgifter inom textinkapsling, hämtning och omklassificering (reranking).

LLM-prestanda och PCIe-lan: Viktiga överväganden

Hur påverkar PCIe-laner LLM-prestanda? Beroende på uppgiften. För träning och fler-GPU-inferens – prestandaförändringen är betydande.

Konvertera HTML-innehåll till Markdown med hjälp av LLM och Ollama

I Ollama modellbiblioteket finns det modeller som kan konvertera HTML-innehåll till Markdown, vilket är användbart för innehållskonverteringsuppgifter. Den här guiden är en del av vår Dokumentationsverktyg 2026: Markdown, LaTeX, PDF & Skrivningsflöden hub.

Här listas några AI-assisterade kodverktyg och AI-kodassistenten samt deras fördelar.

Test: Hur Ollama använder Intel CPU-prestanda och effektiva kärnor

Jag har en teori att testa – om man använder alla kärnor på Intel CPU skulle det öka hastigheten hos LLMs? Det är irriterande att den nya gemma3 27-bit model (gemma3:27b, 17GB på ollama) inte passar in i min GPU:s 16GB VRAM och delvis kör på CPU.

Hur Ollama hanterar parallella begäranden

När Ollama-servern får två begäranden samtidigt, beror dess beteende på dess konfiguration och tillgängliga systemresurser.

DeepSeek’s första generation av resonemodeller med jämförbar prestanda med OpenAI-o1, inklusive sex tätmodeller distillerade från DeepSeek-R1 baserade på Llama och Qwen.

Denna Ollama CLI-snabbkurs fokuserar på kommandon du använder varje dag (ollama ls, ollama serve, ollama run, ollama ps, hantering av modeller och vanliga arbetsflöden), med exempel du kan kopiera och klistra in.

Inte för länge sedan släpptes. Låt oss uppdatera och
testa hur Mistral Small presterar jämfört med andra LLMs.

Reranking är ett andra steg i Retrieval Augmented Generation (RAG) system, precis mellan hämtning (Retrieving) och generering (Generating).

Underbar mat är också en njutning för ögonen. Men i detta inlägg jämför vi två AI-baserade söksystem, Farfalle och Perplexica.

Det är väldigt spännande! Istället för att ringa Copilot eller perplexity.ai och berätta för hela världen vad du letar efter, kan du nu värdshålla en liknande tjänst på din egen PC eller bärbara dator!

Nyligen har vi sett flera nya LLM:er släppas. Spännande tider. Låt oss testa och se hur de presterar när de upptäcker logiska fall.

Även om det finns några vanliga metoder för att skriva bra instruktioner så att LLM inte blir förvirrad när den försöker förstå vad du vill ha av den.

Ollama

Jämförelse av kvaliteten på Hugo-sidöversättning – LLM:er på Ollama

Omrankning av texter med Ollama och Qwen3 Embedding LLM – i Go

Qwen3-inbäddnings- och omklassificeringsmodeller på Ollama: branschledande prestanda

LLM-prestanda och PCIe-lan: Viktiga överväganden

Konvertera HTML-innehåll till Markdown med hjälp av LLM och Ollama

Jämförelse av AI-kodassistenter

Test: Hur Ollama använder Intel CPU-prestanda och effektiva kärnor

Hur Ollama hanterar parallella begäranden

Testa Deepseek-R1 på Ollama

Ollama-kommandoskivsnabbhänvisning: ls, serve, run, ps + kommandon (uppdatering 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 och Phi - LLM-test

Omranking med inbäddningsmodeller

Farfalle jämfört med Perplexica

Självhyst Perplexica – med Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Att skriva effektiva promptar för LLMs