Ollama

In deze test ben ik aan het vergelijken hoe verschillende LLMs die op Ollama worden gehost de Hugo-pagina vertalen van Engels naar Duits.

Reranking van teksten met Ollama en Qwen3 Embedding LLM - in Go

Deze kleine Reranking Go-codevoorbeeld roept Ollama aan om embeddings te genereren voor de query en voor elk kandidaatdocument, en sorteer deze vervolgens aflopend op cosijnsimilariteit.

Qwen3 Embedding- en Reranker-modellen op Ollama: State-of-the-Art-prestaties

De Qwen3 Embedding en Reranker-modellen zijn de nieuwste releases in de Qwen-familie, specifiek ontworpen voor geavanceerde tekst-inbedding (embedding), ophalen (retrieval) en her-ranking taken.

LLM-prestaties en PCIe-lanes: Belangrijke overwegingen

Hoe beïnvloeden PCIe-lanes de prestaties van LLMs? Afhangend van de taak. Voor training en meervoudige GPU-inferentie - is de prestatievermindering aanzienlijk.

Converteer HTML-inhoud naar Markdown met behulp van LLM en Ollama

In de Ollama modellenbibliotheek zijn er modellen die in staat zijn HTML-inhoud om te zetten in Markdown, wat handig is voor inhoudsconversietaken. Deze gids is onderdeel van onze Documentatie Tools in 2026: Markdown, LaTeX, PDF & Printing Workflows hub.

Vergelijking van AI-programmeerassistenten

Hieronder volgt een lijst met enkele AI-assistents voor programmeren en AI-programmeerassistenten en hun sterke punten.

Test: Hoe Ollama Intel CPU-prestaties en efficiënte kernen gebruikt

Ik heb een theorie om te testen - als we alle kernen op een Intel CPU gebruiken, zou dat de snelheid van LLMs verhogen? Het irriteert me dat de nieuwe gemma3 27 bit model (gemma3:27b, 17 GB op ollama) niet in de 16 GB VRAM van mijn GPU past en gedeeltelijk op de CPU draait.

Hoe Ollama parallelle verzoeken afhandelt

Deze handleiding legt uit hoe Ollama параллель verzoeken afhandelt (concurentie, wachtrijen en resourcebeperkingen) en hoe u dit kunt optimaliseren met de OLLAMA_NUM_PARALLEL-omgevingsvariabele (en gerelateerde instellingen).

DeepSeek’s eerste generatie redeneingsmodellen met vergelijkbare prestaties als OpenAI-o1, waaronder zes dichte modellen gedistilleerd van DeepSeek-R1 gebaseerd op Llama en Qwen.

Deze Ollama CLI-cheat sheet richt zich op de commando’s die je dagelijks gebruikt (ollama ls, ollama serve, ollama run, ollama ps, modelbeheer en veelvoorkomende workflows), met voorbeelden die je kunt kopiëren en plakken.

Niet zo lang geleden is vrijgegeven. Laten we even op de hoogte komen en test hoe Mistral Small presteert vergeleken met andere LLMs.

Reranking is een tweede stap in Retrieval Augmented Generation (RAG) systemen, direct tussen het ophalen (Retrieving) en het genereren (Generating).

Geweldige eten is ook een plezier voor de ogen. Maar in dit bericht vergelijken we twee op AI gebaseerde zoeksystemen: Farfalle en Perplexica.

Dat is erg spannend! In plaats van Copilot of perplexity.ai aan te roepen en de hele wereld te vertellen wat je zoekt, kun je nu een vergelijkbare dienst op je eigen PC of laptop hosten!

Onlangs hebben we meerdere nieuwe LLMs gezien die zijn vrijgegeven. Opwindende tijden. Laten we testen en zien hoe ze presteren bij het detecteren van logische fouten.

Er zijn nog steeds enkele veelvoorkomende aanpakken om goede prompts te schrijven, zodat LLM’s niet in de war raken bij het begrijpen van wat je van hen wilt.

Ollama

Vergelijking van de vertaalkwaliteit van Hugo-pagina's - LLMs op Ollama

Reranking van teksten met Ollama en Qwen3 Embedding LLM - in Go

Qwen3 Embedding- en Reranker-modellen op Ollama: State-of-the-Art-prestaties

LLM-prestaties en PCIe-lanes: Belangrijke overwegingen

Converteer HTML-inhoud naar Markdown met behulp van LLM en Ollama

Vergelijking van AI-programmeerassistenten

Test: Hoe Ollama Intel CPU-prestaties en efficiënte kernen gebruikt

Hoe Ollama parallelle verzoeken afhandelt

Testen van Deepseek-R1 op Ollama

Ollama CLI-Referentie: ls, serve, run, ps en andere commando's (update 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 en Phi - LLM Test

Reranking met embeddingmodellen

Farfalle versus Perplexica

Zelfhosting van Perplexica - met Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Het schrijven van effectieve prompts voor LLMs