Ollama

Hoe Ollama Parallel Verzoeken Behandelt

Hoe Ollama Parallel Verzoeken Behandelt

Ollama configureren voor het uitvoeren van parallelle aanvragen.

Wanneer de Ollama-server twee aanvragen tegelijkertijd ontvangt, hangt het gedrag ervan af van de configuratie en de beschikbare systeemresources.

Testen van Deepseek-R1 op Ollama

Testen van Deepseek-R1 op Ollama

Vergelijking van twee deepseek-r1-modellen met twee basismodellen

DeepSeek’s eerste generatie redeneingsmodellen met vergelijkbare prestaties als OpenAI-o1, waaronder zes dichte modellen gedistilleerd van DeepSeek-R1 gebaseerd op Llama en Qwen.

Zelfhosting van Perplexica - met Ollama

Zelfhosting van Perplexica - met Ollama

Lokale uitvoering van een Copilot-stijl service? Gemakkelijk!

Dat is erg spannend! In plaats van Copilot of perplexity.ai aan te roepen en de hele wereld te vertellen wat je zoekt, kun je nu een vergelijkbare dienst op je eigen PC of laptop hosten!

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Testen van het detecteren van logische fouten

Onlangs hebben we meerdere nieuwe LLMs gezien die zijn vrijgegeven. Opwindende tijden. Laten we testen en zien hoe ze presteren bij het detecteren van logische fouten.

Het schrijven van effectieve prompts voor LLMs

Het schrijven van effectieve prompts voor LLMs

Een beetje experimenteren vereist maar

Er zijn nog steeds enkele veelvoorkomende aanpakken om goede prompts te schrijven, zodat LLM’s niet in de war raken bij het begrijpen van wat je van hen wilt.