Ollama

Snelle start met Vane (Perplexica 2.0), Ollama en llama.cpp

Snelle start met Vane (Perplexica 2.0), Ollama en llama.cpp

Zelf gehoste AI-zoekopdrachten met lokale LLM's

Vane is een van de meest pragmatische opties binnen het domein van “AI-zoekmachines met bronvermelding”: een zelfgehoste antwoorden-engine die live web-ophaal met lokale of cloud-LLM’s combineert, waarbij de volledige stack onder uw controle blijft.

Ollama in Docker Compose met GPU en persistente modelopslag

Ollama in Docker Compose met GPU en persistente modelopslag

Componeren-als-basis Ollama-server met GPU en persistentie.

Ollama werkt uitstekend op bare metal. Het wordt nog interessanter wanneer je het als een service behandelt: een stabiel eindpunt, vastgezet versies, persistente opslag en een GPU die ofwel beschikbaar is of niet.

BAML vs Instructor: gestructureerde LLM-outputs

BAML vs Instructor: gestructureerde LLM-outputs

Type-safe LLM-uitvoer met BAML en Instructor

Bij het werken met Large Language Models (LLM’s) in productieomgevingen is het essentieel om gestructureerde, typeveilige outputs te verkrijgen. Twee populaire frameworks - BAML en Instructor - hanteren verschillende benaderingen om dit probleem op te lossen.