DevOps

Avladda alla llama.cpp-routermodeller utan att starta om

Avladda alla llama.cpp-routermodeller utan att starta om

Frigör VRAM utan att stoppa llama-server.

Routerläge för llama.cpp är en av de mest användbara förändringarna i llama-server på flera år. Det ger slutligen lokala aktörer av LLM (Large Language Models) något som liknar modellhanteringsupplevelsen som man förväntar sig från Ollama, samtidigt som det behåller den råa prestanda och den lågnivåkontroll som gör llama.cpp värd att använda i första hand.

Hermes AI-assistent – installation, konfiguration, arbetsflöden och felsökning

Hermes AI-assistent – installation, konfiguration, arbetsflöden och felsökning

Hermes Agent: installation och snabbstart för utvecklare

Hermes Agent är en självhostad, modellagnostisk AI-assistent som körs på en lokal maskin eller en lågkostnadsvirtuell server (VPS), fungerar via terminal- och meddelandegränssnitt och förbättras över tid genom att omvandla upprepade uppgifter till återanvändbara färdigheter.

Ollama i Docker Compose med GPU och bestående modelllagring

Ollama i Docker Compose med GPU och bestående modelllagring

Ollama-server med komposition i förgrunden, GPU och uthållighet.

Ollama fungerar utmärkt på “bare metal”. Det blir ännu mer intressant när du behandlar det som en tjänst: en stabil slutpunkt, fastlagda versioner, beständig lagring och en GPU som antingen är tillgänglig eller inte.

Llama.swap Modellväxlar – Snabbstart för lokala, OpenAI-kompatibla LLM:ar

Llama.swap Modellväxlar – Snabbstart för lokala, OpenAI-kompatibla LLM:ar

Byt lokala LLM:ar utan att ändra klienterna.

Snart kastar du mellan vLLM, llama.cpp och mer – varje stack på sin egen port. Allt nedströms vill fortfarande ha en enda bas-URL /v1; annars fortsätter du att shuffla med portar, profiler och skript för enskilda fall. llama-swap är /v1-proxyn som ligger framför dessa stackar.

Utvecklarverktyg: Den kompletta guiden till moderna utvecklingsarbetsflöden

Utvecklarverktyg: Den kompletta guiden till moderna utvecklingsarbetsflöden

Utveckling av programvara involverar Git för versionskontroll, Docker för containerisering, bash för automatisering, PostgreSQL för databaser och VS Code för redigering — tillsammans med otaliga andra verktyg som avgör din produktivitet. Denna sida samlar de nödvändiga kommandoreferenserna, arbetsflödena och jämförelserna du behöver för att arbeta effektivt över hela utvecklingsstacken.

LocalAI QuickStart: Kör OpenAI-kompatibla LLMs lokalt

LocalAI QuickStart: Kör OpenAI-kompatibla LLMs lokalt

Självhänseende av OpenAI-kompatibla API:n med LocalAI på några minuter.

LocalAI är en självhostad, lokal-först inferensserver designad för att bete sig som en drop-in OpenAI API för att köra AI-arbetsbelastningar på din egen hårdvara (bärbar dator, arbetsstation eller on-prem-server).