AI - Page 5 - Rost Glukhov | Personlig webbplats och teknisk blogg

Användning av LLM:er är inte särskilt kostsam, det kan inte behövas köpa nya fantastiska GPU:er. Här är en lista över LLM-leverantörer i molnet med LLM:er de värdar.

Test: Hur Ollama använder Intel CPU-prestanda och effektiva kärnor

Jag har en teori att testa – om man använder alla kärnor på Intel CPU skulle det öka hastigheten hos LLMs? Det är irriterande att den nya gemma3 27-bit model (gemma3:27b, 17GB på ollama) inte passar in i min GPU:s 16GB VRAM och delvis kör på CPU.

Jämförelse av NVidia GPU-lämplighet för AI

I mitt håll i den moderna världens kaos här är jag jämförande tekniska specifikationer av olika kort som är lämpliga för AI uppgifter (Deep Learning, Objektidentifiering och LLM). De är alla otroligt dyra dock.

Hur Ollama hanterar parallella begäranden

När Ollama-servern får två begäranden samtidigt, beror dess beteende på dess konfiguration och tillgängliga systemresurser.

Vibe kodning är en AI-driven programmeringsmetod där utvecklare beskriver önskad funktionalitet på naturligt språk, vilket tillåter AI-verktyg att generera kod automatiskt.

Jag har använt MMDetection (mmengine, mdet, mmcv), och nu ser det ut som att det är ur spel. Det är synd. Jag gillade deras modellzoo.

DeepSeek’s första generation av resonemodeller med jämförbar prestanda med OpenAI-o1, inklusive sex tätmodeller distillerade från DeepSeek-R1 baserade på Llama och Qwen.

Detta Ollama CLI cheat sheet fokuserar på kommandona du använder varje dag (ollama ls, ollama serve, ollama run, ollama ps, modellhantering och vanliga arbetsflöden), med exempel som du kan kopiera och klistra in.

Inte för länge sedan släpptes. Låt oss uppdatera och
testa hur Mistral Small presterar jämfört med andra LLMs.

Reranking är ett andra steg i Retrieval Augmented Generation (RAG) system, precis mellan Retrieval och Generating.

Nyligen publicerade Black Forest Labs en uppsättning text-till-bild AI-modeller. Dessa modeller sägs ha mycket högre utdata kvalitet. Låt oss prova dem

Läcker mat är också en njutning för ögonen. Men i den här posten kommer vi att jämföra två AI-baserade söksystem, Farfalle och Perplexica.

Det är mycket spännande! I stället för att anropa copilot eller perplexity.ai och berätta för hela världen vad du eftersträvar, kan du nu värd en liknande tjänst på din egen dator eller laptop!

Nyligen har vi sett flera nya LLM:er släppas. Spännande tider. Låt oss testa och se hur de presterar när de upptäcker logiska fall.

När jag började experimentera med LLMs var gränssnitten för dem i aktiv utveckling och nu är några av dem verkligen bra.

Även om det finns några vanliga metoder för att skriva bra instruktioner så att LLM inte blir förvirrad när den försöker förstå vad du vill ha av den.

AI

molntjänstleverantörer för LLM

Test: Hur Ollama använder Intel CPU-prestanda och effektiva kärnor

Jämförelse av NVidia GPU-lämplighet för AI

Hur Ollama hanterar parallella begäranden

Vibe Coding - Betydelse och Beskrivning

MMdetection stöds inte längre

Testa Deepseek-R1 på Ollama

Ollama CLI-kortkommando: ls, serve, run, ps + kommandon (uppdatering 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 och Phi - LLM-test

Reranking med inbäddningsmodeller

Flux text-till-bild AI-modell

Farfalle vs Perplexica

Self-hosta Perplexica – med Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

LLM-frontender

Att skriva effektiva promptar för LLMs