LLM - Page 3 - Rost Glukhov | Strona osobista i blog techniczny

System pamięci agenta Hermes: jak naprawdę działa trwała pamięć sztucznej inteligencji

Wiesz, jak to działa. Otwierasz czat z agentem AI, opisujesz swój projekt, dzielicz się preferencjami, wykonujesz pewne zadania i zamykasz kartę. Wraca się tydzień później, a rozmowa wygląda tak, jakbyś miał do czynienia z obcą osobą — cały kontekst zniknął, wszystkie preferencje zostały zapomniane, a projekt trzeba wyjaśnić od zera.

Wzlot i upadek OpenClaw – harmonogram i prawdziwe przyczyny załamania

OpenClaw nie przegrał jako produkt. Po prostu wyczerpało się jego paliwo.

Tryb routera serwera Llama – dynamiczne przełączanie modeli bez restartu

Przez długi czas llama.cpp miał wyraźną wadę: można było obsługiwać tylko jeden model na proces, a przeladowanie wymagało restartu.

Umiejętności Claude i plik SKILL.md dla developerów: VS Code, JetBrains, Cursor

Większość zespołów nadużywa Claude Skills na jeden z dwóch sposobów. Albo zamieniają plik SKILL.md w kosz na wszystko, albo nigdy nie odchodzi od ogromnych, skopiowanych promptów.

Umiejętności asystenta Hermes AI w rzeczywistych środowiskach produkcyjnych

Asystent AI Hermes, oficjalnie dokumentowany jako Hermes Agent, nie jest pozycjonowany jako prosty interfejs czatu.

Ekosystem OpenClaw Skills i praktyczne rozwiązania produkcyjne

OpenClaw posiada dwa rodzaje rozszerzeń, które łatwo pomylić.

Wtyczki rozszerzają środowisko wykonawcze. Umiejętności (Skills) rozszerzają zachowanie agenta.

Wtyczki OpenClaw — przewodnik po ekosystemie i praktyczne rekomendacje

Ten artykuł dotyczy wtyczek OpenClaw — natywnych pakietów bramkowych, które dodają kanały, dostawców modeli, narzędzia, funkcje głosowe, pamięć, media, wyszukiwanie w sieci oraz inne warstwy środowiska wykonawczego.

Wzory konfiguracji OpenClaw w środowisku produkcyjnym z użyciem wtyczek i umiejętności

OpenClaw wygląda prosto w demonstracjach. W środowisku produkcyjnym staje się on systemem.

Claude, OpenClaw i koniec płaskiego modelu cenowego dla agentów

Cicha luka, która napędzała falę eksperymentów z agentami, została teraz zamknięta.

Szybki start z Vane (Perplexica 2.0), Ollama i llama.cpp

Vane to jedna z bardziej praktycznych pozycji w przestrzeni „AI z wyszukiwaniem i cytowaniami": samodzielnie hostowana silnia odpowiedziowa, która łąży pobieranie danych z sieci w czasie rzeczywistym z lokalnymi lub chmurowymi modelami LLM, zachowując jednocześnie pełną kontrolę nad całą infrastrukturą.

Instalacja i konfiguracja Claude Code dla Ollama, llama.cpp, ceny

Claude Code to nie autouzupełnianie z lepszym marketingiem. To narzędzie kodowania agentowe: czyta Twoją bazę kodu, edytuje pliki, uruchamia polecenia i integruje się z Twoimi narzędziami developerskimi.

Hermes AI Assistant - instalacja, konfiguracja, przepływ pracy i rozwiązywanie problemów

Hermes Agent to samodzielnie hostowany, agnostyczny względem modelu asystent AI, który działa na lokalnym komputerze lub tanim VPS, współpracuje przez interfejs terminala i wiadomości oraz z czasem udoskonala swoje działanie, przekształcając powtarzalne zadania w wielokrotnego użytku umiejętności.

TGI – Text Generation Inference – instalacja, konfiguracja, rozwiązywanie problemów

Text Generation Inference (TGI) ma bardzo specyficzną energię. Nie jest najmłodszym dzieckiem na ulicy inferencji, ale jest tym, które już nauczyło się, jak produkcja się psuje –

16 GB VRAM LLM benchmarks with llama.cpp (speed and context)

Porównuję tutaj szybkość działania kilku modeli LLM uruchamianych na GPU z 16 GB pamięci VRAM i wybieram najlepszy z nich do samodzielnego hostowania (self-hosting).

Ceny, dostępność i rzeczywistość dla karty RTX 5090 w Australii w marcu 2026 roku

Australia ma na stanie karty RTX 5090. Ledwie. A jeśli którąś znajdziesz, zapłacisz cenę, która wydaje się oderwana od rzeczywistości.

Zdalny dostęp do Ollama przez Tailscale lub WireGuard bez otwierania portów publicznych.

Ollama czuje się najlepiej, gdy jest traktowane jak lokalny demon: CLI i Twoje aplikacje komunikują się z API HTTP na pętli lokalnej (loopback), a reszta sieci nigdy nie dowiaduje się o jego istnieniu.