AI - Page 2 - Rost Glukhov | Strona osobista i blog techniczny

Porównanie dostawców pamięci agentów — Honcho, Mem0, Hindsight i pięć innych

Współczesne asystenty nadal zapominają wszystko po zamknięciu karty, chyba że dane są utrwalone poza oknem kontekstu. Dostawcy pamięci agentów to usługi lub biblioteki przechowujące fakty i streszczenia między sesjami – często integrowane jako wtyczki, dzięki czemu framework pozostaje lekki, a pamięć skalowalna.

System pamięci agenta Hermes: jak naprawdę działa trwała pamięć sztucznej inteligencji

Wiesz, jak to działa. Otwierasz czat z agentem AI, opisujesz swój projekt, dzielicz się preferencjami, wykonujesz pewne zadania i zamykasz kartę. Wraca się tydzień później, a rozmowa wygląda tak, jakbyś miał do czynienia z obcą osobą — cały kontekst zniknął, wszystkie preferencje zostały zapomniane, a projekt trzeba wyjaśnić od zera.

Wzlot i upadek OpenClaw – harmonogram i prawdziwe przyczyny załamania

OpenClaw nie przegrał jako produkt. Po prostu wyczerpało się jego paliwo.

Tryb routera serwera Llama – dynamiczne przełączanie modeli bez restartu

Przez długi czas llama.cpp miał wyraźną wadę: można było obsługiwać tylko jeden model na proces, a przeladowanie wymagało restartu.

Umiejętności Claude i plik SKILL.md dla developerów: VS Code, JetBrains, Cursor

Większość zespołów nadużywa Claude Skills na jeden z dwóch sposobów. Albo zamieniają plik SKILL.md w kosz na wszystko, albo nigdy nie odchodzi od ogromnych, skopiowanych promptów.

Umiejętności asystenta Hermes AI w rzeczywistych środowiskach produkcyjnych

Asystent AI Hermes, oficjalnie dokumentowany jako Hermes Agent, nie jest pozycjonowany jako prosty interfejs czatu.

Ekosystem OpenClaw Skills i praktyczne rozwiązania produkcyjne

OpenClaw posiada dwa rodzaje rozszerzeń, które łatwo pomylić.

Wtyczki rozszerzają środowisko wykonawcze. Umiejętności (Skills) rozszerzają zachowanie agenta.

Wtyczki OpenClaw — przewodnik po ekosystemie i praktyczne rekomendacje

Ten artykuł dotyczy wtyczek OpenClaw — natywnych pakietów bramkowych, które dodają kanały, dostawców modeli, narzędzia, funkcje głosowe, pamięć, media, wyszukiwanie w sieci oraz inne warstwy środowiska wykonawczego.

Wzory konfiguracji OpenClaw w środowisku produkcyjnym z użyciem wtyczek i umiejętności

OpenClaw wygląda prosto w demonstracjach. W środowisku produkcyjnym staje się on systemem.

Claude, OpenClaw i koniec płaskiego modelu cenowego dla agentów

Cicha luka, która napędzała falę eksperymentów z agentami, została teraz zamknięta.

Szybki start z Vane (Perplexica 2.0), Ollama i llama.cpp

Vane to jedna z bardziej praktycznych pozycji w przestrzeni „AI z wyszukiwaniem i cytowaniami": samodzielnie hostowana silnia odpowiedziowa, która łąży pobieranie danych z sieci w czasie rzeczywistym z lokalnymi lub chmurowymi modelami LLM, zachowując jednocześnie pełną kontrolę nad całą infrastrukturą.

Instalacja i konfiguracja Claude Code dla Ollama, llama.cpp, ceny

Claude Code to nie autouzupełnianie z lepszym marketingiem. To narzędzie kodowania agentowe: czyta Twoją bazę kodu, edytuje pliki, uruchamia polecenia i integruje się z Twoimi narzędziami developerskimi.

Asystent Hermes AI – instalacja, konfiguracja, przepływ pracy i rozwiązywanie problemów

Hermes Agent to samodzielnie hostowany, niezależny od modelu asystent AI, który działa na lokalnym komputerze lub tanim serwerze VPS, współpracuje przez interfejs terminala i komunikatora oraz rozwija się z czasem, zamieniając powtarzalne zadania w wielokrotnego użytku umiejętności.

TGI – Text Generation Inference – instalacja, konfiguracja, rozwiązywanie problemów

Text Generation Inference (TGI) ma bardzo specyficzną energię. Nie jest najmłodszym dzieckiem na ulicy inferencji, ale jest tym, które już nauczyło się, jak produkcja się psuje –

16 GB VRAM LLM benchmarks with llama.cpp (speed and context)

Porównuję tutaj szybkość działania kilku modeli LLM uruchamianych na GPU z 16 GB pamięci VRAM i wybieram najlepszy z nich do samodzielnego hostowania (self-hosting).

Ollama w Docker Compose z obsługą GPU i trwałą pamięcią modeli

Ollama świetnie działa na “gołym metalu”. Zyskuje jednak na ciekawości, gdy potraktujesz ją jako usługę: stabilny punkt końcowy, zablokowane wersje, trwałe przechowywanie danych oraz dostępność GPU, która jest albo dostępna, albo nie.