DevOps

Podman Quadlet vs. Docker Compose w usługach Linuksa

Docker Compose i Podman Quadlet rozwiązują częściowo nakładające się problemy, ale pochodzą z różnych ośrodków projektowych. Wybór między nimi zależy od tego, czy myślisz w kategoriach stosów aplikacji, czy usług Linuxa.

Agent Hermes: konfiguracja bezserwerowa + zdalny pulpit

Uruchamianie Hermes Agent na serwerze headless (bez interfejsu graficznego) z jednoczesnym połączeniem klienta desktopowego z innego komputera wymaga uruchomienia dwóch procesów po stronie serwera oraz jednego połączenia klienckiego.

Uruchamianie Docker Compose jako usługa Linuxa za pomocą systemd

Skrypt Docker Compose na serwerze Linux powinien uruchamiać się przy starcie systemu, zatrzymywać się poprawnie przy wyłączaniu oraz przetrwać ponowne uruchomienia bez interwencji człowieka.

Instalacja Dockera na Ubuntu: APT, Snap, Rootless — Kompletny przewodnik 2026

Instalacja Dockera na Ubuntu powinna być prostym zadaniem, ale w praktyce kilka opcji „w kształcie Dockera” rywalizuje o tę samą nazwę polecenia, każda z inną pakietacją, zachowaniem podczas aktualizacji oraz implikacjami bezpieczeństwa.

Agentów odpytujących w asystentach AI: 11 wzorców implementacji

Agenci pollingowi to jedna z najmniej glamour części architektury asystentów AI, ale jednocześnie jedna z najbardziej przydatnych.

Szybki start i karta cheat sheet dla diagramów Mermaid dla programistów

Mermaid to narzędzie do tworzenia diagramów oparte na tekście, przeznaczone dla osób, które wolą pisać diagramy niż przeciągać kwadraty po płótnie. Wykorzystuje składnię podobną do Markdownu do opisu schematów blokowych, diagramów sekwencji, diagramów klas, maszyn stanów, osi czasu, diagramów Gantta, diagramów relacji encji i wielu innych.

Architektura asystenta AI: LLM, pamięć, narzędzia, routing, obserwowalność

Produkcjny asystent AI to nie „LLM z promptem”. To system, który przyjmuje intencję, utrzymuje stan, decyduje, kiedy pobierać dane lub wykonywać akcje, oraz udostępnia wystarczająco szczegółowych danych środowiska uruchomieniowego do debugowania awarii.

Usuń wszystkie modele routera llama.cpp bez restartowania

Tryb routera w llama.cpp to jedna z najbardziej przydatnych zmian wprowadzonych do llama-server w ciągu ostatnich lat. Wreszcie daje lokalnym operatorom modeli LLM coś w rodzaju zarządzania modelami, do którego są przyzwyczajeni z Ollama, jednocześnie zachowując surową wydajność i kontrolę na niskim poziomie, która sprawia, że warto korzystać z llama.cpp w pierwszej kolejności.

Kanban w Hermes Agent dla samodzielnie hostowanych przepływów pracy LLM

Hermes Agent dostarcza tablicę w stylu Kanban oraz Hermes Gateway, które mogą przytłoczyć Twoją własną samohostowaną LLM, jeśli jednocześnie zostanie uruchomionych zbyt wiele zadań.

Tryb routera serwera Llama – dynamiczne przełączanie modeli bez restartu

Przez długi czas llama.cpp miał wyraźną wadę: można było obsługiwać tylko jeden model na proces, a przeladowanie wymagało restartu.

Wtyczki OpenClaw — przewodnik po ekosystemie i praktyczne rekomendacje

Ten artykuł dotyczy wtyczek OpenClaw — natywnych pakietów bramkowych, które dodają kanały, dostawców modeli, narzędzia, funkcje głosowe, pamięć, media, wyszukiwanie w sieci oraz inne warstwy środowiska wykonawczego.

Hermes AI Assistant - instalacja, konfiguracja, przepływ pracy i rozwiązywanie problemów

Hermes Agent to samodzielnie hostowany, agnostyczny względem modelu asystent AI, który działa na lokalnym komputerze lub tanim VPS, współpracuje przez interfejs terminala i wiadomości oraz z czasem udoskonala swoje działanie, przekształcając powtarzalne zadania w wielokrotnego użytku umiejętności.

Zdalny dostęp do Ollama przez Tailscale lub WireGuard bez otwierania portów publicznych.

Ollama czuje się najlepiej, gdy jest traktowane jak lokalny demon: CLI i Twoje aplikacje komunikują się z API HTTP na pętli lokalnej (loopback), a reszta sieci nigdy nie dowiaduje się o jego istnieniu.

Ollama w Docker Compose z obsługą GPU i trwałą pamięcią modeli

Ollama świetnie działa na “gołym metalu”. Zyskuje jednak na ciekawości, gdy potraktujesz ją jako usługę: stabilny punkt końcowy, zablokowane wersje, trwałe przechowywanie danych oraz dostępność GPU, która jest albo dostępna, albo nie.

Ollama za certyfikatem odwróconym (reverse proxy) z Caddy lub Nginx do strumieniowego dostępu HTTPS

Uruchomienie Ollama za pośrednictwem proxy odwrotnego to najprostszy sposób na uzyskanie HTTPS, opcjonalnej kontroli dostępu oraz przewidywalnego zachowania strumieniowego.

Apache Flink na K8s i Kafka: PyFlink, Go, operacje oraz cennik zarządzany.

Apache Flink to framework do obliczeń z pamięcią stanu (stateful computations) nad nieograniczonymi i ograniczonymi strumieniami danych.