RAG

Systemy pamięciowe w asystentach AI

Systemy pamięciowe w asystentach AI

Pamięć robocza, strukturalna i odzyskiwania dla asystentów.

Pamięć przekształca asystentów z reaktywnych w trwałych, ale to również miejsce, w którym wiele systemów cicho się psuje. Ankiety wskazują, że podział na pamięć krótko- i długoterminową nie jest już wystarczający dla współczesnej pamięci agentów; OpenAI i SDK LangGraph wskazują na prostszą architekturę — pamięć roboczą, trwały stan i mechanizmy odzyskiwania danych.

Pobieranie vs. reprezentacja w systemach wiedzy

Pobieranie vs. reprezentacja w systemach wiedzy

Wyszukiwanie nie jest strukturą wiedzy

Większość współczesnych systemów wiedzy optymalizuje wyszukiwanie (retrieval), co jest zrozumiałe. Wyszukiwanie jest widoczne, łatwe do demonstracji i wydaje się magiczne, gdy działa poprawnie. Wpisujesz pytanie, otrzymujesz odpowiedź.

PKM, RAG, Wiki i systemy pamięciowe – jasne wyjaśnienie

PKM, RAG, Wiki i systemy pamięciowe – jasne wyjaśnienie

Mapa współczesnych systemów wiedzy

PKM, RAG, wikis, systemy pamięci AI oraz teraz praktyczne workflow wspierane przez AI są często omawiane tak, jakby rozwiązywały ten sam problem. Nie rozwiązują. Wszystkie mają do czynienia z wiedzą, ale działają na różnych warstwach:

Drugi mózg wyjaśniony dla inżynierów i pracowników umysłowych

Drugi mózg wyjaśniony dla inżynierów i pracowników umysłowych

Notatki to magazynowanie. Drugie mózg to obliczenia.

Przesyt informacyjny to mniej problem objętości danych, a bardziej kwestia nierozwiązanych wejść. Współczesna praca intelektualna pozostawia ślad w postaci zakładek, wątków czatowych, dokumentów, zaznaczeń, fragmentów kodu, transkrypcji, zrzutów ekranu oraz niedopisanych notatek.

Wektory tekstowe dla RAG i wyszukiwania – Python, Ollama, API kompatybilne z OpenAI

Wektory tekstowe dla RAG i wyszukiwania – Python, Ollama, API kompatybilne z OpenAI

RAG embeddings – Python, Ollama, API OpenAI.

Jeśli pracujesz nad generacją wspieraną odzyskiwaniem (RAG), ta sekcja wyjaśnia wektory tekstowe (embeddings) prostym językiem — czym są, jak pasują do wyszukiwania i odzyskiwania informacji, oraz jak wywołać dwa popularne lokalne rozwiązania z Pythonu przy użyciu Ollama lub kompatybilnego z OpenAI interfejsu HTTP (jakiego używają serwery oparte na llama.cpp).