SelfHosting

MinIO CE в 2026 году: отказ от апстрима, только исходный код и что использовать

MinIO Community Edition больше не является безопасным выбором по умолчанию для новых производственных систем.

Память систем ИИ — устойчивые знания и память агентов

Этот раздел содержит руководства по постоянному хранению знаний и памяти для ИИ-систем — как ассистенты сохраняют факты, предпочтения и сжатый контекст между сеансами, не перегружая один промпт всеми токенами. Здесь под памятью подразумевается осознанное удержание данных (факты о пользователе, резюме, хранилища, поддерживаемые плагинами), а не оперативная память GPU или веса моделей.

Сравнение провайдеров памяти для агентов — Honcho, Mem0, Hindsight и ещё пять

Современные ассистенты по-прежнему забывают всё, когда вы закрываете вкладку, если ничего не сохраняется за пределами окна контекста. Провайдеры памяти агентов — это сервисы или библиотеки, которые хранят факты и резюме между сессиями; они часто подключаются как плагины, чтобы фреймворк оставался легковесным, в то время как память масштабируется.

Система памяти агента Hermes: как на самом деле работает постоянное хранение памяти ИИ

Вы знаете, как это бывает. Вы открываете чат с ИИ-агентом, объясняете проект, делитесь предпочтениями, получаете результаты работы и закрываете вкладку. Возвращаетесь на следующей неделе — и оказывается, что вы общаетесь с незнакомцем: весь контекст потерян, все предпочтения забыты, проект нужно объяснять заново.

Восхождение и падение OpenClaw — хронология и реальные причины краха

OpenClaw не провалилась как продукт. Он потерял свое топливо.

Режим маршрутизации Llama-Server: динамическое переключение моделей без перезапуска

Долгое время у llama.cpp была очевидная limitation:
вы могли обслуживать только одну модель в процессе, а переключение требовало перезапуска.

Управление знаниями в 2026 году: инструменты PKM, самохостинговые вики и цифровые системы

Управление персональными знаниями охватывает Obsidian, Logseq, DokuWiki, Zettelkasten и PARA — правильный выбор зависит от того, хотите ли вы локальный граф заметок, собственный вики-движок или рабочий процесс, основанный на аутлайнерах.

Навыки AI-ассистента Hermes для реальных производственных конфигураций

Ассистент Hermes AI, официально документированный как Hermes Agent, позиционируется не как простая обертка для чата.

Экосистема навыков OpenClaw и практические решения для продакшена

У OpenClaw есть два типа расширений, и их легко перепутать.

Плагины расширяют среду выполнения. Навыки (Skills) расширяют поведение агента.

Плагины OpenClaw — руководство по экосистеме и практические рекомендации

Эта статья посвящена плагинам OpenClaw — нативным пакетам шлюза, которые добавляют каналы, провайдеры моделей, инструменты, речевые функции, память, медиа, веб-поиск и другие возможности runtime.

Шаблоны настройки OpenClaw для продакшн-среды с использованием плагинов и навыков

OpenClaw выглядит простым в демонстрациях. В производственной среде он становится полноценной системой.

Быстрый старт с Vane (Perplexica 2.0), Ollama и llama.cpp

Vane — это один из наиболее прагматичных проектов в пространстве «поиска с использованием ИИ и цитированием»: самохостинговое средство ответов, которое сочетает в себе живой поиск в вебе с локальными или облачными LLM, сохраняя при этом полный контроль над всем стеком технологий.

Hermes AI Assistant — установка, настройка, рабочий процесс и устранение неполадок

Hermes Agent — это хостящийся пользователем, независимый от конкретной модели ИИ-ассистент, который работает на локальной машине или недорогом VPS, взаимодействует через терминал и мессенджеры, а со временем совершенствуется, превращая повторяющиеся задачи в переиспользуемые навыки.

TGI — Text Generation Inference: установка, настройка и устранение неполадок

Text Generation Inference (TGI) обладает очень специфической энергетикой. Это не самый новый проект на улице инференса, но это тот, который уже научился, как происходит работа в продакшене, —

Быстрый старт SGLang: установка, настройка и развертывание больших языковых моделей через API OpenAI

SGLang — это высокопроизводительный фреймворк для развертывания больших языковых и мультимодальных моделей, созданный для обеспечения низколатентного и высокопроизводительного вывода на устройствах от одной GPU до распределенных кластеров.

Быстрый старт: переключатель моделей llama.swap для локальных LLM, совместимых с OpenAI

Вскоре вы будете жонглировать vLLM, llama.cpp и другими решениями — каждый стек на своем порту. Все downstream-системы все еще хотят один базовый URL /v1; иначе вы постоянно переставляете порты, профили и одноразовые скрипты. llama-swap — это прокси /v1 перед этими стеками.