Рост Глухов | Персональный сайт и технический блог

Обслуживание LLM Wiki: дрейф, противоречия и рецензирование

Неудача в использовании LLM Wiki наступает тогда, когда старые факты остаются правдоподобными, противоречия становятся гладкими, а сгенерированные резюме отдаляются от своих источников.

Syncthing для синхронизации файлов в системах самостоятельного хостинга знаний

Syncthing синхронизирует файлы между устройствами, которыми вы управляете, что делает его одним из самых практичных инструментов для создания собственной инфраструктуры знаний, позволяющей избежать привязки к облачным сервисам.

Паттерн Circuit Breaker в Go: предотвращение каскадных сбоев

Предохранитель (circuit breaker) предотвращает перегрузку вашего Go-сервиса при обращении к неустойчивой зависимости, избегая каскадных сбоев, которые потребляют горутины, сокеты и память, пока вся система не рухнет.

Podman Quadlet и Docker Compose для Linux-сервисов

Docker Compose и Podman Quadlet решают пересекающиеся задачи, но исходят из разных принципов проектирования, и выбор между ними зависит от того, думаете ли вы в терминах стеков приложений или системных сервисов Linux.

GPU для ИИ в 2026 году: сравнение NVIDIA, AMD и Intel

Ландшафт аппаратных решений для ИИ значительно изменился в 2026 году: NVIDIA, AMD и Intel соревнуются за разработчиков, которым требуются GPU, способные запускать локальные большие языковые модели (LLM) и выполнять задачи инференса.

Агент Hermes: настройка безголового сервера и удалённого рабочего стола

Запуск агента Hermes на сервере без графического интерфейса (headless) при подключении с настольного клиента на другом компьютере требует наличия двух процессов на сервере и одного клиентского соединения.

GitHub Spec Kit против Kiro против рабочих процессов Claude Code SDD

Разработчики, сравнивающие настройки спецификации-ориентированной разработки (Spec-Driven Development, SDD) в 2026 году, обычно не спрашивают, какая модель самая умная. Они спрашивают, какой рабочий процесс позволит сохранить согласованность работы ИИ-агентов, не погружая их в бюрократические ритуалы.

Рабочий процесс Spec-Driven Development: от требований к коду

Разработка на основе спецификаций (Spec-Driven Development, SDD) работает, когда спецификация представляет собой рабочий процесс, а не документ, который архивируется после начала проекта. Цель заключается не в создании объемного документа требований к продукту.

Безопасность агентов A2A и MCP: идентификация, делегирование и журналы аудита

Инъекция промптов привлекает основное внимание в области безопасности систем на базе больших языковых моделей (LLM), и это заслужено, но это не вся проблема, когда агенты начинают вызывать инструменты и делегировать работу другим агентам.

Большинство демонстраций AI-агентов по-прежнему ведут себя как чат-завершения с дополнительными шагами: вы отправляете промпт, ждете несколько секунд и получаете ответ в одном сообщении.

Запуск Docker Compose как службы Linux с помощью systemd

Docker Compose на Linux-сервере должен запускаться при загрузке, корректно останавливаться при выключении и переживать перезагрузки без ручного вмешательства.

Установка Docker на Ubuntu: APT, Snap, Rootless — полное руководство 2026

Установка Docker на Ubuntu должна быть простой, но на практике несколько вариантов установки Docker конкурируют за одно и то же имя команды, каждый из которых имеет различную упаковку, поведение при обновлении и последствия для безопасности.

Устранение неполадок APT в Ubuntu: исправление сломанных пакетов, блокировок и ошибок GPG

Неудачи с APT — обычное явление на машинах с Ubuntu, которые используются длительное время. Они обычно возникают после обновления версии, изменения стороннего репозитория, удаления PPA, ручной установки пакета .deb или прерванного процесса установки пакетов.

Спекулятивное декодирование: ускорение вывода LLM на 20–50%

Модель объемом 70 миллиардов параметров генерирует один токен за один прямой проход, и при каждом проходе веса перезагружаются из видеопамяти (VRAM), вычисляется внимание (attention) по всему контексту и синхронизируется память. Между токенами GPU простаивает, ожидая разрешения последовательных зависимостей.

Шаблоны оркестрации мультиагентных систем: практическое руководство

Системы на основе одного агента достигли своего пика в 2025 году — вы предоставляли одной модели языка (LLM) промпт, набор инструментов и цель, и она достаточно хорошо справлялась с ограниченными задачами.

Шаблон Transactional Outbox на Go с PostgreSQL

Две операции, которые должны завершиться успешно вместе, в конечном итоге провалятся по отдельности. Ваш сервис заказов сохраняет заказ в базу данных, а затем публикует событие order.created в брокере сообщений.

Подписаться