Hosting

Airtable для разработчиков и DevOps — тарифные планы, API, вебхуки и примеры на Go/Python

Airtable лучше всего рассматривать как платформу для создания приложений с низким уровнем кода, построенную вокруг совместного “базоподобного” интерфейса таблиц - отличное решение для быстрого создания операционных инструментов (внутренние трекеры, легковесные CRM, контентные конвейеры, очереди оценки ИИ), где неразработчикам нужен дружелюбный интерфейс, а разработчикам - API для автоматизации и интеграции.

Мониторинг инференса LLM в продакшене (2026): Prometheus и Grafana для vLLM, TGI, llama.cpp

Learn how to monitor LLM inference servers (vLLM, Hugging Face TGI, llama.cpp) using Prometheus and Grafana. This article covers what to measure, how to expose and scrape /metrics, example PromQL queries for p95 latency and tokens/sec, ready-to-use Docker Compose and Kubernetes manifests, Grafana dashboard provisioning, alerting, and real-world troubleshooting.

OpenClaw Quickstart: Установка с Docker (Ollama GPU или Claude CPU)

OpenClaw — это самоуправляемый AI-ассистент, предназначенный для работы с локальными LLM-движками, такими как Ollama, или с облачными моделями, такими как Claude Sonnet.

Сравнение и матрица функций объектного хранилища: Garage vs MinIO vs AWS S3

AWS S3 остается “стандартным” базовым решением для объектного хранения: это полностью управляемая, сильно согласованная система, разработанная для чрезвычайно высокой долговечности и доступности. Garage и MinIO — это самонастраиваемые альтернативы, совместимые с S3: Garage предназначен для легковесных, геораспределенных кластеров малого и среднего размера, в то время как MinIO делает акцент на широком покрытии API S3 и высокой производительности в крупных развертываниях.

Наблюдаемость систем LLM: метрики, трассировка, логи и тестирование в продакшене

Build an end-to-end observability strategy for LLM inference and LLM applications: what to measure, how to instrument, which tools to use, how to control cardinality and sampling, and how to deploy and scale the telemetry pipeline securely.

Размещение LLM в 2026 году: сравнение локальных, саморазмещаемых и облачных инфраструктур

Strategic guide to hosting large language models locally with Ollama, llama.cpp, vLLM, or in the cloud. Compare tools, performance trade-offs, and cost considerations.

Создайте AWS CloudFront по модели оплаты по фактическому использованию (не бесплатный тариф)

План AWS Free не работает для меня, и Pay-as-you-go скрыт для новых распределений CloudFront в консоли AWS.

Самостоятельное размещение LLM и суверенитет ИИ

Самостоятельное размещение LLM позволяет контролировать данные, модели и выводы — это практический путь к суверенитету ИИ для команд, предприятий и стран.

Развертывание сайта Hugo на AWS S3 с помощью AWS CLI

Развертывание статического сайта Hugo на AWS S3 с использованием AWS CLI предоставляет надежное, масштабируемое решение для хостинга вашего веб-сайта. Это руководство охватывает весь процесс развертывания, от начальной настройки до продвинутых стратегий автоматизации и управления кэшем.

Стратегии кэширования Hugo для повышения производительности

Стратегии кэширования Hugo (https://www.glukhov.org/ru/post/2025/11/hugo-caching-strategies/ “Стратегии кэширования Hugo”) являются ключевыми для максимизации производительности вашего статического генератора сайтов. Хотя Hugo генерирует статические файлы, которые изначально быстры, правильное кэширование на нескольких уровнях может значительно улучшить время сборки, снизить нагрузку на сервер и повысить пользовательский опыт.

Возвышение ASIC для LLM: Почему аппаратное обеспечение инференса имеет значение

Будущее ИИ не ограничивается более умными моделями - это также вопрос более умного кремния. Специализированное оборудование для инференса ЛЛМ приводит к революции, аналогичной переходу майнинга биткоинов к ASIC.

Создание AWS Lambda с двойным режимом работы на Python и Terraform

Здесь представлен пример Python Lambda для обработки сообщений SQS (Пример Python Lambda для обработки сообщений SQS + REST API) с защитой API Key + скрипт Terraform для развертывания его для безсерверного выполнения.

Платформа для федеративного блогинга WriteFreely — сравнение затрат на саморазмещение и управление

Вот краткая информация о Write.as / WriteFreely - как это вписывается в fediverse, где можно получить управляемый хостинг, как выглядит тенденция использования, и как развернуть самостоятельно (плюс примерные расчеты стоимости).

Proxmox в 2025 году: практичный универсальный стек виртуализации

Proxmox Virtual Environment (Proxmox VE) — это открытая платформа гипервизора типа 1 и оркестрации дата-центров, построенная на основе Debian.

Обзор AWS CDK, примеры на TypeScript и Python и производительность

AWS Cloud Development Kit (AWS CDK) — это фреймворк, который позволяет определять и развертывать облачную инфраструктуру с использованием привычных языков программирования, таких как TypeScript, Python, Java и Go.

Сравнение дистрибутивов Kubernetes для хоумлаба из 3 узлов

Я сравниваю варианты самонастраиваемых Kubernetes, подходящие для хоумлаба на основе Ubuntu с 3 узлами (16 ГБ ОЗУ, 4 ядра каждый), с акцентом на простоте установки и обслуживания, поддержке постоянных томов и LoadBalancers.