Приложения для мониторинга GPU в Linux / Ubuntu
Краткий список приложений для мониторинга нагрузки на GPU
Приложения для мониторинга нагрузки GPU: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.
Краткий список приложений для мониторинга нагрузки на GPU
Приложения для мониторинга нагрузки GPU: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.
Установка little k3s Kubernetes в кластере homelab
Вот пошаговое руководство по установке кластера K3s из 3 узлов на серверах с “голым” железом (1 мастер + 2 рабочих узла).
Краткий обзор вариантов Kubernetes
Сравнение дистрибутивов Kubernetes для саморазвертывания на bare-metal или домашних серверах, с акцентом на простоту установки, производительность, системные требования и функциональность.
Выбор лучшего варианта Kubernetes для нашего домашнего лабораторного стенда
Я сравниваю варианты самонастраиваемых Kubernetes, подходящие для хоумлаба на основе Ubuntu с 3 узлами (16 ГБ ОЗУ, 4 ядра каждый), с акцентом на простоте установки и обслуживания, поддержке постоянных томов и LoadBalancers.
Несколько слов о распространённых GitHub Actions и их структуре.
GitHub Actions — это платформа автоматизации и CI/CD внутри GitHub, используемая для сборки, тестирования и развертывания вашего кода на основе событий, таких как push, pull requests или по расписанию.
Кстати, docker-compose отличается от docker compose...
Вот шпаргалка по Docker Compose с аннотированными примерами, чтобы помочь вам быстро освоить файлы и команды Compose.
Оbsidian ...
Вот подробный разбор Obsidian как мощного инструмента для управления личными знаниями (PKM), объясняющий его архитектуру, функции, преимущества и то, как он поддерживает современные рабочие процессы знаний.
В июле 2025 года скоро должно стать доступным
Nvidia готовится к выпуску NVIDIA DGX Spark - небольшого суперкомпьютера для ИИ на архитектуре Blackwell с 128+ ГБ объединённой оперативной памяти и производительностью 1 ПФЛОПС в области ИИ. Отличное устройство для запуска больших языковых моделей.
Какие системы веб-аналитики использовать на вашем сайте?
Давайте быстро рассмотрим Matomo, Plausible, Google и другие поставщики и системы веб-аналитики доступные для самохостинга и сравним их.
Примечания к стандартной последовательности установки Ubuntu 24.04
Вот мой любимый набор шагов при установке свежей установки Ubuntu 24.04. Что мне нравится здесь - нет необходимости устанавливать драйверы NVidia! они устанавливаются автоматически.
Я использовал Dokuwiki в качестве личного хранилища знаний
Dokuwiki — это самодостаточная википедия, которую можно легко разместить на собственных серверах без необходимости использования баз данных. Я запускал её в Docker-контейнерах на своём домашнем кластере Kubernetes.
Обновление цен на GPU, подходящие для ИИ - RTX 5080 и RTX 5090
Давайте сравним цены на топовые потребительские GPU, которые подходят для ЛЛМ и ИИ в целом. В частности, обратите внимание на цены на RTX 5080 и RTX 5090. Они немного снизились.
Отличный фреймворк для ETS/MLOPS на Python
Apache Airflow — это открытая платформа, предназначенная для программного создания, планирования и мониторинга рабочих процессов — полностью на языке Python, предлагающая гибкую и мощную альтернативу традиционным, ручным или основанным на интерфейсе инструментам для работы с рабочими процессами.
Реализуете RAG? Вот несколько фрагментов кода на Go - 2...
Поскольку стандартный Ollama не имеет прямого API для переупорядочивания, вам нужно реализовать переупорядочивание с использованием Qwen3 Reranker на GO, генерируя векторы представлений для пар запрос-документ и оценивая их.
qwen3 8b, 14b и 30b, devstral 24b, mistral small 24b
В этом тесте я сравниваю, как разные LLM, размещённые на Ollama, переводят Hugo-страницу с английского на немецкий.
Три страницы, которые я протестировал, были на разных темах, имели хорошее markdown-форматирование с определённой структурой: заголовки, списки, таблицы, ссылки и т.д.
Реализуете RAG? Вот несколько фрагментов кода на языке Golang.
Этот маленький
Пример кода на Go для reranking вызывает Ollama для генерации вложений
для запроса и для каждого кандидата документа,
затем сортирует по убыванию косинусной схожести.