Self-Hosting

Проблемы структурированного вывода в Ollama GPT-OSS

Модели GPT-OSS от Ollama (https://www.glukhov.org/ru/llm-performance/ollama/ollama-gpt-oss-structured-output-issues/ “Ollama GPT-OSS”) постоянно сталкиваются с проблемами при работе со структурированным выводом, особенно при использовании с фреймворками вроде LangChain, OpenAI SDK, vllm и другими.

LLM и структурированный вывод: Ollama, Qwen3 & Python или Go

Большие языковые модели (LLM) мощные, но в производстве мы редко хотим свободноформатных абзацев. Вместо этого нам нужны предсказуемые данные: атрибуты, факты или структурированные объекты, которые можно передать в приложение. Это Структурированный вывод LLM.

Kubuntu против KDE Neon: техническое сравнение

Для поклонников KDE Plasma два дистрибутива Linux часто становятся предметом обсуждения: Kubuntu и KDE Neon. На первый взгляд они похожи - оба поставляются с KDE Plasma в качестве рабочей среды по умолчанию, оба основаны на Ubuntu и оба дружелюбны к новичкам.

Распределение памяти и планирование моделей в новой версии Ollama - v0.12.1

Здесь я сравниваю, сколько VRAM новая версия Ollama выделяет для модели по сравнению с предыдущей версией. Новая версия работает хуже.

Как изменить статический IP-адрес в Ubuntu Server

Это руководство проведет вас через процесс изменения статического IP-адреса на сервере Ubuntu.

Ollama быстро стал одним из самых популярных инструментов для запуска локальных моделей большого языка (LLM). Его простой интерфейс командной строки и упрощенное управление моделями сделали его предпочтительным вариантом для разработчиков, которые хотят работать с моделями ИИ вне облака.

Как установить сервер Mumble на Ubuntu и использовать Mumble на Android и iOS

Mumble — это бесплатное и открытое программное обеспечение для голосовой передачи данных (VoIP), предназначенное в основном для передачи голоса в реальном времени. Оно использует клиент-серверную архитектуру, где пользователи подключаются к общему серверу для общения друг с другом.

Интерфейсы чатов для локальных экземпляров Ollama

Локально размещённый Ollama позволяет запускать большие языковые модели на вашем собственном устройстве, но использование его через командную строку не очень удобно. Вот несколько открытых проектов, которые предоставляют интерфейсы в стиле ChatGPT, подключающиеся к локальному Ollama.

Приложения для мониторинга GPU в Linux / Ubuntu

Приложения для мониторинга нагрузки GPU: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.

Установка k3s на baremetal - пошаговое руководство и с использованием Terraform

Вот пошаговое руководство по установке кластера K3s из 3 узлов на серверах с “голым” железом (1 мастер + 2 рабочих узла).

Дистрибутивы Kubernetes — краткий обзор kubeadm, k3s, MicroK8s, Minikube, Talos Linux и RKE2

Сравнение дистрибутивов Kubernetes для саморазвертывания на bare-metal или домашних серверах, с акцентом на простоту установки, производительность, системные требования и функциональность.

Сравнение дистрибутивов Kubernetes для хоумлаба из 3 узлов

Я сравниваю варианты самонастраиваемых Kubernetes, подходящие для хоумлаба на основе Ubuntu с 3 узлами (16 ГБ ОЗУ, 4 ядра каждый), с акцентом на простоте установки и обслуживания, поддержке постоянных томов и LoadBalancers.

Шпаргалка по GitHub Actions - стандартная структура и список наиболее полезных действий

GitHub Actions — это платформа автоматизации и CI/CD внутри GitHub, используемая для сборки, тестирования и развертывания вашего кода на основе событий, таких как push, pull requests или по расписанию.

Шпаргалка Docker Compose - Самые полезные команды с примерами

Вот шпаргалка по Docker Compose с аннотированными примерами, чтобы помочь вам быстро освоить файлы и команды Compose.

Использование Obsidian для управления личными знаниями

Вот подробный разбор Obsidian как мощного инструмента для управления личными знаниями (PKM), объясняющий его архитектуру, функции, преимущества и то, как он поддерживает современные рабочие процессы знаний.

NVIDIA DGX Spark - новый мини-суперкомпьютер для ИИ

Nvidia готовится к выпуску NVIDIA DGX Spark - небольшого суперкомпьютера для ИИ на архитектуре Blackwell с 128+ ГБ объединённой оперативной памяти и производительностью 1 ПФЛОПС в области ИИ. Отличное устройство для запуска больших языковых моделей.