Self-Hosting

Вот сравнение между Qwen3:30b и GPT-OSS:20b, с акцентом на выполнение инструкций и параметры производительности, спецификации и скорость.

Платформа для федеративного блогинга WriteFreely — сравнение затрат на саморазмещение и управление

Вот краткая информация о Write.as / WriteFreely - как это вписывается в fediverse, где можно получить управляемый хостинг, как выглядит тенденция использования, и как развернуть самостоятельно (плюс примерные расчеты стоимости).

Интеграция Ollama с Python: примеры REST API и Python-клиента

В этой статье мы рассмотрим два способа подключения вашего Python-приложения к Ollama: 1. Через HTTP REST API; 2. Через официальную библиотеку Ollama для Python.

Proxmox в 2025 году: практичный универсальный стек виртуализации

Proxmox Virtual Environment (Proxmox VE) — это открытая платформа гипервизора типа 1 и оркестрации дата-центров, построенная на основе Debian.

Цены на видеокарты NVidia RTX 5080 и RTX 5090 в Австралии — октябрь 2025 года

Давайте сравним цены на топовые потребительские видеокарты, которые особенно подходят для работы с большими языковыми моделями (LLM) и искусственным интеллектом в целом. В частности, я рассматриваю цены на RTX-5080 и RTX-5090. Они немного снизились.

Проблемы структурированного вывода в Ollama GPT-OSS

Модели GPT-OSS от Ollama (https://www.glukhov.org/ru/llm-performance/ollama/ollama-gpt-oss-structured-output-issues/ “Ollama GPT-OSS”) постоянно сталкиваются с проблемами при работе со структурированным выводом, особенно при использовании с фреймворками вроде LangChain, OpenAI SDK, vllm и другими.

LLM и структурированный вывод: Ollama, Qwen3 & Python или Go

Большие языковые модели (LLM) мощные, но в производстве мы редко хотим свободноформатных абзацев. Вместо этого нам нужны предсказуемые данные: атрибуты, факты или структурированные объекты, которые можно передать в приложение. Это Структурированный вывод LLM.

Kubuntu против KDE Neon: техническое глубокое погружение

Для поклонников KDE Plasma в обсуждениях часто фигурируют две дистрибуции Linux: [Kubuntu и KDE Neon](https://www.glukhov.org/ru/developer-tools/comparisons/kubuntu-vs-kde-neon/ “Kubuntu vs KDE Neon”). На первый взгляд они могут показаться похожими — обе поставляются с KDE Plasma в качестве рабочего стола по умолчанию, обе основаны на Ubuntu и обе дружелюбны к новичкам.

Распределение памяти и планирование моделей в новой версии Ollama - v0.12.1

Здесь я сравниваю, сколько VRAM новая версия Ollama выделяет для модели по сравнению с предыдущей версией. Новая версия работает хуже.

Как изменить статический IP-адрес в Ubuntu Server

Это руководство проведет вас через процесс изменения статического IP-адреса на сервере Ubuntu.

Ollama быстро стал одним из самых популярных инструментов для запуска локальных моделей большого языка (LLM). Его простой интерфейс командной строки и упрощенное управление моделями сделали его предпочтительным вариантом для разработчиков, которые хотят работать с моделями ИИ вне облака.

Как установить сервер Mumble на Ubuntu и использовать Mumble на Android и iOS

Mumble — это бесплатное и открытое программное обеспечение для голосовой передачи данных (VoIP), предназначенное в основном для передачи голоса в реальном времени. Оно использует клиент-серверную архитектуру, где пользователи подключаются к общему серверу для общения друг с другом.

Интерфейсы чатов для локальных экземпляров Ollama

Локально размещённый Ollama позволяет запускать большие языковые модели на вашем собственном устройстве, но использование его через командную строку не очень удобно. Вот несколько открытых проектов, которые предоставляют интерфейсы в стиле ChatGPT, подключающиеся к локальному Ollama.

Приложения для мониторинга GPU в Linux / Ubuntu

Приложения для мониторинга нагрузки GPU: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.

Установка k3s на baremetal - пошаговое руководство и с использованием Terraform

Вот пошаговое руководство по установке кластера K3s из 3 узлов на серверах с “голым” железом (1 мастер + 2 рабочих узла).

Дистрибутивы Kubernetes — краткий обзор kubeadm, k3s, MicroK8s, Minikube, Talos Linux и RKE2

Сравнение дистрибутивов Kubernetes для саморазвертывания на bare-metal или домашних серверах, с акцентом на простоту установки, производительность, системные требования и функциональность.

Self-Hosting

Сравнение: Qwen3:30b против GPT-OSS:20b

Платформа для федеративного блогинга WriteFreely — сравнение затрат на саморазмещение и управление

Интеграция Ollama с Python: примеры REST API и Python-клиента

Proxmox в 2025 году: практичный универсальный стек виртуализации

Цены на видеокарты NVidia RTX 5080 и RTX 5090 в Австралии — октябрь 2025 года

Проблемы структурированного вывода в Ollama GPT-OSS

LLM и структурированный вывод: Ollama, Qwen3 & Python или Go

Kubuntu против KDE Neon: техническое глубокое погружение

Распределение памяти и планирование моделей в новой версии Ollama - v0.12.1

Как изменить статический IP-адрес в Ubuntu Server

Оллама Эншитификация: ранние признаки

Как установить сервер Mumble на Ubuntu и использовать Mumble на Android и iOS

Интерфейсы чатов для локальных экземпляров Ollama

Приложения для мониторинга GPU в Linux / Ubuntu

Установка k3s на baremetal - пошаговое руководство и с использованием Terraform

Дистрибутивы Kubernetes — краткий обзор kubeadm, k3s, MicroK8s, Minikube, Talos Linux и RKE2