Ollama

Запуск больших языковых моделей (LLM) локально стал все более популярным из-за приватности, контроля затрат и возможностей офлайн-работы. Ландшафт значительно изменился в апреле 2025 года, когда Docker представил Docker Model Runner (DMR), свое официальное решение для развертывания моделей ИИ.

Клиенты Go для Ollama: сравнение SDK и примеры Qwen3/GPT-OSS

Этот гайд предоставляет всесторонний обзор доступных Go SDK для Ollama и сравнивает их функциональные возможности.

Вот сравнение между Qwen3:30b и GPT-OSS:20b, с акцентом на выполнение инструкций и параметры производительности, спецификации и скорость.

Интеграция Ollama с Python: примеры REST API и Python-клиента

В этой статье мы рассмотрим два способа подключения вашего Python-приложения к Ollama: 1. Через HTTP REST API; 2. Через официальную библиотеку Ollama для Python.

Проблемы структурированного вывода в Ollama GPT-OSS

Модели GPT-OSS от Ollama (https://www.glukhov.org/ru/llm-performance/ollama/ollama-gpt-oss-structured-output-issues/ “Ollama GPT-OSS”) постоянно сталкиваются с проблемами при работе со структурированным выводом, особенно при использовании с фреймворками вроде LangChain, OpenAI SDK, vllm и другими.

LLM и структурированный вывод: Ollama, Qwen3 & Python или Go

Большие языковые модели (LLM) мощные, но в производстве мы редко хотим свободноформатных абзацев. Вместо этого нам нужны предсказуемые данные: атрибуты, факты или структурированные объекты, которые можно передать в приложение. Это Структурированный вывод LLM.

Распределение памяти и планирование моделей в новой версии Ollama - v0.12.1

Здесь я сравниваю, сколько VRAM новая версия Ollama выделяет для модели по сравнению с предыдущей версией. Новая версия работает хуже.

Ollama быстро стал одним из самых популярных инструментов для запуска локальных моделей большого языка (LLM). Его простой интерфейс командной строки и упрощенное управление моделями сделали его предпочтительным вариантом для разработчиков, которые хотят работать с моделями ИИ вне облака.

Интерфейсы чатов для локальных экземпляров Ollama

Локально размещённый Ollama позволяет запускать большие языковые модели на вашем собственном устройстве, но использование его через командную строку не очень удобно. Вот несколько открытых проектов, которые предоставляют интерфейсы в стиле ChatGPT, подключающиеся к локальному Ollama.

Переранжирование документов с использованием Ollama и модели Qwen3 Reranker - на языке Go

Поскольку стандартный Ollama не имеет прямого API для переупорядочивания, вам нужно реализовать переупорядочивание с использованием Qwen3 Reranker на GO, генерируя векторы представлений для пар запрос-документ и оценивая их.

Сравнение качества перевода страниц Hugo с использованием языковых моделей на Ollama

В этом тесте я сравниваю, как разные ЛЛМ, размещенные на Ollama, переводят страницы Hugo на английском языке на немецкий.

Переранжирование текстов с использованием Ollama и Qwen3 Embedding LLM на языке Go

Этот маленький
Пример кода на Go для reranking вызывает Ollama для генерации вложений
для запроса и для каждого кандидата документа,
затем сортирует по убыванию косинусной схожести.

Модели Qwen3 Embedding & Reranker в Ollama: передовые достижения в производительности

Модели Qwen3 Embedding и Reranker являются последними выпусками в семействе Qwen, специально разработанными для продвинутых задач встраивания текста, извлечения и повторного ранжирования.

Производительность ЛЛМ и PCIe-каналы: ключевые аспекты

Как количество PCIe-полос влияет на производительность LLM? Зависит от задачи. Для обучения и многопроцессорной инференции - значительное падение производительности.

Конвертируйте содержимое HTML в Markdown с использованием LLM и Ollama

В библиотеке моделей Ollama есть модели, способные конвертировать HTML-контент в Markdown, что полезно для задач преобразования контента. Это руководство является частью нашего Инструменты документации в 2026: Markdown, LaTeX, PDF и рабочие процессы печати хаба.

Сравнение AI-ассистентов программирования

Список здесь некоторых инструментов для кодирования с помощью ИИ и AI Coding Assistants и их приятных сторон.

Ollama

Docker Model Runner против Ollama (2026): что лучше для локальных LLMs?

Клиенты Go для Ollama: сравнение SDK и примеры Qwen3/GPT-OSS

Сравнение: Qwen3:30b против GPT-OSS:20b

Интеграция Ollama с Python: примеры REST API и Python-клиента

Проблемы структурированного вывода в Ollama GPT-OSS

LLM и структурированный вывод: Ollama, Qwen3 & Python или Go

Распределение памяти и планирование моделей в новой версии Ollama - v0.12.1

Оллама Эншитификация: ранние признаки

Интерфейсы чатов для локальных экземпляров Ollama

Переранжирование документов с использованием Ollama и модели Qwen3 Reranker - на языке Go

Сравнение качества перевода страниц Hugo с использованием языковых моделей на Ollama

Переранжирование текстов с использованием Ollama и Qwen3 Embedding LLM на языке Go

Модели Qwen3 Embedding & Reranker в Ollama: передовые достижения в производительности

Производительность ЛЛМ и PCIe-каналы: ключевые аспекты

Конвертируйте содержимое HTML в Markdown с использованием LLM и Ollama

Сравнение AI-ассистентов программирования