Проблемы структурированного вывода в Ollama GPT-OSS

Проблемы структурированного вывода в Ollama GPT-OSS

Не очень приятно.

Модели GPT-OSS от Ollama (https://www.glukhov.org/ru/llm-performance/ollama/ollama-gpt-oss-structured-output-issues/ “Ollama GPT-OSS”) постоянно сталкиваются с проблемами при работе со структурированным выводом, особенно при использовании с фреймворками вроде LangChain, OpenAI SDK, vllm и другими.

Сравнение структурированного вывода среди популярных поставщиков LLM — OpenAI, Gemini, Anthropic, Mistral и AWS Bedrock

Сравнение структурированного вывода среди популярных поставщиков LLM — OpenAI, Gemini, Anthropic, Mistral и AWS Bedrock

Немного отличающиеся API требуют особого подхода.

Вот сравнение поддержки структурированного вывода (получение надежного JSON) среди популярных поставщиков LLM, а также минимальные примеры на Python

LLM и структурированный вывод: Ollama, Qwen3 & Python или Go

LLM и структурированный вывод: Ollama, Qwen3 & Python или Go

Несколько способов получения структурированного вывода из Ollama

Большие языковые модели (LLM) мощные, но в производстве мы редко хотим свободноформатных абзацев. Вместо этого нам нужны предсказуемые данные: атрибуты, факты или структурированные объекты, которые можно передать в приложение. Это Структурированный вывод LLM.

Преобразование документов Word в Markdown: полное руководство

Преобразование документов Word в Markdown: полное руководство

Использование pandoc, python или онлайн-инструментов для конвертации в MD

Перевод документов Word в формат Markdown (https://www.glukhov.org/ru/documentation-tools/markdown/converting-word-document-to-markdown/ “Перевод документов Word в Markdown”) является очень распространенной задачей для технических писателей, разработчиков и создателей контента, которые хотят перенести свой контент на платформы, поддерживающие Markdown (например, GitHub, GitLab, генераторы статических сайтов, такие как Hugo). Эта статья является частью нашего Руководства по инструментам документации в 2026 году: Markdown, LaTeX, PDF и рабочие процессы печати.

Пользовательская база и популярность Jabber / XMPP

Пользовательская база и популярность Jabber / XMPP

Некоторые статистические данные Jabber / XMPP

Jabber (ныне чаще всего называемый XMPP) — это открытый протокол связи и набор клиентских приложений, которые обеспечивают мгновенное обмен сообщениями, голосовые/видеозвонки, конференции, совместное использование рабочего стола и функции присутствия для отдельных пользователей и организаций.

LaTeX на Windows 11 & 10: Распределения, сравнения и пошаговая установка

LaTeX на Windows 11 & 10: Распределения, сравнения и пошаговая установка

MiKTeX vs TeX Live vs TinyTeX

Если вы пишете технические документы, статьи или книги на Windows, вы почти наверняка выберете одну из трёх распространений LaTeX для Windows 11. Это руководство является частью нашего Инструменты документации в 2026: Markdown, LaTeX, PDF и рабочие процессы печати хаба.

Kubuntu против KDE Neon: техническое сравнение

Kubuntu против KDE Neon: техническое сравнение

Пробовал как Kubuntu, так и KDE Neon, но Kubuntu более стабилен.

Для поклонников KDE Plasma два дистрибутива Linux часто становятся предметом обсуждения: Kubuntu и KDE Neon. На первый взгляд они похожи - оба поставляются с KDE Plasma в качестве рабочей среды по умолчанию, оба основаны на Ubuntu и оба дружелюбны к новичкам.

Оллама Эншитификация: ранние признаки

Оллама Эншитификация: ранние признаки

Моё мнение о текущем состоянии разработки Ollama

Ollama быстро стал одним из самых популярных инструментов для запуска локальных моделей большого языка (LLM). Его простой интерфейс командной строки и упрощенное управление моделями сделали его предпочтительным вариантом для разработчиков, которые хотят работать с моделями ИИ вне облака.

Как установить сервер Mumble на Ubuntu и использовать Mumble на Android и iOS

Как установить сервер Mumble на Ubuntu и использовать Mumble на Android и iOS

Альтернативная платформа голосовой связи по IP

Mumble — это бесплатное и открытое программное обеспечение для голосовой передачи данных (VoIP), предназначенное в основном для передачи голоса в реальном времени. Оно использует клиент-серверную архитектуру, где пользователи подключаются к общему серверу для общения друг с другом.

Технические мероприятия в Мельбурне в 2025-2026 годах

Технические мероприятия в Мельбурне в 2025-2026 годах

Куда поехать в Мельбурне?

Ниже представлен тщательно отобранный список конференций, митапов и мастер-классов, посвященных разработке программного обеспечения, облачным вычислениям, ИТ и ИИ, запланированных в Мельбурне, Австралия, между августом 2025 и декабрем 2026 года.

Интерфейсы чатов для локальных экземпляров Ollama

Интерфейсы чатов для локальных экземпляров Ollama

Краткий обзор наиболее заметных интерфейсов для Ollama в 2025 году

Локально размещённый Ollama позволяет запускать большие языковые модели на вашем собственном устройстве, но использование его через командную строку не очень удобно. Вот несколько открытых проектов, которые предоставляют интерфейсы в стиле ChatGPT, подключающиеся к локальному Ollama.