Протокол Gemini: минималистичная альтернатива вебу

Протокол Gemini: минималистичная альтернатива вебу

Gemini — лёгкая и безопасная альтернатива вебу

Протокол Gemini представляет собой возврат к основам интернет-коммуникации — легковесный, безопасный и уважающий конфиденциальность альтернативный современному, все более сложному вебу.

Освоение Dev Containers в VS Code

Освоение Dev Containers в VS Code

Создавайте согласованные, переносимые и воспроизводимые среды разработки с помощью Dev Containers

Разработчики часто сталкиваются с проблемой “работает на моей машине”, вызванной несоответствиями зависимостей, версиями инструментов или различиями в операционных системах. Dev Containers в Visual Studio Code (VS Code) решают эту проблему элегантно — позволяя разрабатывать внутри контейнеризованной среды, специально настроенной для вашего проекта.

Сравнение: Qwen3:30b и GPT-OSS:20b

Сравнение: Qwen3:30b и GPT-OSS:20b

Сравнение скорости, параметров и производительности этих двух моделей

Ниже приведено сравнение Qwen3:30b и GPT-OSS:20b с акцентом на следовании инструкциям и параметрах производительности, спецификациях и скорости.

Платформа для федеративного блогинга WriteFreely — сравнение затрат на саморазмещение и управление

Платформа для федеративного блогинга WriteFreely — сравнение затрат на саморазмещение и управление

Приблизительные оценки стоимости хостинга по сравнению с подпиской.

Вот краткая информация о Write.as / WriteFreely - как это вписывается в fediverse, где можно получить управляемый хостинг, как выглядит тенденция использования, и как развернуть самостоятельно (плюс примерные расчеты стоимости).

Браузеры с акцентом на конфиденциальность: практическое руководство по более безопасному веб-серфингу

Браузеры с акцентом на конфиденциальность: практическое руководство по более безопасному веб-серфингу

Включая инструкции по установке для Windows, Linux и Mac

Конфиденциальность в интернете — актуальная тема. От таргетированной рекламы до скрытых трекеров, многие популярные браузеры делятся информацией о вас больше, чем вам бы хотелось. К счастью, существует несколько браузеров, ориентированных на конфиденциальность, которые помогут вам оставаться в безопасности и анонимно.

Цены на видеокарты NVidia RTX 5080 и RTX 5090 в Австралии — октябрь 2025 года

Цены на видеокарты NVidia RTX 5080 и RTX 5090 в Австралии — октябрь 2025 года

Цены на потребительские видеокарты, подходящие для ИИ — RTX 5080 и RTX 5090

Давайте сравним цены на топовые потребительские видеокарты, которые особенно подходят для работы с большими языковыми моделями (LLM) и искусственным интеллектом в целом. В частности, я рассматриваю цены на RTX-5080 и RTX-5090. Они немного снизились.

Создание, публикация и монетизация Alexa Skill

Создание, публикация и монетизация Alexa Skill

Как разработать Amazon Alexa Skill — инструкции.

В этой статье мы углубимся в разработку, тестирование и публикацию Alexa Skill. Мы также рассмотрим принципы дизайна, технические аспекты и лучшие практики, чтобы обеспечить увлекательный и естественный пользовательский опыт.

Проблемы структурированного вывода в Ollama GPT-OSS

Проблемы структурированного вывода в Ollama GPT-OSS

Не очень приятно.

Модели GPT-OSS от Ollama (https://www.glukhov.org/ru/llm-performance/ollama/ollama-gpt-oss-structured-output-issues/ “Ollama GPT-OSS”) постоянно сталкиваются с проблемами при работе со структурированным выводом, особенно при использовании с фреймворками вроде LangChain, OpenAI SDK, vllm и другими.

Сравнение структурированного вывода у популярных провайдеров LLM: OpenAI, Gemini, Anthropic, Mistral и AWS Bedrock

Сравнение структурированного вывода у популярных провайдеров LLM: OpenAI, Gemini, Anthropic, Mistral и AWS Bedrock

Для работы с несколько отличающимися API требуется особый подход.

Вот сравнительная таблица поддержки структурированного вывода (получение надежного JSON) у популярных провайдеров LLM, а также минимальные примеры на Python

Ограничение LLM с помощью структурированного вывода: Ollama, Qwen3 и Python или Go

Ограничение LLM с помощью структурированного вывода: Ollama, Qwen3 и Python или Go

Несколько способов получения структурированного вывода из Ollama

Большие языковые модели (LLM) являются мощным инструментом, однако в производственных условиях мы редко хотим получать свободные текстовые абзацы. Вместо этого нам нужны предсказуемые данные: атрибуты, факты или структурированные объекты, которые можно использовать в приложении. Это и есть Структурированный вывод LLM.

Подписаться

Получайте новые материалы про системы, инфраструктуру и AI engineering.