Self-Hosting

Сравнение производительности Ollama: NVIDIA DGX Spark против Mac Studio против RTX-4080

Сравнение производительности Ollama: NVIDIA DGX Spark против Mac Studio против RTX-4080

Бенчмарки GPT-OSS 120b на трёх платформах ИИ

Я выкопал некоторые интересные тесты производительности GPT-OSS 120b, работающего на Ollama на трех разных платформах: NVIDIA DGX Spark, Mac Studio и RTX 4080. Модель GPT-OSS 120b из библиотеки Ollama весит 65ГБ, что означает, что она не помещается в 16ГБ видеопамяти RTX 4080 (или более новой RTX 5080).

Шпаргалка по Docker Model Runner: команды и примеры

Шпаргалка по Docker Model Runner: команды и примеры

Быстрая справка по командам Docker Model Runner

Docker Model Runner (DMR) — это официальное решение Docker для запуска моделей ИИ локально, представленное в апреле 2025 года. Этот справочник предоставляет быстрый доступ ко всем основным командам, настройкам и лучшим практикам.

Docker Model Runner против Ollama (2026): что лучше для локальных LLMs?

Docker Model Runner против Ollama (2026): что лучше для локальных LLMs?

Сравните Docker Model Runner и Ollama для локальных LLM

Запуск больших языковых моделей (LLM) локально стал все более популярным из-за приватности, контроля затрат и возможностей офлайн-работы. Ландшафт значительно изменился в апреле 2025 года, когда Docker представил Docker Model Runner (DMR), свое официальное решение для развертывания моделей ИИ.

GNOME Boxes: Полное руководство по функциям, преимуществам, проблемам и альтернативам

GNOME Boxes: Полное руководство по функциям, преимуществам, проблемам и альтернативам

Простое управление виртуальными машинами в Linux с помощью GNOME Boxes

В современном вычислительном ландшафте виртуализация стала неотъемлемой частью разработки, тестирования и запуска нескольких операционных систем. Для пользователей Linux, ищущих простой и интуитивно понятный способ управления виртуальными машинами, GNOME Boxes выделяется как легковесный и удобный вариант, который делает акцент на простоте использования без ущерба для функциональности.

За пределами Google: руководство по альтернативным поисковым системам

За пределами Google: руководство по альтернативным поисковым системам

Исследуйте альтернативные поисковые системы помимо Google и Bing

Хотя Google доминирует на рынке поисковых систем с долей более 90% в глобальном масштабе, существует растущая экосистема альтернативных поисковых систем, предлагающих различные подходы к веб-поиску.

Возвышение ASIC для LLM: Почему аппаратное обеспечение инференса имеет значение

Возвышение ASIC для LLM: Почему аппаратное обеспечение инференса имеет значение

Специализированные чипы ускоряют и удешевляют выводы ИИ

Будущее ИИ не ограничивается более умными моделями - это также вопрос более умного кремния. Специализированное оборудование для инференса ЛЛМ приводит к революции, аналогичной переходу майнинга биткоинов к ASIC.

Инди-веб: Возвращение цифровой независимости

Инди-веб: Возвращение цифровой независимости

Владейте своим контентом и контролируйте свою идентичность

Веб-сети изначально были разработаны как децентрализованная сеть, где любой мог публиковать и подключаться. Со временем корпоративные платформы консолидировали контроль, создавая закрытые сады, где пользователи являются продуктами, а контент заперт. Движение Indie Web стремится вернуть первоначальное обещание веба: личное владение, творческая свобода и подлинное взаимодействие.

DGX Spark против Mac Studio: сравнение цен на персональный суперкомпьютер NVIDIA для ИИ

DGX Spark против Mac Studio: сравнение цен на персональный суперкомпьютер NVIDIA для ИИ

Доступность, реальные розничные цены в шести странах и сравнение с Mac Studio.

NVIDIA DGX Spark — это реальное устройство, которое поступит в продажу 15 октября 2025 года, и оно предназначено для разработчиков CUDA, которым нужна локальная работа с LLM с интегрированным NVIDIA AI stack. Рекомендуемая розничная цена в США — $3,999; в Великобритании, Германии и Японии розничные цены выше из-за НДС и каналов сбыта. Австралийские и корейские вон пока не опубликованы широко.

Протокол Gemini: минималистичная альтернатива вебу

Протокол Gemini: минималистичная альтернатива вебу

Gemini — лёгкая и безопасная альтернатива вебу

Протокол Gemini представляет собой возврат к основам интернет-коммуникации — легковесный, безопасный и уважающий конфиденциальность альтернативный современному, все более сложному вебу.

Сравнение: Qwen3:30b против GPT-OSS:20b

Сравнение: Qwen3:30b против GPT-OSS:20b

Сравнение скорости, параметров и производительности этих двух моделей

Вот сравнение между Qwen3:30b и GPT-OSS:20b, с акцентом на выполнение инструкций и параметры производительности, спецификации и скорость.

Платформа для федеративного блогинга WriteFreely — сравнение затрат на саморазмещение и управление

Платформа для федеративного блогинга WriteFreely — сравнение затрат на саморазмещение и управление

Приблизительные оценки стоимости хостинга по сравнению с подпиской.

Вот краткая информация о Write.as / WriteFreely - как это вписывается в fediverse, где можно получить управляемый хостинг, как выглядит тенденция использования, и как развернуть самостоятельно (плюс примерные расчеты стоимости).

Цены на видеокарты NVIDIA RTX 5080 и RTX 5090 в Австралии - октябрь 2025 года

Цены на видеокарты NVIDIA RTX 5080 и RTX 5090 в Австралии - октябрь 2025 года

Цены на потребительские GPU, подходящие для ИИ - RTX 5080 и RTX 5090

Снова и снова сравним цены на топовые потребительские GPU, которые подходят для ЛЛМ в частности и ИИ в целом. Конкретно я смотрю на цены на RTX-5080 и RTX-5090. Они немного снизились.