Self-Hosting

Размещение локальных языковых моделей: Полное руководство на 2025 год - Ollama, vLLM, LocalAI, Jan, LM Studio и другие

Размещение локальных языковых моделей: Полное руководство на 2025 год - Ollama, vLLM, LocalAI, Jan, LM Studio и другие

Освойте локальное развертывание языковых моделей с сравнением 12+ инструментов

Локальное развертывание LLMs стало increasingly popular, так как разработчики и организации стремятся к повышенной конфиденциальности, снижению задержек и большему контролю над своей инфраструктурой ИИ.

Инфраструктура ИИ на потребительском оборудовании

Инфраструктура ИИ на потребительском оборудовании

Развертывание корпоративного ИИ на бюджетном оборудовании с открытыми моделями

Демократизация ИИ уже здесь. С открытыми моделями ИИ с открытым исходным кодом, такими как Llama 3, Mixtral и Qwen, которые теперь соперничают с проприетарными моделями, команды могут создавать мощную инфраструктуру ИИ с использованием потребительского оборудования - снижая затраты, сохраняя при этом полный контроль над конфиденциальностью данных и развертыванием.

Установка и использование Grafana на Ubuntu: полное руководство

Установка и использование Grafana на Ubuntu: полное руководство

Настройте Grafana для мониторинга и визуализации

Grafana — это ведущая открытая платформа для мониторинга и наблюдения, которая преобразует метрики, логи и трассировки в действенные инсайты через потрясающие визуализации.

StatefulSets и постоянное хранилище в Kubernetes

StatefulSets и постоянное хранилище в Kubernetes

Развёртывание приложений с сохранением состояния, упорядоченным масштабированием и постоянными данными

Kubernetes StatefulSets — это основное решение для управления приложениями с состоянием, которым требуются стабильные идентификаторы, постоянное хранилище и упорядоченные паттерны развертывания, что критически важно для баз данных, распределенных систем и кэш-услуг.

Запуск FLUX.1-dev GGUF Q8 в Python

Запуск FLUX.1-dev GGUF Q8 в Python

Ускорение FLUX.1-dev с квантованием GGUF

FLUX.1-dev — это мощная модель генерации изображений по тексту, которая производит потрясающие результаты, но её требование к памяти в 24 ГБ и более делает её сложной для запуска на многих системах. Квантование FLUX.1-dev в формате GGUF предлагает решение, уменьшая использование памяти примерно на 50% при сохранении отличного качества изображений.

FLUX.1-Kontext-dev: ИИ для преобразования изображений

FLUX.1-Kontext-dev: ИИ для преобразования изображений

Модель ИИ для дополнения изображений текстовыми инструкциями

Black Forest Labs выпустила FLUX.1-Kontext-dev, продвинутую модель искусственного интеллекта для преобразования изображений, которая дополняет существующие изображения с помощью текстовых инструкций.

Strapi против Directus против Payload: Сражение бесплатных CMS

Strapi против Directus против Payload: Сражение бесплатных CMS

Сравнение headless CMS: функции, производительность и случаи использования

Выбор правильной headless CMS может сделать или сломать вашу стратегию управления контентом. Давайте сравним три открытых решения, которые влияют на то, как разработчики создают приложения, основанные на контенте.

Самостоятельное развертывание Nextcloud: Ваше частное облачное решение

Самостоятельное развертывание Nextcloud: Ваше частное облачное решение

Управляйте своими данными с помощью облачного хранилища Nextcloud с саморазмещением

Nextcloud — это ведущая открытая платформа для хранения и совместной работы в облаке, которая полностью контролирует ваши данные.

Самостоятельное размещение Immich: частное фотооблако

Самостоятельное размещение Immich: частное фотооблако

Ваши фотографии на самоуправляемом AI-облаке

Immich — это революционное открытое программное обеспечение с открытым исходным кодом для управления фотографиями и видео, которое дает вам полный контроль над вашими воспоминаниями. С функциями, сопоставимыми с Google Photos, включая распознавание лиц с использованием ИИ, умный поиск и автоматическое резервное копирование с мобильных устройств, при этом все ваши данные остаются конфиденциальными и защищенными на вашем собственном сервере.

Шпаргалка по Elasticsearch: Основные команды и советы

Шпаргалка по Elasticsearch: Основные команды и советы

Команды Elasticsearch для поиска, индексирования и анализа

Elasticsearch — это мощный распределенный поисковый и аналитический движок, построенный на Apache Lucene. Это подробное руководство содержит основные команды, лучшие практики и быстрые ссылки для работы с кластерами Elasticsearch.

Сравнение производительности Ollama: NVIDIA DGX Spark против Mac Studio против RTX-4080

Сравнение производительности Ollama: NVIDIA DGX Spark против Mac Studio против RTX-4080

Бенчмарки GPT-OSS 120b на трёх платформах ИИ

Я выкопал некоторые интересные тесты производительности GPT-OSS 120b, работающей на Ollama на трех разных платформах: NVIDIA DGX Spark, Mac Studio и RTX 4080. Модель GPT-OSS 120b из библиотеки Ollama весит 65ГБ, что означает, что она не помещается в 16ГБ видеопамяти RTX 4080 (или более новой RTX 5080).