NVidia

Benchmarks de LLM com 16 GB de VRAM usando llama.cpp (velocidade e contexto)

Aqui comparo a velocidade de vários LLMs executados em uma GPU com 16 GB de VRAM e escolho o melhor para auto-hospedagem.

Preços e Disponibilidade da RTX 5090 na Austrália em Março de 2026: A Realidade

A Austrália tem estoque de RTX 5090. Quase nada. E se você encontrar uma, pagará um prêmio que parece descolado da realidade.

Ollama no Docker Compose com GPU e Armazenamento Persistente de Modelos

Ollama funciona muito bem em metal nu. Torna-se ainda mais interessante quando tratado como um serviço: um endpoint estável, versões fixas, armazenamento persistente e uma GPU que está disponível ou não.

Comparando o desempenho de LLMs no Ollama em uma GPU com 16 GB de VRAM

Executar grandes modelos de linguagem (LLMs) localmente oferece privacidade, capacidade offline e zero custo de API. Este teste revela exatamente o que se pode esperar de 14 LLMs populares LLMs no Ollama em uma RTX 4080.

Melhores Emuladores de Terminal Linux: Comparativo 2026

Uma das ferramentas mais essenciais para usuários de Linux é o emulador de terminal.

Preços do DGX Spark AU: US$ 6.249–US$ 7.999 em grandes varejistas

O NVIDIA DGX Spark (GB10 Grace Blackwell) está agora disponível na Austrália nas principais lojas de computadores, com estoque local. Se você tem acompanhado os preços e disponibilidade globais do DGX Spark, terá interesse em saber que os preços na Austrália variam de A$ 6.249 a A$ 7.999, dependendo da configuração de armazenamento e do varejista.

Preços da NVIDIA RTX 5080 e RTX 5090 na Austrália - Novembro de 2025

Vamos comparar os preços das GPUs de consumo de topo, que são adequadas, em particular, para LLMs e, em geral, para IA. Especificamente, estou analisando os preços das RTX-5080 e RTX-5090.

Embeddings Multimodais: Conectando as Modalidades de IA

Embeddings multimodais representam um avanço na inteligência artificial, permitindo compreensão e raciocínio através de diferentes tipos de dados dentro de um espaço de representação unificado.

Infraestrutura de IA em Hardware de Consumo

A democratização da IA chegou. Com LLMs de código aberto como Llama, Mistral e Qwen rivalizando agora com modelos proprietários, as equipes podem construir uma poderosa infraestrutura de IA usando hardware de consumo - reduzindo drasticamente os custos enquanto mantêm controle total sobre a privacidade dos dados e a implantação.

Docker Model Runner: Guia de Configuração do Tamanho do Contexto

A configuração de tamanhos de contexto no Docker Model Runner é mais complexa do que deveria.

FLUX.1-Kontext-dev: Modelo de IA para Aumento de Imagens

A Black Forest Labs lançou o FLUX.1-Kontext-dev, um modelo avançado de IA para transformação de imagem em imagem que aprimora imagens existentes usando instruções de texto.

Adicionando Suporte a GPU NVIDIA ao Docker Model Runner

Docker Model Runner é a ferramenta oficial da Docker para executar modelos de IA localmente, mas habilitar a aceleração de GPU da NVidia no Docker Model Runner requer configuração específica.

NVIDIA DGX Spark vs. Mac Studio vs. RTX-4080: Comparação de Desempenho do Ollama

Descobri alguns testes de desempenho interessantes do GPT-OSS 120b rodando no Ollama em três plataformas diferentes: NVIDIA DGX Spark, Mac Studio e RTX 4080. O modelo GPT-OSS 120b da biblioteca Ollama pesa 65 GB, o que significa que ele não cabe na VRAM de 16 GB de uma RTX 4080 (ou na mais recente RTX 5080).

Apostila do Docker Model Runner: Comandos e Exemplos

Docker Model Runner (DMR) é a solução oficial do Docker para executar modelos de IA localmente, introduzida em abril de 2025. Esta lista de comandos essenciais fornece uma referência rápida para todos os comandos, configurações e melhores práticas.

Docker Model Runner vs Ollama (2026): Qual é Melhor para LLMs Locais?

Execução local de grandes modelos de linguagem (LLMs) tornou-se cada vez mais popular devido à privacidade, controle de custos e capacidades offline. O cenário mudou significativamente em abril de 2025, quando a Docker introduziu o Docker Model Runner (DMR), sua solução oficial para implantação de modelos de IA.

DGX Spark vs. Mac Studio: Análise de Preço do Supercomputador Pessoal de IA da NVIDIA

NVIDIA DGX Spark é real, à venda a partir de 15 de outubro de 2025, e voltado para desenvolvedores de CUDA que necessitam de trabalho local com LLMs, com uma pilha de IA da NVIDIA integrada. O MSRP nos EUA é de $3.999; o varejo no Reino Unido/Alemança/Japão é mais alto devido ao IVA e aos canais de distribuição. Os preços públicos de etiqueta em AUD/KRW ainda não foram amplamente divulgados.