AI - Page 3 - Rost Glukhov | Sitio personal y blog técnico

Limitar LLMs con salida estructurada: Ollama, Qwen3 & Python o Go

Modelos de Lenguaje Grande (LLMs) son poderosos, pero en producción raramente queremos párrafos libres. En su lugar, queremos datos predecibles: atributos, hechos u objetos estructurados que puedas alimentar en una aplicación. Eso es Salida Estructurada de LLM.

Modelo de programación de asignación de memoria en la nueva versión de Ollama - v0.12.1

Aquí estoy comparando cuánta VRAM asigna la nueva versión de Ollama al modelo con la versión anterior de Ollama. La nueva versión es peor.

Enshittificación de Ollama: los primeros signos

Ollama ha pasado rápidamente a ser una de las herramientas más populares para ejecutar LLMs localmente.
Su CLI simple y su gestión de modelos optimizada han hecho que sea una opción favorita para desarrolladores que desean trabajar con modelos de IA fuera de la nube.
Pero, al igual que con muchas plataformas prometedoras, ya hay señales de Enshittification:

Interfaz de chat para instancias locales de Ollama

Locally hosted Ollama permite ejecutar modelos de lenguaje grandes en tu propia máquina, pero usarlo desde la línea de comandos no es muy amigable para el usuario. Aquí hay varios proyectos de código abierto que ofrecen interfaces estilo ChatGPT que se conectan a un Ollama local.

Hoja de trucos de GitHub Copilot - Descripción y comandos útiles

Aquí tienes una hoja de trucos actualizada de GitHub Copilot, que cubre atajos esenciales, comandos, consejos de uso y características de contexto para Visual Studio Code y Copilot Chat

Popularidad de los lenguajes de programación y herramientas para desarrolladores de software

La carta de The Pragmatic Engineer publicada hace unos días presentó estadísticas de una encuesta sobre la popularidad de lenguajes de programación, IDEs, herramientas de IA y otros datos para mediados de 2025.

NVIDIA DGX Spark - nuevo pequeño superordenador de inteligencia artificial

Nvidia está a punto de lanzar NVIDIA DGX Spark - pequeño superordenador de IA basado en la arquitectura Blackwell con 128+GB de memoria unificada y un rendimiento de IA de 1 PFLOPS. Dispositivo interesante para ejecutar LLMs.

Protocolo de contexto del modelo (MCP), y notas sobre la implementación del servidor MCP en Go

Aquí tenemos una descripción del Protocolo de Contexto del Modelo (MCP), notas breves sobre cómo implementar un servidor MCP en Go, incluyendo la estructura de mensajes y las especificaciones del protocolo.

Reordenar documentos con Ollama y el modelo Qwen3 Reranker - en Go

Dado que el Ollama estándar no tiene una API de rerank directa, tendrás que implementar reranking usando Qwen3 Reranker en GO generando embeddings para pares de consulta y documentos y calificándolos.

Un frío día de invierno en julio… que es en Australia… sentí la urgente necesidad de entrenar un modelo de IA para detectar barras de refuerzo de concreto sin tapones…

Comparación de la calidad de la traducción de páginas en Hugo - LLMs en Ollama

En este test estoy comparando cómo diferentes LLMs alojados en Ollama traducen una página Hugo del inglés al alemán. Tres páginas que probé estaban sobre temas diferentes, tenían algún buen markdown con cierta estructura: encabezados, listas, tablas, enlaces, etc.

Reclasificación de textos con Ollama y Qwen3 Embedding LLM - en Go

Este pequeño Ejemplo de código Go para reranking llama a Ollama para generar embeddings para la consulta y para cada documento candidato, luego ordenando de forma descendente por similitud coseno.

Modelos de incrustación y reordenación de Qwen3 en Ollama: rendimiento de vanguardia

Los modelos de incrustación y reordenamiento de Qwen3 son las últimas versiones lanzadas en la familia Qwen, especialmente diseñados para tareas avanzadas de incrustación de texto, recuperación y reordenamiento.

Comparando la idoneidad de las GPU de NVidia para la IA

En medio del caos del mundo moderno aquí estoy comparando especificaciones técnicas de diferentes tarjetas adecuadas para tareas de IA
(Deep Learning,
Deteción de objetos
y LLMs).
Aunque todas son increíblemente caras.

Vibe coding es un enfoque de programación impulsado por IA donde los desarrolladores describen la funcionalidad deseada en lenguaje natural, permitiendo que las herramientas de IA generen código automáticamente.

He utilizado bastante MMDetection (mmengine, mdet, mmcv),
y ahora parece que ya no está en juego.
Es una lástima. Me gustaba su zoo de modelos.

AI

Limitar LLMs con salida estructurada: Ollama, Qwen3 & Python o Go

Modelo de programación de asignación de memoria en la nueva versión de Ollama - v0.12.1

Enshittificación de Ollama: los primeros signos

Interfaz de chat para instancias locales de Ollama

Hoja de trucos de GitHub Copilot - Descripción y comandos útiles

Popularidad de los lenguajes de programación y herramientas para desarrolladores de software

NVIDIA DGX Spark - nuevo pequeño superordenador de inteligencia artificial

Protocolo de contexto del modelo (MCP), y notas sobre la implementación del servidor MCP en Go

Reordenar documentos con Ollama y el modelo Qwen3 Reranker - en Go

Detección de objetos con Tensorflow

Comparación de la calidad de la traducción de páginas en Hugo - LLMs en Ollama

Reclasificación de textos con Ollama y Qwen3 Embedding LLM - en Go

Modelos de incrustación y reordenación de Qwen3 en Ollama: rendimiento de vanguardia

Comparando la idoneidad de las GPU de NVidia para la IA

Vibe Coding - Significado y descripción

MMdetection ya no es compatible