LLM - Page 5 - Rost Glukhov | Sitio personal y blog técnico

Detectando el AI Slop: Técnicas y señales de alerta

La proliferación de contenido generado por IA ha creado un nuevo desafío: distinguir entre escritura humana auténtica y “IA slop” - texto sintético de baja calidad, producido en masa.

Autohospedaje de Cognee: Elegir LLM en Ollama

Cognee es un marco de Python para construir grafos de conocimiento a partir de documentos utilizando LLMs. ¿Pero funciona con modelos autohospedados?

BAML vs Instructor: Salidas estructuradas de LLM

Al trabajar con modelos de lenguaje grandes (LLM) en producción, obtener salidas estructuradas y seguras en cuanto a tipos es fundamental. Dos marcos de trabajo populares, BAML e Instructor, adoptan enfoques diferentes para resolver este problema.

Elegir el LLM adecuado para Cognee: Configuración local de Ollama

Elegir el Mejor LLM para Cognee requiere equilibrar la calidad de construcción de gráficos, las tasas de alucinación y las restricciones de hardware. Cognee destaca con modelos grandes de baja alucinación (32B+) a través de Ollama pero las opciones de tamaño medio funcionan para configuraciones más ligeras.

Usar la API de búsqueda web de Ollama en Python

La biblioteca de Python de Ollama ahora incluye capacidades nativas de búsqueda web de OLLama. Con solo unas pocas líneas de código, puedes mejorar tus LLMs locales con información en tiempo real desde la web, reduciendo las alucinaciones e incrementando la precisión.

Comparación de almacenes vectoriales para RAG

Elegir el almacén de vectores adecuado puede hacer o deshacer el rendimiento, el costo y la escalabilidad de tu aplicación RAG. Esta comparación integral cubre las opciones más populares en 2024-2025.

Usando la API de búsqueda web de Ollama en Go

La API de búsqueda web de Ollama le permite mejorar los LLM locales con información en tiempo real de la web. Esta guía le muestra cómo implementar capacidades de búsqueda web en Go, desde llamadas simples a la API hasta agentes de búsqueda completos.

Ollama vs vLLM vs LM Studio: ¿La mejor forma de ejecutar LLMs localmente en 2026?

Ejecutar LLMs (Modelos de Lenguaje Grandes) de forma local es ahora práctico para desarrolladores, startups e incluso equipos empresariales.
Pero elegir la herramienta correcta — Ollama, vLLM, LM Studio, LocalAI u otras — depende de tus objetivos:

Go Microservicios para la Orquestación de IA/ML

A medida que las cargas de trabajo de IA y ML se vuelven cada vez más complejas, la necesidad de sistemas de orquestación robustos se ha vuelto más urgente. La simplicidad, el rendimiento y la concurrencia de Go lo convierten en una opción ideal para construir la capa de orquestación de pipelines de ML, incluso cuando los modelos mismos se escriben en Python.

Incrustaciones Multimodales: Conectando Modalidades de IA

Embeddings cruzales representan un avance significativo en inteligencia artificial, permitiendo entender y razonar entre diferentes tipos de datos dentro de un espacio de representación unificado.

Infraestructura de IA en hardware de consumo

La democratización de la IA está aquí. Con modelos de lenguaje de gran tamaño (LLM) de código abierto como Llama, Mistral y Qwen rivalizando ahora con los modelos propietarios, los equipos pueden construir una infraestructura de IA utilizando hardware de consumo, reduciendo drásticamente los costos mientras mantienen el control total sobre la privacidad de los datos y el despliegue.

RAG Avanzado: Explicación de LongRAG, Self-RAG y GraphRAG

Generación Aumentada con Recuperación (RAG) ha evolucionado mucho más allá de la simple búsqueda de similitud vectorial. LongRAG, Self-RAG y GraphRAG representan la vanguardia de estas capacidades.

FLUX.1-dev es un modelo poderoso de generación de imágenes a partir de texto que produce resultados asombrosos, pero su requisito de memoria de 24GB+ hace que sea difícil de ejecutar en muchos sistemas. GGUF quantization of FLUX.1-dev ofrece una solución, reduciendo el uso de memoria en aproximadamente un 50% mientras se mantiene una excelente calidad de imagen.

Guía de configuración del tamaño de contexto de Docker Model Runner

Configuración de tamaños de contexto en Docker Model Runner es más compleja de lo que debería ser.

FLUX.1-Kontext-dev: Modelo de IA para aumento de imágenes

Black Forest Labs ha lanzado FLUX.1-Kontext-dev, un avanzado modelo de inteligencia artificial de imagen a imagen que mejora imágenes existentes mediante instrucciones de texto.

Añadir soporte para GPU de NVIDIA al ejecutor de modelos de Docker

Docker Model Runner es la herramienta oficial de Docker para ejecutar modelos de IA localmente, pero habilitar la aceleración de GPU de NVidia en Docker Model Runner requiere una configuración específica.