DevOps

Modo Router de Llama-Server: Cambio dinámico de modelos sin reinicios

Durante mucho tiempo, llama.cpp tenía una limitación evidente:
solo podías servir un modelo por proceso, y cambiar implicaba un reinicio.

Plugins de OpenClaw: Guía del Ecosistema y Opciones Prácticas

Este artículo trata sobre los plugins de OpenClaw: paquetes de puerta de enlace nativa que añaden canales, proveedores de modelos, herramientas, voz, memoria, medios, búsqueda web y otras superficies de tiempo de ejecución.

Asistente de IA Hermes: Instalación, configuración, flujo de trabajo y solución de problemas

El Agente Hermes es un asistente de IA autoalojado y agnóstico al modelo que se ejecuta en una máquina local o en un VPS de bajo costo, funciona a través de interfaces de terminal y mensajería, y mejora con el tiempo al convertir tareas repetidas en habilidades reutilizables.

Acceso remoto a Ollama mediante Tailscale o WireGuard, sin puertos públicos.

Ollama funciona mejor cuando se trata como un demonio local: la CLI y sus aplicaciones se comunican con una API HTTP de bucle local, y el resto de la red nunca descubre su existencia.

Ollama en Docker Compose con GPU y almacenamiento persistente de modelos

Ollama funciona muy bien en hardware físico (bare metal). Se vuelve aún más interesante cuando lo tratas como un servicio: un punto de conexión estable, versiones fijas, almacenamiento persistente y una GPU que está disponible o no lo está.

Ollama detrás de un proxy inverso con Caddy o Nginx para streaming HTTPS

Ejecutar Ollama detrás de un proxy inverso es la forma más sencilla de obtener HTTPS, control de acceso opcional y un comportamiento de transmisión predecible.

Apache Flink en K8s y Kafka: PyFlink, Go, operaciones y precios gestionados

Apache Flink es un marco para computaciones con estado sobre flujos de datos acotados y no acotados.

Base de datos gráfica Neo4j para GraphRAG, instalación, Cypher, vectores y operaciones.

Neo4j es a lo que recurres cuando las relaciones son los datos. Si tu dominio parece un pizarrón lleno de círculos y flechas, forzarlo en tablas es doloroso.

IndexNow explicado: notifique a los motores de búsqueda cuando publique.

Los sitios estáticos y los blogs cambian cada vez que realizas una implementación. Los motores de búsqueda que admiten IndexNow pueden enterarse de esos cambios sin tener que esperar al próximo rastreo ciego.

Inicio rápido de SGLang: instalar, configurar y servir modelos LLM a través de la API de OpenAI.

SGLang es un marco de servicio de alto rendimiento para grandes modelos de lenguaje y modelos multimodales, diseñado para ofrecer inferencia de baja latencia y alto rendimiento en todo, desde una sola GPU hasta clústeres distribuidos.

Inicio rápido de Apache Kafka: instalar Kafka 4.2 con CLI y ejemplos locales

Apache Kafka 4.2.0 es la versión actual admitida y es la mejor base para una implementación rápida moderna, ya que Kafka 4.x carece completamente de ZooKeeper y se basa en KRaft de forma predeterminada.

Inicio rápido de llama.swap Model Switcher para modelos LLM locales compatibles con OpenAI

Pronto estarás manejando vLLM, llama.cpp y más, cada stack en su propio puerto. Todo lo que viene aguas abajo aún quiere una URL base /v1; de lo contrario, seguirás moviendo puertos, perfiles y scripts de una sola vez. llama-swap es el proxy /v1 antes de esos stacks.

Herramientas para desarrolladores: La guía completa de los flujos de trabajo de desarrollo modernos

El desarrollo de software implica el uso de Git para el control de versiones, Docker para la contenerización, Bash para la automatización, PostgreSQL para bases de datos y VS Code para la edición, junto con innumerables otras herramientas que pueden hacer o romper tu productividad. Esta página recopila las hojas de referencia, flujos de trabajo y comparaciones esenciales que necesitas para trabajar de manera eficiente en toda la pila de desarrollo.

LocalAI QuickStart: Ejecute LLM compatibles con OpenAI localmente

LocalAI es un servidor de inferencia autohospedado y local-first diseñado para comportarse como una API de OpenAI de reemplazo directo para ejecutar cargas de trabajo de IA en tu propio hardware (portátil, estación de trabajo o servidor local).

Inicio rápido de llama.cpp con CLI y servidor

Sigo volviendo a llama.cpp para la inferencia local: te da un control que Ollama y otros abstraen, y simplemente funciona. Es fácil ejecutar modelos GGUF de forma interactiva con llama-cli o exponer una API HTTP compatible con OpenAI con llama-server.

Herramientas de desarrollo de IA: La guía completa para el desarrollo potenciado por inteligencia artificial

La Inteligencia Artificial está transformando la forma en que se escribe, revisa, despliega y mantiene el software. Desde asistentes de codificación impulsados por IA hasta la automatización de GitOps y flujos de trabajo de DevOps, los desarrolladores ahora dependen de herramientas potenciadas por IA en todo el ciclo de vida del software.