K8S - Rost Glukhov | Sitio personal y blog técnico

Monitorear la inferencia de LLM en producción (2026): Prometheus y Grafana para vLLM, TGI, llama.cpp

La inferencia de LLM parece “solo otra API” — hasta que aparecen picos de latencia, se forman colas y tus GPUs se quedan en un 95% de memoria sin una explicación obvia.

Top 19 proyectos de Go trending en GitHub - Enero 2026

El ecosistema de Go continúa prosperando con proyectos innovadores que abarcan herramientas de IA, aplicaciones autohospedadas y infraestructura para desarrolladores. Este análisis examina los repositorios de Go más trending en GitHub de este mes.

Open WebUI: Interfaz de LLM autohospedada

Open WebUI es una poderosa, extensible y rica en características interfaz web autogestionada para interactuar con modelos de lenguaje grandes.

Eventos tecnológicos en Melbourne que no te puedes perder en 2026

La comunidad tecnológica de Melbourne continúa floreciendo en 2026 con una impresionante lista de conferencias, encuentros y talleres que abarcan el desarrollo de software, computación en la nube, IA, ciberseguridad y tecnologías emergentes.

vLLM es un motor de inferencia y servicio de alto rendimiento y eficiente en memoria para Modelos de Lenguaje Grandes (LLM), desarrollado por el Laboratorio de Computación Sky de la Universidad de California, Berkeley.

Linter de Go: Herramientas esenciales para la calidad del código

El desarrollo moderno de Go exige estándares rigurosos de calidad del código. Linters para Go automatizan la detección de errores, vulnerabilidades de seguridad y inconsistencias de estilo antes de que lleguen a producción.

Go Microservicios para la Orquestación de IA/ML

A medida que las cargas de trabajo de IA y ML se vuelven cada vez más complejas, la necesidad de sistemas de orquestación robustos se ha vuelto más urgente. La simplicidad, el rendimiento y la concurrencia de Go lo convierten en una opción ideal para construir la capa de orquestación de pipelines de ML, incluso cuando los modelos mismos se escriben en Python.

Infraestructura de IA en hardware de consumo

La democratización de la IA está aquí. Con LLMs de código abierto como Llama 3, Mixtral y Qwen ahora rivales de modelos propietarios, los equipos pueden construir una poderosa infraestructura de IA usando hardware de consumo - reduciendo costos mientras se mantiene el control total sobre la privacidad de los datos y la implementación.

Monitoreo con Prometheus: Configuración completa y mejores prácticas

Prometheus ha se convertido en el estándar de facto para monitorear aplicaciones y infraestructura nativas en la nube, ofreciendo recolección de métricas, consulta e integración con herramientas de visualización.

Instale y use Grafana en Ubuntu: Guía completa

Grafana es la plataforma de código abierto líder para monitoreo y observabilidad, transformando métricas, registros y rastreos en insights accionables mediante visualizaciones impactantes.

Gráficos de Helm: Gestión de paquetes de Kubernetes

Helm ha revolucionado la implementación de aplicaciones en Kubernetes al introducir conceptos de gestión de paquetes familiares de los sistemas operativos tradicionales.

StatefulSets & Almacenamiento Permanente en Kubernetes

Kubernetes StatefulSets son la solución ideal para gestionar aplicaciones con estado que requieren identidades estables, almacenamiento persistente y patrones de despliegue ordenados, esenciales para bases de datos, sistemas distribuidos y capas de caché.

Patrones arquitectónicos para la seguridad de los datos: en reposo, en tránsito y en tiempo de ejecución

Cuando los datos son un activo valioso, garantizar su seguridad nunca ha sido más crítico.
Desde el momento en que la información se crea hasta el punto en que se descarta,
su trayectoria está llena de riesgos, ya sea almacenada, transferida o utilizada activamente.

Implementar un Service Mesh con Istio y Linkerd: Una guía completa

Descubre cómo implementar y optimizar arquitecturas de malla de servicios utilizando Istio y Linkerd. Esta guía cubre estrategias de implementación, comparaciones de rendimiento, configuraciones de seguridad y mejores prácticas para entornos de producción.

Instalando k3s en hardware baremetal - tutorial paso a paso y con terraform

Aquí tienes un recorrido paso a paso de
instalación de un clúster K3s de 3 nodos
en servidores de metal desnudo (1 maestro + 2 trabajadores).

Distribuciones de Kubernetes - visión general rápida de kubeadm, k3s, MicroK8s, Minikube, Talos Linux y RKE2

Comparando distribuciones de self-hosting Kubernetes para alojar en servidores físicos o servidores domésticos, enfocándose en facilidad de instalación, rendimiento, requisitos del sistema y conjuntos de características.