Aplicaciones de monitoreo de GPU en Linux / Ubuntu
Pequeña lista de aplicaciones para monitoreo de carga de GPU
Aplicaciones para monitoreo de carga de GPU: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.
Pequeña lista de aplicaciones para monitoreo de carga de GPU
Aplicaciones para monitoreo de carga de GPU: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.
Instalando little k3s kubernetes en un clúster de homelab
Aquí tienes un recorrido paso a paso de
instalación de un clúster K3s de 3 nodos
en servidores de metal desnudo (1 maestro + 2 trabajadores).
Breve visión general de las variantes de Kubernetes
Comparando distribuciones de self-hosting Kubernetes para alojar en servidores físicos o servidores domésticos, enfocándose en facilidad de instalación, rendimiento, requisitos del sistema y conjuntos de características.
Elegir la mejor variante de Kubernetes para nuestro homelab
Estoy comparando variantes de Kubernetes autohospedadas que se adaptan a un homelab basado en Ubuntu con 3 nodos (16 GB de RAM, 4 núcleos cada uno), centrándome en la facilidad de instalación y mantenimiento, soporte para volúmenes persistentes y LoadBalancers.
Un poco sobre las acciones comunes de GitHub y su estructura.
GitHub Actions es una plataforma de automatización y CI/CD dentro de GitHub, utilizada para compilar, probar y desplegar su código basado en eventos como pushes, solicitudes de extracción o en un horario.
Por cierto, docker-compose es diferente de docker compose...
Aquí tienes un cheatsheet de Docker Compose con ejemplos anotados para ayudarte a dominar los archivos y comandos de Compose rápidamente.
Acerca de Obsidian ...
Aquí tienes un análisis detallado de
Obsidian como una herramienta poderosa para la gestión del conocimiento personal (GKP),
explicando su arquitectura, características, fortalezas y cómo apoya los flujos de trabajo modernos de conocimiento.
En julio de 2025, pronto debería estar disponible
Nvidia está a punto de lanzar NVIDIA DGX Spark - pequeño superordenador de IA basado en la arquitectura Blackwell con 128+GB de memoria unificada y un rendimiento de IA de 1 PFLOPS. Dispositivo interesante para ejecutar LLMs.
¿Qué sistemas de análisis web debe usar en su sitio web?
Vamos a echar un vistazo rápido a
Matomo, Plausible, Google y otros proveedores y sistemas de análisis web
disponibles para autohospedaje y compararlos.
Notas sobre la secuencia de instalación estándar de Ubuntu 24.04
Aquí está mi conjunto favorito de pasos al hacer instalación limpia de Ubuntu 24.04. Lo que me gusta aquí es que no necesito instalar los controladores de NVidia ¡se instalan automágicamente!
Estaba utilizando Dokuwiki como base de conocimiento personal
Dokuwiki es una wikipedia autohospedada que se puede hospedar fácilmente en instalaciones propias y no requiere ninguna base de datos. Estaba ejecutándolo dockerizado, en mi clúster de Kubernetes personal.
Actualización de precios de GPU adecuadas para IA - RTX 5080 y RTX 5090
Comparemos precios de las mejores tarjetas gráficas de consumo para usuarios finales, que son adecuadas para LLMs en particular y para la inteligencia artificial en general.
Específicamente, echa un vistazo a
precios de RTX 5080 y RTX 5090. Han disminuido ligeramente.
Buen framework para ETS/MLOPS con Python
Apache Airflow es una plataforma de código abierto diseñada para autorizar, programar y monitorear flujos de trabajo de forma programática, completamente en código Python, ofreciendo una alternativa flexible y poderosa a las herramientas tradicionales, manuales o basadas en interfaz de usuario para flujos de trabajo.
Implementando RAG? Aquí hay algunos fragmentos de código en Go - 2...
Dado que el Ollama estándar no tiene una API de rerank directa, tendrás que implementar reranking usando Qwen3 Reranker en GO generando embeddings para pares de consulta y documentos y calificándolos.
qwen3 8b, 14b y 30b, devstral 24b, mistral small 24b
En este test estoy comparando cómo diferentes LLMs alojados en Ollama traducen una página Hugo del inglés al alemán. Tres páginas que probé estaban sobre temas diferentes, tenían algún buen markdown con cierta estructura: encabezados, listas, tablas, enlaces, etc.
Implementando RAG? Aquí hay algunos fragmentos de código en Golang...
Este pequeño Ejemplo de código Go para reranking llama a Ollama para generar embeddings para la consulta y para cada documento candidato, luego ordenando de forma descendente por similitud coseno.