Référence des paramètres d'inférence des LLMs agissants pour Qwen et Gemma
Référence pour l’ajustement des LLM agencés
Cette page est une référence pratique pour l’optimisation de l’inférence des LLMs agents (température, top_p, top_k, pénalités, et comment ils interagissent dans les flux de travail multi-étapes et intensifs en outils).