1. Personne ne peut dire si ça s'améliore
Sans jeu d'évaluation — des cas réels, des réponses attendues, un score — « l'IA marche » est une opinion. Chaque itération de prompt devient un pari, et le projet s'arrête le jour où quelqu'un d'important tombe sur une mauvaise réponse. L'éval n'est pas une option de luxe : c'est la première chose à construire, avant même le pipeline.