Benchmarks

Des comparaisons honnêtes de modèles open-weight sur des tâches réelles de secteurs régulés, arbitrages compris.