L’évaluation des LLMs est-elle morte ?

L’évaluation des LLMs est-elle morte ?

Ippon Technologies ·

TLDR; Les benchmarks deviennent inefficaces face à des LLMs. Les LLMs biaisent leurs réponses quand ils détectent qu’ils sont testés. Les benchmarks classiques deviennent inefficaces. Il faut repenser...

Voir l'original

Contenus similaires