Le mirage de la productivité IA : et si on en faisait moins ?
Le 24 mars, Google Research a lâché une bombe discrète : TurboQuant , un algorithme de compression qui divise par 6 la mémoire nécessaire à l'inférence IA, sans perte de qualité. En quelques jours…