Velké jazykové modely dostaly snadnou logickou otázku, u které ale většina z nich neřešila primární zadání. Namísto toho hodnotily, zda je 50 metrů vhodná vzdálenost pro chůzi.