Modèles, utilisation et limites dans Claude Code

Ce guide explique quel modèle vous utilisez, comment l'utilisation est mesurée et comment maintenir les sessions longues dans leurs limites de contexte et d'utilisation.

Comment l'utilisation est mesurée

La façon dont vous vous êtes connecté détermine comment l'utilisation est mesurée. Tout le reste du fonctionnement de Claude Code se comporte de la même manière, indépendamment de cela.

Vous vous êtes connecté avec…	Vous obtenez	À quoi ressemble « manquer de ressources »
Siège Claude Enterprise (via `/login`)	Un pool d'utilisation inclus dans le plan de votre organisation, réinitialisé sur une fenêtre glissante.	Un message « limite atteinte, réinitialisation à l'heure ».
Clé API (Console, Bedrock, Vertex ou Microsoft Foundry)	Paiement à l'usage, facturé par jeton à ce compte cloud ou Console.	Pas d'arrêt brutal ; le compte est facturé pour ce qu'il utilise.

Si vous vous êtes connecté avec un siège Enterprise, vous n'avez généralement pas besoin de penser aux jetons jusqu'à atteindre une limite. Si vous utilisez une clé API, la commande /cost affiche vos dépenses en cours pour la session actuelle.

Choisir un modèle

Exécutez /model à tout moment pour voir quels modèles sont disponibles pour votre compte et pour basculer entre eux. À titre indicatif :

Sonnet est le modèle par défaut et est le bon choix pour la grande majorité des travaux de codage. Il est rapide, capable et rentable.
Opus offre un raisonnement plus approfondi pour les problèmes plus difficiles tels que les refactorisations transversales importantes, le débogage difficile ou les décisions architecturales. Il utilise beaucoup plus de votre quota, alors basculez vers lui quand vous en avez besoin plutôt que de le laisser activé par défaut.
Haiku est l'option la plus rapide et la moins chère, bien adaptée aux recherches rapides, aux modifications simples ou aux exécutions de scripts à haut volume.

Vous pouvez changer de modèle en cours de session sans perdre votre conversation. Un modèle courant est de planifier avec Opus et d'exécuter avec Sonnet.

Remarque : Les noms de modèles exacts, les versions et la disponibilité changent au fil du temps. La commande /model est toujours la source de vérité pour votre compte.

Ce qui consomme réellement les jetons

Chaque tour envoie trois choses au modèle :

La conversation jusqu'à présent — chaque message précédent dans cette session.
Contexte du projet — votre CLAUDE.md et tous les fichiers que Claude a lus.
Votre nouveau message.

Parmi ceux-ci, le premier élément croît le plus rapidement. Une longue session de débogage au cours de laquelle Claude a lu vingt fichiers et produit quinze diffs porte tout cela sur chaque message ultérieur. C'est là que proviennent à la fois le coût et les limites de contexte.

Gérer la fenêtre de contexte

La fenêtre de contexte est la quantité maximale de texte que le modèle peut considérer à la fois. Claude Code affiche un indicateur en direct de son remplissage. Quand elle se remplit, Claude ne peut plus voir clairement les parties les plus anciennes de la conversation et la qualité diminue.

Deux commandes la maintiennent sous contrôle :

/clear efface la conversation et recommence à zéro. Votre CLAUDE.md et les fichiers du projet restent disponibles ; seul l'historique de chat est supprimé. Utilisez ceci chaque fois que vous changez de tâche, car c'est le levier le plus efficace pour la qualité et le coût.
/compact résume la conversation jusqu'à présent en un court récapitulatif, libérant de l'espace tout en préservant le contexte essentiel. Utilisez ceci quand vous êtes en cours de tâche et que vous devez continuer. Claude Code se compacte également automatiquement quand vous vous rapprochez de la limite, donc vous atteindrez rarement un mur dur.

Règle générale : utilisez /clear au démarrage d'une nouvelle tâche, et /compact lors de la continuation d'une tâche longue.

Cinq habitudes qui étendent votre utilisation au maximum

Presque tous les rapports « J'ai épuisé ma limite avant midi » remontent à l'un de ces cinq.

1. Effacer entre les tâches

Chaque message précédent est renvoyé à chaque tour, donc une session qui a erré à travers trois problèmes non liés paie pour les trois à chaque nouveau message.

En pratique : vous venez de terminer le débogage d'une redirection de connexion et vous voulez maintenant écrire une migration de base de données. Exécutez d'abord /clear. Un test simple : si votre prochain message aurait un sens parfait dans un terminal tout neuf, effacez avant de l'envoyer. Votre CLAUDE.md et les fichiers du projet restent en place ; seul l'historique de chat disparaît.

Un avertissement : /clear ne peut pas être annulé. Si vous pourriez encore avoir besoin de quelque chose de l'historique, copiez-le d'abord ou exécutez /compact à la place, qui préserve un résumé plutôt que d'effacer tout.

2. Adapter le modèle au travail

Opus coûte plusieurs fois plus par tour que Sonnet, et Sonnet plus que Haiku. Dépenser Opus sur du travail de routine est le moyen le plus rapide d'épuiser une limite quotidienne.

Valeurs par défaut raisonnables : Sonnet pour la plupart des codages (fonctionnalités, tests, bogues connus, refactorisations) ; Opus quand vous êtes vraiment bloqué ou que le changement est large (débogage difficile, refactorisations transversales, appels architecturaux) ; Haiku pour le travail mécanique rapide (renommages, lignes de journal, explications regex, code passe-partout).

3. Pointer vers les fichiers au lieu de les coller

Tout ce que vous collez reste en contexte, en intégralité, pour le reste de la session. Référencer un fichier par chemin permet à Claude de lire sélectivement et de se concentrer sur la partie qui vous intéresse.

En pratique : au lieu de coller auth.ts, écrivez regardez la fonction validateToken dans src/auth.ts — mentionner le chemin permet à Claude d'ouvrir et de lire sélectivement. (Notez que le préfixe @ injecte le fichier entier plus son arborescence CLAUDE.md en contexte, donc utilisez un chemin nu quand vous essayez d'économiser des jetons.) Pour les journaux et les traces de pile, réduisez aux 20 ou 30 lignes pertinentes avant de coller. Pour tout ce qui est volumineux (fichiers de verrouillage, journaux de compilation, vidages de données), mettez-le sur disque et référencez le chemin.

4. Garder CLAUDE.md épuré

Ce fichier est ajouté au début de chaque tour. La mise en cache des messages signifie que les tours après le premier sont facturés au taux de lecture de cache beaucoup moins cher, donc le coût en dollars est inférieur au nombre de lignes brutes suggéré, mais il occupe toujours l'espace de la fenêtre de contexte sur chaque message.

La règle : deux avertissements, gardez-le serré. N'ajoutez une note que la deuxième fois que vous devez corriger Claude sur la même chose (les problèmes de première fois sont généralement des cas isolés). Gardez le fichier sous environ 200 lignes ; si quelque chose de nouveau doit y aller et qu'il n'y a pas de place, quelque chose d'ancien doit partir.

Quand le mettre à jour : juste après une session où vous avez dû corriger Claude deux fois sur la même chose. C'est quand la correction est fraîche et prend une minute à noter. Tous les quelques semaines, lisez le fichier entier et supprimez tout ce qui n'est plus vrai ou dont vous ne vous souvenez pas du but. Les notes obsolètes sont pires que les notes manquantes car elles égarent activement Claude.

5. Demander un plan avant les grands changements

Un plan coûte quelques centaines de jetons. Un mauvais diff de 400 lignes que vous annulez et régénérez coûte des milliers, deux fois, plus les tours passés à expliquer ce qui s'est mal passé. En pratique : pour tout ce qui touche plus de deux ou trois fichiers, basculez en Mode Plan ou demandez simplement : « Avant de changer quoi que ce soit, listez les fichiers que vous allez toucher et ce que vous allez faire dans chacun. » Lisez la liste, corrigez-la en langage clair (« ignorez legacy/, et ne touchez pas encore aux tests »), puis laissez-le s'exécuter.

Conseil de pro : planifiez avec Opus, exécutez avec Sonnet. L'utilisation de plus grande valeur d'Opus est l'écriture du plan lui-même, où le raisonnement plus approfondi paie réellement. Une fois qu'un bon plan existe, l'exécution est surtout mécanique et Sonnet la gère à une fraction du coût. Ce modèle est intégré en tant que /model opusplan, qui utilise Opus lors de la planification et Sonnet pour l'exécution. Changer de modèle n'efface pas la conversation, donc Sonnet voit toujours tout ce qu'Opus a produit.

Que faire quand vous atteindrez une limite

Utilisateurs de siège Enterprise : le message vous indique quand votre fenêtre se réinitialise. En attendant, vous pouvez basculer vers un modèle plus léger avec /model, ou, si votre organisation le permet, revenir temporairement à une clé API.
Utilisateurs de clé API : il n'y a pas de limite d'utilisation, mais vérifiez /cost et votre tableau de bord Console ou fournisseur cloud si les dépenses vous préoccupent. Les chiffres anormalement élevés remontent presque toujours à des sessions très longues qui n'ont jamais été effacées.
Fenêtre de contexte pleine (ce qui est différent d'une limite d'utilisation) : exécutez /compact pour continuer, ou /clear si l'historique plus ancien n'est plus nécessaire.

Référence rapide

Commande	Ce qu'elle fait
`/model`	Voir et basculer les modèles disponibles.
`/cost`	Afficher l'utilisation des jetons et des dollars de cette session (facturation API).
`/clear`	Commencer une nouvelle conversation (la mémoire du projet reste).
`/compact`	Résumer l'historique pour libérer du contexte.
`/context`	Inspecter ce qui est actuellement chargé en contexte.