Les tokens dans l'IA : comprendre comment fonctionne l'IA.

AVIS D’EXPERT

✍️ Par Stéphanie Ehrenberg directrice chez nLighten.

Les tokens sont les unités de base du texte que les modèles d'IA couramment utilisés utilisent pour comprendre et apprendre le langage. Ils sont utilisés pour le traitement du langage naturel. Les tokens sont les éléments constitutifs qui permettent aux systèmes d'IA de décomposer des textes volumineux en unités ou blocs plus petits. Ils peuvent ainsi analyser plus efficacement le langage et générer des réponses. Au cours du processus de tokenisation, le modèle d'IA convertit les textes longs en éléments plus petits et plus faciles à gérer, généralement composés de mots ou d'expressions. Avant de traiter une entrée, un modèle d'IA divise le texte en fonction des espaces, de la ponctuation et d'autres délimiteurs

Pour comprendre la longueur d'un token, la règle empirique est la suivante : 1 token ≈ quatre caractères en anglais
1 token ≈ ¾ mots
100 tokens ≈ 75 mots

Ce processus permet à l'IA d'analyser et de digérer le langage humain sous une forme qu'elle peut comprendre, ce qui lui permet de traiter les entrées humaines et de fournir des réponses. Nous faisons la distinction entre les tokens d'entrée, qui sont les questions posées et les tokens de sortie, qui sont les réponses générées par le modèle d'IA.


Pourquoi les tokens sont-ils importants ?

Pour lire ce numéro (Accès numérique)

Validez le formulaire ci-dessous

Tarif valable jusqu'au 28/02/2027 sous réserve de variation du taux de TVA.
L'Hebdo Bourse Plus sort un numéro double fin juillet et ne paraît pas en août.

Les paiements sur notre site sont sécurisés et traités par Stripe, un prestataire de paiement en ligne de confiance. Vos informations de paiement sont protégées par des protocoles de sécurité de pointe, garantissant une expérience d'achat sûre et sécurisée. Vos données sont protégées par le chiffrement TLS et la tokenisation. Stripe est certifié conforme aux normes de sécurité PCI DSS.