Les variables



--Téléchargez Les variables en PDF --


Les variables

Dans un programme informatique, on va avoir en permanence besoin de stocker provisoirement des valeurs. Il peut s’agir de données issues du disque dur, fournies par l’utilisateur, ou encore les résultats intermédiaires générés par votre programme. Ces données peuvent être de plusieurs types. L’ordinateur gère toutes les données en binaire.

Pour comprendre la notion de variable, il fait d’abord expliquer le principe de fonctionnement de la mémoire. On peut considérer la RAM comme une énorme armoire à casiers. Chaque casier peut être adapté en fonction du type de données à stocker. Certaines données sont plus grandes que d’autres. Chaque casier est identifié par son adresse mémoire (par ex. 0xFF12 3A07).

Or, travailler avec ce genre d’adresse mémoire est humainement impossible. Imaginez vos 16 Go de RAM : chaque octet dispose de sa propre adresse, ce qui donne 17 179 869 184 adresses maximum ! Ajoutez à cela que les tailles en mémoire varient, donc il y a plusieurs adresses utilisées pour stocker une donnée plus importante. On comprend pourquoi c’est humaine infaisable. Pourtant, certains langages de programmation permettent de jouer avec les adresses mémoire. C’est le cas du langage C, avec sa notion de pointeurs, le cauchemar de tous les débutants programmant en C.

Pour se faciliter la tâche, les différents langages de programmation offre une fonctionnalité essentielle : nous allons apposer sur ces casiers une étiquette. C’est la notion de variable.

boxUne variable est une boite que le programme va repérer par son étiquette. C’est aussi le programme qui va s’occuper de la taille de la boite en fonction du type de donnée à stocker. Pour accéder au contenu de cette boite, il nous suffira de la désigner par son étiquette.

Déclarer une variable

La première chose à faire avant de pouvoir utiliser une variable est de créer la boîte et de lui coller une étiquette. Ceci se fait tout au début de l’algorithme, avant même les instructions proprement dites. C’est ce qu’on appelle la déclaration des variables. C’est un genre de déclaration certes moins romantique qu’une déclaration d’amour, mais d’un autre côté moins désagréable qu’une déclaration d’impôts.

Le nom de la variable (l’étiquette de la boîte) obéit à des impératifs changeant selon les langages. Toutefois, une règle absolue est qu’un nom de variable peut comporter des lettres et des chiffres, mais qu’il exclut la plupart des signes de ponctuation, en particulier les espaces. Un nom de variable correct commence également impérativement par une lettre. Quant au nombre maximal de signes pour un nom de variable, il dépend du langage utilisé.

Lorsqu’on déclare une variable, il ne suffit pas de créer une boîte (réserver un emplacement mémoire) ; encore doit-on préciser ce que l’on voudra mettre dedans, car de cela dépendent la taille de la boîte (de l’emplacement mémoire) et le type de codage utilisé.

Typage

Types numériques

Commençons par le cas très fréquent, celui d’une variable destinée à recevoir des nombres. Si l’on réserve un octet pour coder un nombre,on ne pourra coder que 2⁸ = 256 valeurs différentes. Cela peut signifier par exemple les nombres entiers de 1 à 256, ou de 0 à 255, ou de –127 à +128… Si l’on réserve deux octets, on a droit à 65.536 valeurs ; avec trois octets, 16.777.216, etc. Et là se pose un autre problème : ce codage doit-il représenter des nombres décimaux ? des nombres négatifs ?

Bref, le type de codage (autrement dit, le type de variable) choisi pour un nombre va déterminer :

  • les valeurs maximales et minimales des nombres pouvant être stockés dans la variable,
  • la précision de ces nombres (dans le cas de nombres décimaux).

Tous les langages, quels qu’ils soient offrent un « bouquet » de types numériques, dont le détail est susceptible de varier légèrement d’un langage à l’autre. Grosso modo, on retrouve cependant les types suivants :

Type Numérique Plage de valeur
Byte (octet) 0 à 255
Entier simple -32.768 à 32767
Entier long -2.147.483.648 à 2.147.483.647
Réel simple -3,40×10^38 à -1,40×10^45 pour les valeurs négatives
1,40×10^-45 à 3,40×10^38 pour les valeurs positives
Réel double 1,79×10308 à -4,94×10-324 pour les valeurs négatives
4,94×10-324 à 1,79×10308 pour les valeurs positives

Pourquoi ne pas déclarer toutes les variables numériques en réel double, histoire de bétonner et d’être certain qu’il n’y aura pas de problème ?

En vertu du principe de l’économie de moyens. Un bon algorithme ne se contente pas de « marcher » ; il marche en évitant de gaspiller les ressources de la machine. Sur certains programmes de grande taille, l’abus de variables surdimensionnées peut entraîner des ralentissements notables à l’exécution, voire un plantage pur et simple de l’ordinateur. Alors, autant prendre dès le début de bonnes habitudes d’hygiène.

En algorithmique, on ne se tracassera pas trop avec les sous-types de variables numériques. On se contentera donc de préciser qu’il s’agit d’un nombre, en gardant en tête que dans un vrai langage, il faudra être plus précis. En pseudo-code, une déclaration de variables aura ainsi cette tête :

Type alphanumérique

Fort heureusement, les boîtes que sont les variables peuvent contenir bien d’autres informations que des nombres. Sans cela, on serait un peu embêté dès que l’on devrait stocker un nom de famille, par exemple.

On dispose donc également du type alphanumérique (également appelé type caractère, type chaîne ou en anglais, le type string – mais ne fantasmez pas trop vite, les string, c’est loin d’être aussi excitant que le nom le suggère. Une ancienne étudiante qui se reconnaîtra si elle lit ces lignes a d’ailleurs mis le doigt – si j’ose m’exprimer ainsi – sur le fait qu’il en va de même en ce qui concerne les bytes)1.

Dans une variable de ce type, on stocke des caractères, qu’il s’agisse de lettres, de signes de ponctuation, d’espaces, ou même de chiffres. Le nombre maximal de caractères pouvant être stockés dans une seule variable string dépend du langage utilisé. Un groupe de caractères (y compris un groupe de un, ou de zéro caractères), qu’il soit ou non stocké dans une variable, d’ailleurs, est donc souvent appelé chaîne de caractères.

Pourquoi diable ? Pour éviter deux sources principales de possibles confusions :

  • la confusion entre des nombres et des suites de chiffres. Par exemple, 423 peut représenter le nombre 423 (quatre cent vingt-trois), ou la suite de caractères 4, 2, et 3. Et ce n’est pas du tout la même chose ! Avec le premier, on peut faire des calculs, avec le second, point du tout. Dès lors, les guillemets permettent d’éviter toute ambiguïté : s’il n’y en a pas, 423 est quatre cent vingt trois. S’il y en a, « 423 » représente la suite des chiffres 4, 2, 3.
  • …Mais ce n’est pas le pire. L’autre confusion, bien plus grave – et bien plus fréquente – consiste à se mélanger les pinceaux entre le nom d’une variable et son contenu. Pour parler simplement, cela consiste à confondre l’étiquette d’une boîte et ce qu’il y a à l’intérieur… On reviendra sur ce point crucial dans quelques instants.

En pseudo-code, nous déclarons les variables alpha-numériques ainsi :

Type booléen

Le dernier type de variables est le type booléen : on y stocke uniquement les valeurs logiques VRAI et FAUX. On peut représenter ces notions abstraites de VRAI et de FAUX par tout ce qu’on veut : de l’anglais (TRUE et FALSE) ou des nombres (0 et 1). Peu importe. Ce qui compte, c’est de comprendre que le type booléen est très économique en termes de place mémoire occupée, puisque pour stocker une telle information binaire, un seul bit suffit.

Il est vrai qu’il n’est pas à proprement parler indispensable, et qu’on pourrait écrire à peu près n’importe quel programme en l’ignorant complètement. Pourtant, si le type booléen est mis à disposition des programmeurs dans tous les langages, ce n’est pas pour rien. Le recours aux variables booléennes s’avère très souvent un puissant instrument de lisibilité des algorithmes : il peut faciliter la vie de celui qui écrit l’algorithme, comme de celui qui le relit pour le corriger.

Alors, maintenant, c’est certain, en algorithmique, il y a une question de style : c’est exactement comme dans le langage courant, il y a plusieurs manières de s’exprimer pour dire sur le fond la même chose. Nous verrons plus loin différents exemples de variations stylistiques autour d’une même solution. En attendant, vous êtes prévenus : les auteurs de ce cours sont des adeptes fervent (mais pas irraisonné) de l’utilisation des variables booléennes.

En pseudo-code :


  1. Cette anecdote vous est fournie par mon collègue Rudy Renard, je décline toute responsabilité 🙂 !