Bien que certains standards se soient mis en place, le langage assembleur est le langage d'un processeur particulier et donc, suivant les technologies mis en œuvre dans un processeur donné, l'assembleur sera différent.
Le langage proposé dans ce cours n'est qu'un exemple correspondant à un processeur fictif que j'ai inventé pour les besoins du cours. Mais il est suffisamment proche des cas réels pour vous être utile.
L'Assembleur est le langage de la machine.
Dans les tous premiers temps de l'informatique, on écrivait directement les programmes dans le langage de la machine. C'était pénible et cela ne permettait pas de faire des programmes très complexes.
À mesure de l'évolution de la technologie et des théories sur les langages de nouveaux langages plus évolués, plus faciles à comprendre pour l'humain sont apparus.
C est un langage qui reste assez difficile parce qu'il nécessite une bonne compréhension de ce qui se passe dans la machine. Python est au contraire très proche de l'humain et donc beaucoup plus facile à apprendre.
Mais la machine continue à parler son langage. Donc il faut traduire.
Vous pouvez comparer cela au travail de traducteur / interprète.
Le travail de traduction peut ajouter des erreurs, il peut faire perdre quelque chose… Autrefois, les programmes écrits directement en Assembleur étaient toujours plus performants que ceux compilés/interprétés. On a donc longtemps continué à faire des choses en assembleur.
Aujourd'hui, les compilateurs et interpréteurs sont devenus beaucoup plus performants. Il n'est plus utile de programmer en Assembleur.
Apprendre l'Assembleur sert seulement à mieux comprendre comment ça marche.
python.exe – doit être présent sur la machine qui exécute le programme.L'assembleur est très proche du matériel. Il faut donc connaître au moins un peu l'organisation d'un processeur pour comprendre ce que peut faire l'assembleur.
La plupart des processeurs adoptent la structure dite de Von Neumann.
On utilisera souvent le mot registre. On peut considérer que c'est une case mémoire. Elle contient une donnée, un mot binaire.
Un registre est une mémoire très rapide utilisée au cœur du microprocesseur. Un microprocesseur contient généralement une mémoire interne constituée de registres. On trouve d'autres registres comme le registre qui mémorise la ligne d programme à laquelle on se trouve ou bien les registres utilisés par l'unité de calcul.
L'Unité Arithmétique et Logique fait les calculs. Ce sont des calculs simples mais ils sont à la base de tout ce que fera le microprocesseur. Ces un composant essentiel qui peut faire une grande différence d'un microprocesseur à un autre :
Dans notre cas, l'UAL n'aura qu'un registre de travail. On appelle parfois ce registre W pour Work.
MOV #4 ADD #8 STR @x
Chaque ligne est une instruction simple que le processeur est capable d'exécuter. Dans cet exemple, voici ce que fait le programme :
Les instructions sont peu variées et elles correspondent aux différents organes du processeur.
Voici le genre de chose qu'une instruction peut faire :
Détaillons le dernier item qui est le moins évident. Un programme s'exécute une ligne après l'autre, dans l'ordre. L'unité de séquencement dispose donc d'un compteur de ligne – on dit aussi pointeur de ligne – qui après chaque instruction se contente de passer à la ligne suivante.
Mais parfois on a besoin de recommencer un bloc d'instructions (boucle) ou bien de ne pas exécuter un bloc d'instruction (alternative comme if). Dans ces cas là, on ne veut pas simplement passer à la ligne suivante. On veut passer (on dit souvent sauter = jump) à une certaine ligne du programme. Certaines instructions sont là pour cela.
Voyons un exemple avec un branchement.
MOV @x // contenu de x dans travail
CMP #0 // on va comparer à 0
BGE L // si plus grand ou égal, sauter à ligne étiquetée "L"
MULT #-1 // multiplier travail par -1
STR @x // stocker travail dans x
L HALT // fin
Vous noterez que l'on a ajouté une marge pour permettre l'ajout d'une étiquette en tête de ligne. On pourrait aussi numéroter les lignes mais l'usage est plutôt de mettre une étiquette pour indiquer les lignes où l'on est susceptible de sauter.
Vous pouvez constater que dans ce programme, suivant la valeur de x, on ne fait pas la même chose. On pourrait le traduire en Python :
if x < 0:
x *= -1
Le code assembleur est toujours très long comparé à l'équivalent dans un langage évolué.
Dans le morceau de programme, vous pouvez voir #4 et #8. Dans les deux cas on parle de littéral. Quand on écrit #4, il faut comprendre : le nombre 4.
On aurait pu voir @4. Le symbole @ indique que l'on parle d'une adresse.
ADD @4 : on additionne au registre de travail le contenu de la mémoire à l'adresse 4.ADD #4 : on additionne au registre de travail le nombre 4.
Souvent, on ne veut pas spécifier une adresse explicitement. Il est donc rare que l'on note quelque chose comme @4. On écrit plutôt quelque chose comme @x et on laisse le système décider dans quel case mémoire il placera x.
Il faut comprendre que la mémoire contiendra à la fois le programme et les données du programme. Reprenons le programme précédent.
MOV @x
CMP #0
BGE L
MULT #-1
STR @x
L HALT
Ce programme comporte 6 lignes et utilise une variable x. Dans le microprocesseur, les 6 lignes de programme occuperont les lignes 0 à 5. On pourra placer x en ligne 6. Si on veut explicitement placer x à la suite du programme, on peut écrire :
MOV @x
CMP #0
BGE L
MULT #-1
STR @x
L HALT
x DATA
ce qui permet d'indiquer que la ligne mémoire après la ligne contenant HALT devra contenir la mémoire x.