Hallo verden i Assembly

Et enkelt testprogram i assembly for å bli våt på beina:

; alt bak et semikolon er kommentar

section .data
   hallo: db "Hallo, verden!",10
   ; db (som står for define bytes) benyttes for å opprette tekststrengen 'Hallo, verden!'
   ; etterpå følger tallet 10 for å få ett linjeskift
    
section .text
   global start

start:
   mov eax,4     ; signalkode for å skrive noe
   mov ebx,1     ; signalkode for standardutskrift (dvs. terminal)
   mov ecx,hallo ; man angir de ønskede dataene
   mov edx,15    ; man velger hvor mye av dataene som skal tas med
   int 80h       ; man forstyrrer systemet / ber om oppmerksomhet, for å få kjørt instruksjonene over

   mov eax,1     ; signalkode for å avslutte
   mov ebx,0     ; signalkode som sier at alt gikk greit
   int 80h       ; nytt kall til systemet for å kjøre nye instruksjoner (de to nye over)

Utskriften i terminalen blir som følger:

Hallo, verden!
   

Dette programmet kan f.eks. kjøres på rextester.com. Der benyttes NASM-assembleren så da slipper man å laste ned selv, ordne innholdet i fil, o.s.v.

Instruksjoner

Mange sier assemblyspråk er vanskelig, men hver type assemblyinstruksjon er faktisk veldig kortfattet og forståelig.

FASM

Nedenfor følger instruksjoner for FASM – en mye brukt assembler. Det finnes selvsagt alternative assemblere, da vil instruksjonene være litt annerledes.

mov

For å flytte (dvs. kopiere) data brukes instruksjonen mov:

mov destinasjon,kilde

Noen eksempler:

mov eax,8CBh
mov eax,edx
mov si,cx

Øverst er det verdien 8CBh som flyttes. Dette er en heksadesimalverdi da det er hengt på en h til slutt. For flytting av data mellom to forskjellige registre må begge registrene være av samme størrelse.

add

Om man skal legge sammen to verdier brukes add:

add destinasjon,kilde

Noen eksempler:

add eax,11b
add eax,edx
add si,cx

I øverste eksempel legges verdien 11b til verdien som allerede finnes i eax. Fordi det henger en b til slutt er dette et binærtall. Hvis man legger sammen registre må begge registrene være av samme størrelse, sånn som greia også er ved flytting.

sub

Motsetningen til add blir sub, for å trekke fra:

sub destinasjon,kilde

Noen eksempler:

sub eax,4h
sub cl,dl

Øverst trekkes 4h fra verdien som allerede finnes i eax. Størrelseskravet gjelder også her ved bruk av to forskjellige registre.

inc

Som et mulig alternativ til add har man inc:

inc destinasjon

Noen eksempler:

inc eax
inc cl
inc dl

Her inkrementeres verdien som allerede finnes i registeret, dvs. at den økes med 1.

dec

Motsetningen til inc blir dec:

dec destinasjon

Noen eksempler:

dec eax
dec cl
dec dl

Verdien som allerede finnes i registeret blir dekrementert, dvs. redusert med 1.

mul

Skal man multiplisere sammen to verdier bruker man mul og oppgir kun èn kilde:

mul kilde

Resten er allerede bestemt:

  • Kilde nr. 2 skal være al (8-bit), ax (16-bit) eller eax (32-bit).
  • Valgt kilde nr. 2 må være like stor som kilde nr. 1!
  • Destinasjonens størrelse blir dobbelt så stor som kildene. Så 8-bits kilder gir destinasjon som er 16-bit, o.s.v.
  • Mulige destinasjoner er
    • ah kombinert med al som sammen gir 16-bit.
    • dx kombinert med ax som sammen gir 32-bit.
    • edx kombinert med eax som sammen gir 64-bit.

Før mul kjøres må selvsagt begge kilder gis verdi – se komplett eksempel:

mov si,2h           ; verdi satt for første kilde
mov ax,11b          ; verdi satt for andre kilde
mul si              ; resultatet skal tilsvare 6 i desimaltallsystemet

OBS: mul foretar usignert multiplikasjon, for signert må imul brukes i stedet.

div

Som med multiplikasjon oppgir man kun èn kilde for divisjon (div):

div kilde        ; dette er nevner, altså den verdien det skal deles på

Resten er bestemt og ganske likt som for mul:

  • Den andre kilden (dvs. teller) blir en av
    • ah kombinert med al som sammen gir 16-bit.
    • dx kombinert med ax som sammen gir 32-bit.
    • edx kombinert med eax som sammen gir 64-bit.
  • Delregistrene over benyttes også for å lagre resulterende kvotient og rest
    • Rest lagres øverst, i ah (8-bit), dx (16-bit) eller edx (32-bit).
    • Kvotient lagres nederst, i al (8-bit), ax (16-bit) eller eax (32-bit).

Før div kjøres må selvsagt begge kilder ha verdi – se eksempel:

mov si,2h           ; verdi satt for nevner
mov eax,110b        ; verdi satt for teller
div si              ; resultatet skal tilsvare 3 i desimaltallsystemet

OBS: Som med mul jobber også div usignert, man har da idiv hvis man ønsker signert.

TBC

Registre

Enhver prosessor har registre for oppbevaring av forskjellige viktige data ved kjøring av instruksjoner i et program.

På Intel-plattformen er det mye tilbakekompatibilitet, som blant annet viser seg i hvordan prosessorens mange registre som regel er designet:

Illustrasjonen viser et typisk eksempel, nemlig registeret rax. Dette er en utvidelse av eax. Videre er eax en utvidelse av ax. Og ax består av ah ("a high") og al ("a low").

Med et slikt design kan man faktisk hente verdiene i eax, ax, ah og al bare ved å avlese rax. Bokstaven a står for akkumulator (dvs. «accumulator» på engelsk). Registeret brukes gjerne for aritmetikk og logikk.

Noen typer

I hovedsak finnes det tre typer registre og noen typer har igjen egne undergrupper.

Generelle

For generelle registre er det tre grupper av registre siden formålene er forskjellige.

Dataregistre

Det er ganske opplagt hva et dataregister brukes til, det er data.

Og det finnes fire stk – hvor disse utvider eksisterende mindre registre:

  • RAX (64-bit) <== EAX (32-bit) <== Accumulator (AX) (16-bit) <== AH og AL (8-bit).
  • RBX (64-bit) <== EBX (32-bit) <== Base (BX) (16-bit) <== BH og BL (8-bit).
  • RCX (64-bit) <== ECX (32-bit) <== Counter (CX) (16-bit) <== CH og CL (8-bit).
  • RDX (64-bit) <== EDX (32-bit) <== Data (DX) (16-bit) <== DH og DL (8-bit).

Pekerregister

Et pekerregister inneholder adressen til det som det skal pekes til. Man har f.eks. peker som viser til neste instruksjon som skal kjøres.

To pekerregistre:

  • ESP (32-bit) som utvider Stack Pointer (SP) (16-bit).
  • EBP (32-bit) som utvider Base Pointer (BP) (16-bit).

Indeksregister

Man bruker gjerne et indeksregister slik man bruker vanlige tellere i et hvilket som helst programmeringsspråk, når man skal forholde seg til tabeller eller vektorer.

To indeksregistre:

  • ESI (32-bit) som utvider Source Index (SI) (16-bit)
  • EDI (32-bit) som utvider Destination Index (DI) (16-bit).

Kontroll

Registre for kontroll handler om hva som har skjedd og hva som skal skje:

  • Flaggregister (32-bit) som inneholder flagg (dvs. 0 eller 1), her er noen:
    • Overflow Flag (OF)
    • Direction Flag (DF)
    • Interrupt Flag (IF)
    • Trap Flag (TF)
    • Sign Flag (SF)
    • Zero Flag (ZF)
    • Auxiliary Carry Flag (AF)
    • Parity Flag (PF)
    • Carry Flag (CF)
  • Instruction Pointer (IP) (32-bit), som peker til neste instruksjon.

Segment

Det finnes flere segmentregistre. De viktigste er for stack, kode og data.

TBC