Modul 1a2. Om data - fortsat


  • Om Bytes
  • Næste side (kun tegntabel - kan springes over)


    Om Bytes

    Den mest grundlæggende form for databehandling er tekstbehandling, så det kan vi bruge som eksempel. Når vi laver tekstbehandling, sidder vi med et tastatur, der minder om en skrivemaskine. Der er 102 taster, hvor vi kan finde hele alfabetet: A, B, C etc. Vi kan finde alle tallene fra 0 til 9 og alle de øvrige tegn, vi har brug for:,.-;():_?;!"#¤%&osv.

    Alle disse tegn skal digitaliseres, de skal laves om til 0’er og 1’ere. Her benytter man afgrænsede portioner af bits. Man samler nemlig otte af dem til en enhed, og kalder det for bytes.

    8 bits = 1 byte

    8 bits = 1 byte, det er systemet. Og hvad kan man så bruge bytes til? Jo lad os først se, hvor mange forskellige bytes, vi kan lave. En byte er et 8-cifret bitmønster. Vi kæder altså otte 0’er og 1’ere samen i et mønster. Hvor mange forskellige kan vi lave? Her er én: 01110101, og her er en anden: 10010101.

    Ved hjælp af kombinatorik kan vi slutte os til, at der kan konstrueres 2 x2 x 2 x 2 x 2 x2 x 2 x2 forskellige mønstre, da hver af de otte pladser kan antage to værdier.

  • 28 (to i ottende) giver 256. Der findes altså 256 forskellige bytes!

    Nu tilskriver vi alle bogstaver og andre tegn til hver sin byte. Og da vi har 256 forskellige mønstre at vælge mellem, er der fint plads til alle tegnene. Her ser du nogle eksempler på "oversættelsen":

    Tegn
    Bitmønster
    Byte nummer
    Tegn
    Bitmønster
    Byte nummer
    a
    01000001
    65
    ¼
    10111100
    188
    B
    01000010
    66
    .
    00101110
    46
    C
    01000011
    67
    :
    00111010
    58
    a
    01100001
    97
    $
    00100100
    36
    b
    01100010
    98
    \
    01011100
    92
    z
    01111010
    122
    ~
    01111110
    126
    æ
    11100110
    230
    1
    00110001
    49
    ø
    11111000
    248
    2
    00110010
    50
    å
    11100101
    229
    9
    00111001
    57
    Æ
    11000110
    198
    ©
    10101001
    169
    Ø
    11011000
    216
    >
    00111110
    62
    å
    11000101
    197
    10001001
    137

    Når du skriver ordet "sommer", så er der seks bogstaver i det. Hvis computeren skal bearbejde ordet, digitaliseres det til 6 bytes. Ordet sommer fylder altså 6 bytes i pc'ens RAM, hvis du indtaster det, og det fylder 6 bytes på harddisken, hvis det gemmes der.


    ASCIi

    ASCII står for American Standard Code for Information Interchange. Det er en industristandard, der placerer bogstaver, tal og tegn på de 256 pladser, der findes i 8 bits-koden.

    Tabellen er opdelt i tre sektioner, kan man sige:

  • Systemkoder med værdierne 0-31.

  • Den "lave ASCII" med værdierne 32-127. Denne del af tabellen stammer fra ældre, amerikanske edb-systemer, hvor man havde 7-bits tegntabeller. Dengang fandtes der overhovedet ikke æ, ø eller å.

  • Den "høje ASCII" med værdierne 128-255. Denne del er "programmerbar", idet man udskifter tegnene alt efter hvilken national tegntabel, man ønsker. Vi har æ, ø og å placeret i denne afdeling.

    Læs mere om tegnenes placering på siden:Modul 1b


    Et eksempel

    Som eksempel kan vi forestille os en bitstrøm fra tastaturet ind mod pc'en. Når du taster, sendes en strøm af 8 bits - én efter én. Lad os se sådan en portion bits. Du taster, og bitsene flyder:

    001100010011001000110011

    Bitsene danner jo bytes. Da der er 24 bits, hvis du tæller efter, skal det egentlig læses som tre bytes. Det gør vi:

    00110001 og 00110010 og 00110011.

    Hvis vi omregner de tre bytes til decimal tal, så svarer det til tallene 49, 50 og 51. For at finde meningen med disse tre bytes, er vi nødt til at slå op i ASCII-tabellen. Der viser det sig, at du har tastet 123.


    Om tekst og kode

    Nu har vi set på pc'ens data, som altid er digitaliseret. Men der er mange forskellige typer data i pc'en. Man kan skelne mellem to grundlæggende forskellige typer data:

  • Brugerdata, som tekst, grafik, tal, lyd.

  • Programkode, som er data, der får pc'en til at arbejde.

    Sagen er jo, at det, der får CPU'en til at arbejde, er instruktioner. Det kan du også læse om under gennemgangen af CPU'erne i modul 3a. En instruktion er en streng af data, af 0'er og 1'ere. CPU'en er konstrueret til at genkende disse instruktioner, som ankommer sammen med de data, der skal behandles.

    Programkoden er altså en samling af instruktioner, der afvikles én efter én, når programmet afvikles. Hver gang du klikker med din mus på skærmen eller taster et bogstav, afgår der instruktioner fra dit brugerprogram til CPU'en, om at nu skal den håndtere denne situation på en bestemt måde.

    Brugerdata er de data, som programmerne arbejder med. Det er de breve, tegninger, hjemmesider etc, som du og jeg fremstiller ved hjælp af forskellige programmer. Så data findes altså i hvert fald to meget forskellige typer.


    Filer

    Både programkode og brugerdata er gemt som filer på harddisken. Ofte kan man kende forskel på filerne ved at se på deresefternavn . Her følger nogle eksempler:

    IndholdFilnavn
    Programkode START.EXE, WIN.COM, HELP.DLL, VMM32.VXD
    Brugerdata BREV.DOC, HUS.BMP. INDEX.HTm

    Dette er skrevet som en introduktion til filnavngivning. For filernes efternavne er utroligt afgørende for pc'ens måde at behandle filerne på. Du kan læse om emnet i flere af mine hæfter, blandt andet "DOS - lær det selv".


  • Næste side
  • Forrige side


    Lær mere

    Se spørgsmålet her.

    Læs videre om pc'ens grundarkitektur i modul 2a.

    Læs om filnavne .

    Læs videre om boot-processen og systembussen i modul 2b.

    Læs videre om I/O-busserne i modul 2c.

    Læs videre om bundkortets chipsæt i modul 2d.

    Læs videre om RAM i modul 2e.

    Læs videre om BIOS i modul 6c.


    Copyright (c) 1996-2011 by Michael B. Karbo.