5. Das Bild als Ortsbereichsfunktion

Das sogenannte "Idealbild" ist eine Funktion von den reellen Zahlen nach einer reellen Zahl, die im allg. ein Grauwert ist:

  f:  R^2 --> R (R.: Reelle Zahlen)

Für die Praxis der Bildverarbeitung ist aber das kontinuierliche Bild weniger brauchbar. Für die Darstellung als Pixelbild muß das Idealbild gerastert werden.
Die häufigste Pixelnumerierung hat den Ursprung oben links, und die x-Richtung ist die vertikale.

Durch Pixelbilder gehen natürlich manche urprüngliche Informationen verloren. Genauso ist es ein Problem, Abbildungen in der Pixelebene ohne Informationsverlust zu machen (siehe Bild 5.1).
Bild 5.1: Abbildung eines Quadrates in der Pixelebene

Zum Pixelraster gibt es auch noch die Alternative des Hexelrasters (Bild 5.2), also anstatt Rechtecke Sechsecke.
 
Bild 5.2: (links) Pixelraster
(rechts) Hexelraster

Besonders schräge Geraden und Rundungen können hiermit anschaulich dargestellt werden. Dafür gibt es Nachteile beim Darstellen von rechten Winkeln.

5.1  Speicherung von Bildern

Je nach Anforderungen an ein Bild gibt es verschiedene Speicherformate, z.B. das Format GIF, bei dem ein bestimmter Farbwert als transparent zum Hintergrund gesetzt werden kann.
Ein Bild besteht immer aus einem Header, in dem Bildgröße, Typ und evtl. sonstige Informationen festgehalten sind, und dem Datenblock, dem eigentlichen Bild. Manchen Bildern ist noch eine Farbtabelle beigefügt, da eigene Farbmodelle verwendet werden. Für die Medizin ist ein bestimmter Typ interessant, der aus einem Header und außerdem wiederum aus Bildern anderer Formate besteht. Das momentane Standard-Format für die Medizin ist DICOM(*). Darin können z.B. auch Daten über den jeweiligen Patienten und das Datum von Aufnahmen abgespeichert werden.

5.2 Kenngrößen von Bildern

Das Histogramm gibt Auskunft über die Häufikeit eines gegebenen Grauwertes im Bild:

  h: G --> N  (G: Menge aller Grauwerte, N: natürliche Zahlen)

Der mittlere Grauwert berechnet sich: (S steht für den griechischen Buchstaben Sigma (Summe))

  _           1
  g =     ----  *  S  f(m,n)
            MN      m,n

(M (N) ist hier die Pixelanzahl in x- (y-) Richtung.)

Der globale Kontrast (die mittlere quadratische Grauwertabweichung):

              1                          _
  q =     ----  *  S  (f(m,n) - g )^2
            MN      m,n

Um ein Bild mit möglichst geringer Größe zu speichern, gibt es verschiedene Möglichkeiten. Eine ist der Quad-Tree-Code für Binärbilder. Als Beispiel nehmen wir Bild 5.3.
Bild 5.3

Das im Original aus den kleinsten Pixeln bestehende Bild wird nun, wo es möglich ist, gröber gerastert.
Für eine platzsparende Größe und effiziente Übertragung speichert man das ganze als einen Baum (Bild 5.4)
           
Bild 5.4

5.3 Objekte, Konturen

Es ist wichtig, in manchen Bildern Objekte erkennen zu können. Sie definieren sich dadurch, dass sie zusammenhängend sind. Beschreiben kann man eine Objekt etwa über seine Kontur. Schwierig ist es aber, so ein Objekt vom Hintergrund zu trennen, wenn es sich um ein Bild mit mehr als zwei Graustufen handelt. Der Hintergrund definiert sich vage als "relativ einheitlich gefärbten oder strukturierten Pixelbereich, der besonders am Rand eines Bildes liegt" (aus [1]).
Bleiben wir bei den Binärbildern. Eine Kontur eines Objektest kann man über den Kettencode beschreiben.
Man durchläuft die Kontur, indem man z.B. an der oberen, linken Ecke beginnt und nun bei jedem Schritt die Richtung angibt.(Bild 5.5)
Bild 5.5

Der Kettencode für Bild 5.5 lautet:
 101002215444446666

Außer der Erkennung eines Objektes ist es wichtig, dessen Form zu erkennen (etwa bananen- oder ellipsenförmig). Das bereitet dem Menschen kaum Schwierigkeiten, aber dem Computer fehlt das nötige Kontextwissen. Die Morphologie beschäftigt sich mit diesem Problem.


(*) Digital Imaging and Communications in Medicine)

Inhaltsverzeichnis
4  Bildwahrnehmung des Menschen
6  Morphologie, Bildtransformation
8 Literaturverzeichnis