Das sogenannte "Idealbild" ist eine Funktion von den reellen Zahlen nach einer reellen Zahl, die im allg. ein Grauwert ist:
f: R^2 --> R (R.: Reelle Zahlen)
Für die Praxis der Bildverarbeitung ist aber das kontinuierliche
Bild weniger brauchbar. Für die Darstellung als Pixelbild muß
das Idealbild gerastert werden.
Die häufigste Pixelnumerierung hat den Ursprung oben links, und
die x-Richtung ist die vertikale.
Durch Pixelbilder gehen natürlich manche urprüngliche Informationen verloren. Genauso ist es ein Problem, Abbildungen in der Pixelebene ohne Informationsverlust zu machen (siehe Bild 5.1).
Bild 5.1: Abbildung eines Quadrates in der Pixelebene |
Bild 5.2: (links) Pixelraster (rechts) Hexelraster |
5.1 Speicherung von Bildern
Je nach Anforderungen an ein Bild gibt es verschiedene Speicherformate,
z.B. das Format GIF, bei dem ein bestimmter Farbwert als transparent zum
Hintergrund gesetzt werden kann.
Ein Bild besteht immer aus einem Header, in dem Bildgröße,
Typ und evtl. sonstige Informationen festgehalten sind, und dem Datenblock,
dem eigentlichen Bild. Manchen Bildern ist noch eine Farbtabelle beigefügt,
da eigene Farbmodelle verwendet werden. Für die Medizin ist ein bestimmter
Typ interessant, der aus einem Header und außerdem wiederum aus Bildern
anderer Formate besteht. Das momentane Standard-Format für die Medizin
ist DICOM(*). Darin können z.B. auch Daten
über den jeweiligen Patienten und das Datum von Aufnahmen abgespeichert
werden.
5.2 Kenngrößen von Bildern
Das Histogramm gibt Auskunft über die Häufikeit eines gegebenen Grauwertes im Bild:
h: G --> N (G: Menge aller Grauwerte, N: natürliche Zahlen)
Der mittlere Grauwert berechnet sich: (S steht für den griechischen Buchstaben Sigma (Summe))
_ 1
g = ---- * S f(m,n)
MN m,n
(M (N) ist hier die Pixelanzahl in x- (y-) Richtung.)
Der globale Kontrast (die mittlere quadratische Grauwertabweichung):
1 _
q = ---- * S (f(m,n)
- g )^2
MN m,n
Um ein Bild mit möglichst geringer Größe zu speichern,
gibt es verschiedene Möglichkeiten. Eine ist der Quad-Tree-Code für
Binärbilder. Als Beispiel nehmen wir Bild 5.3.
Bild 5.3 |
Das im Original aus den kleinsten Pixeln bestehende Bild wird nun, wo
es möglich ist, gröber gerastert.
Für eine platzsparende Größe und effiziente Übertragung
speichert man das ganze als einen Baum (Bild 5.4)
Bild 5.4 |
Es ist wichtig, in manchen Bildern Objekte erkennen zu können.
Sie definieren sich dadurch, dass sie zusammenhängend sind. Beschreiben
kann man eine Objekt etwa über seine Kontur. Schwierig ist es aber,
so ein Objekt vom Hintergrund zu trennen, wenn es sich um ein Bild mit
mehr als zwei Graustufen handelt. Der Hintergrund definiert sich vage als
"relativ einheitlich gefärbten oder strukturierten Pixelbereich, der
besonders am Rand eines Bildes liegt" (aus [1]).
Bleiben wir bei den Binärbildern. Eine Kontur eines Objektest
kann man über den Kettencode beschreiben.
Man durchläuft die Kontur, indem man z.B. an der oberen, linken
Ecke beginnt und nun bei jedem Schritt die Richtung angibt.(Bild 5.5)
Bild 5.5 |
Der Kettencode für Bild 5.5 lautet:
101002215444446666
Außer der Erkennung eines Objektes ist es wichtig, dessen Form zu erkennen (etwa bananen- oder ellipsenförmig). Das bereitet dem Menschen kaum Schwierigkeiten, aber dem Computer fehlt das nötige Kontextwissen. Die Morphologie beschäftigt sich mit diesem Problem.