Bildverarbeitung

Bildverarbeitung#

Die nachfolgenden Aufgaben behandeln das Einlesen und Bearbeiten von Bilddateien. Verwenden das Modul Matplotlib zum Einlesen und Darstellen der Dateien und Numpy zur Datenverarbeitung. JPEG Bilder wie sie im Folgenden verwendet werden, können mittels Python als dreidimensionales Array eingelesen werden. Oftmals empfiehlt es sich die Bearbeitung getrennt für die drei Farbkanäle \((R, G, B)\) vorzunehmen. Sämtliche Bilder können zur lokalen Bearbeitung der Aufgaben hier heruntergeladen heruntergeladen werden: Bilder.zip. Die Bilder befinden sich ebenfalls auf dem JupyterHub zur Vorlesung und können wie folgt adressiert werden:

image_dir = '/srv/images/'
image = image_dir + 'imagename.jpg'
bild_array = plt.imread(image)

Weißabgleich#

Der Weißabgleich dient der Anpassung der Farbtemperatur eines Fotos an die Lichtbedingungen des Aufnahmeortes. Dies kann erreicht werden, indem die Intensitäten der drei Farbkanäle des Fotos anhand eines Referenzpixels skaliert werden. Der Referenzpixel wird dabei aus einem Bereich des Bildes ausgewählt, der wahrheitsgemäß als weiß oder grau angenommen wird. Für die Übung benötigen Sie das Bild “Weissabgleich.jpg”

Aufgabe#

Nachfolgendes Foto weist durch einen falschen Weißabgleich einen erheblichen Blaustich auf. Wählen Sie einen Referenzpixel innerhalb des Bildes und korrigieren Sie die Intensitäten der drei Farbkanäle auf ein einheitliches Niveau. Skalieren Sie sämtliche Pixel des Bildes anhand der zuvor bestimmten Korrekturfaktoren.

Orientieren Sie sich dabei an den folgenden Bearbeitungsschritten:

Lesen Sie das Bild mit Matplotlib als dreidimensionales Numpy.array ein.
Extrahieren Sie die Werte für die drei Farbkanäle für einen einzigen Referenzpixel innerhalb des Bildes, welcher in der Realität idealerweise einen Weiß- oder Grauton aufweist, für den also gilt \(R = G = B\).
Bestimmen Sie die Skalierungsfaktoren, die erforderlich sind um ein Farbgleichgewicht für diesen Pixel zu erreichen. Normieren Sie diese auf den grünen Farbkanal (Kanal 1).
Skalieren Sie die Farbwerte sämtlicher Pixel des Bildes mit den Skalierungsfaktoren.
Stellen Sie das modifizierte Numpy.array erneut mit Matplotlib dar.

Hinweis

Beachten Sie, dass die Funktion matplotlib.imshow lediglich die Ausgabe von RGB Bildern mit Integerwerten, also Ganzzahlen erlaubt. Floatwerte (Fließkommazahlen) müssen vorab entsprechend gerundet bzw. konvertiert werden.

../../../../_images/weissabgleich.jpg — Fig. 3.2 Foto mit falschem Weißabgleich und starkem Blaustich#

Hinweis

Die Koordinaten beim Auslesen von Pixeldaten mit Numpy entsprechen den Indizes des Numpy.array und sind demnach gegenüber der Ausgabe mit Matplotlib transponiert.

Lösungsvorschlag#

Als Referenzpixel wird ein Punkt mit den Pixel-Koordinaten x = 3900, y = 1300 auf der Mühle gewählt, von dem angenommen wird, dass er in Wirklichkeit annähernd perfekt weiß ist.

Show code cell content Hide code cell content

import os
import matplotlib.pyplot as plt
import numpy as np

# Laden der Bilddateie als Numpy.array
image = plt.imread('bilder/Weissabgleich.jpg')

# Auslesen der Farbwerte eines Referenzpixels
x = 3900
y = 1300
ref_pixel = image[y,x]

# Berechnung der Skalierungsfaktoren und Normierung anhand des grünen Farbkanals
rgb_scale = ref_pixel/ref_pixel[1]

# Weißabgleich des gesamten Bildes anhand der Skallierungsfaktoren
image_wb = (image/rgb_scale).astype('uint8')

# Darstellen des korrigierten Bildes
fig = plt.figure(figsize=(10,10))
plt.scatter(x,y, color='red', label="Referenzpixel")
plt.imshow(image_wb)
plt.legend(loc='best')
plt.show()

---------------------------------------------------------------------------
FileNotFoundError                         Traceback (most recent call last)
Cell In[1], line 6
      3 import numpy as np
      5 # Laden der Bilddateie als Numpy.array
----> 6 image = plt.imread('bilder/Weissabgleich.jpg')
      8 # Auslesen der Farbwerte eines Referenzpixels
      9 x = 3900

File /opt/hostedtoolcache/Python/3.10.16/x64/lib/python3.10/site-packages/matplotlib/pyplot.py:2607, in imread(fname, format)
   2603 @_copy_docstring_and_deprecators(matplotlib.image.imread)
   2604 def imread(
   2605         fname: str | pathlib.Path | BinaryIO, format: str | None = None
   2606 ) -> np.ndarray:
-> 2607     return matplotlib.image.imread(fname, format)

File /opt/hostedtoolcache/Python/3.10.16/x64/lib/python3.10/site-packages/matplotlib/image.py:1512, in imread(fname, format)
   1505 if isinstance(fname, str) and len(parse.urlparse(fname).scheme) > 1:
   1506     # Pillow doesn't handle URLs directly.
   1507     raise ValueError(
   1508         "Please open the URL for reading and pass the "
   1509         "result to Pillow, e.g. with "
   1510         "``np.array(PIL.Image.open(urllib.request.urlopen(url)))``."
   1511         )
-> 1512 with img_open(fname) as image:
   1513     return (_pil_png_to_float_array(image)
   1514             if isinstance(image, PIL.PngImagePlugin.PngImageFile) else
   1515             pil_to_array(image))

File /opt/hostedtoolcache/Python/3.10.16/x64/lib/python3.10/site-packages/PIL/Image.py:3465, in open(fp, mode, formats)
   3462     filename = os.fspath(fp)
   3464 if filename:
-> 3465     fp = builtins.open(filename, "rb")
   3466     exclusive_fp = True
   3467 else:

FileNotFoundError: [Errno 2] No such file or directory: 'bilder/Weissabgleich.jpg'

Image Stacking#

Der Begriff “Image Stacking” bezeichnet allgemein das Überlagern von Bildern um unterschiedliche Effekte und Wirkungen zu erzielen. Neben dem Erzeugen von künstlerischen Effekten können auf diese Weise auch bewegte Objekte aus einer Bildserie des selben Bildausschnittes entfernt werden.

Für diese Aufgabe benötigen Sie die Bilder “Image_stackig_1.jpg” - “Image_stacking_5.jpg”

../../../../_images/Stacking_bildserie.jpg — Fig. 3.3 Bildserie des selben Bildauschnittes mit “bewegtem” Objekt#

Aufgabenteil 1#

Überlagern Sie alle Bilder der genannten Bildserie, indem Sie den Durchschnitt der Farbwerte eines jeden Pixels bilden. Gehen Sie dazu wie folgt vor:

Lesen Sie das Bild mit Matplotlib als dreidimensionales Numpy.array ein und separieren Sie die Farbkanäle als zweidimensionale Arrays
Bilden Sie die Durschnittswerte der monochromatischen Bildarrays aus den Bildserien unter Anwendung der Numpy.mean Funktion. Tip: Verwenden Sie eine Schleife zum Einlesen der Daten und speichern Sie die Arrays in einer Liste zwischen.
Fügen Sie die Arrays mit den Durchschnittswerten wieder zu einem dreidimensionalen Array zusammen und plotten Sie das Ergebnis.

Lösungsvorschlag#

Aufgabenteil 2#

Überlagern Sie erneut die einzelnen Bilder und wenden Sie einen Hochpassfilter (z.B. Median) auf die einzelnen Farbkanäle an um stark abweichende Farbwerte aus dem Bild zu eliminieren. Führen Sie hierzu die Arbeitsschritte aus Aufgabenteil 1 aus. Verwenden Sie statt der Funktion zur Berechnung des Durchschnitts z.B. Numpy.median. Überlegen Sie vorab, welcher Effekt hierdurch in Bezug auf das überlagerte Bild erzielt wird.

Lösungsvorschlag#

Freistellen von Objekten#

Das Freistellen von Objekten kann über verschiedene Methoden mit unterschiedlicher Komplexizität erfolgen. Eine einfache, wenn auch äußerst fehleranfällige Methode ist das Maskieren anhand eines Schwellenwertes einer oder mehrerer Farbkanäle.

Aufgabe#

Für die Übung benötigen Sie die Bilder “Freistellen_objekt.jpg” und “Freistellen_hintergrund.jpg”. Maskieren Sie die Bereiche um die Kerze herum anhand von oberen oder unteren Schwellenwerten eines oder mehrerer Farbkanäle. Platzieren Sie die Kerze anschließend innerhalb des zweiten Bildes.

Orientieren Sie sich an folgenden Arbeitsschritten:

Definieren Sie einen unteren Schwellenwert zwischen 0 und 255 für den roten Farbkanal. Legen Sie im erste Schritt eine beliebigen Wert fest und iterieren Sie diesen, bis das gewünschte Ergebnis erreicht ist.
Bilden Sie das Bild ‘Freistellen_objekt.jpg’ als dreidimensionales Numpy.array ab und separieren Sie die einzelnen Farbkanäle als zweidimensionale Arrays.
Erstellen Sie eine Maske, welche nur die Pixelkoordinaten berücksichtigt, in denen der festgelegte Schwellenwert überschritten wird. Nutze Sie hierfür z.B. die Funktion Numpy.where.
Weisen Sie den maskierten Pixel einen fixen Farbwert zu um einen einfarbigen Hintergrund zu erhalten
Weisen Sie den maskierten Pixeln die entsprechenden Pixel mit den selben Koordinaten aus dem Bild “Freistellen_hintergrund.jpg” zu.

../../../../_images/Freistellen_bildserie.jpg — Fig. 3.4 Objekt und Hintergrund#

Lösungsvorschlag#

Gammakorrektur#

In der digitalen Bildverarbeitung dient die Gammakorrektur zur Überführung linearer physikalischer Zusammenhänge in die nichtlineare menschliche Wahrnehmung. Die Gammafunktion ist eine Potenzfunktion, die z.B. im Rahmen der Farbraumumwandlung in den sRGB Standard die Rohdaten eines Bildes, wie die Pixelhelligkeit \(I_{in}\) in eine entsprechende Ausgabegröße \(I_{out}\) umwandelt. Die Gammafunktion kann wie folgt beschrieben werden:

\[I_{out} = {I_{in}}^\gamma\]

Dabei gilt: \(0 \leq I_{in} \leq 1\) und \(0 \leq I_{out} \leq 1\)

Aufgabe#

Führen Sie Gammakorrektur für die Faktoren \(\gamma = 2.2\) und \(\gamma = 0.5\) durch. Gehen Sie dazu wie folgt vor:

Erstellen Sie zuerst zwei “Lookup-Tabellen” (LUT) in der Sie alle möglichen Pixelwerte \(I_{in}\) in einem linearen Wertebereich von 8bit mit den durch die Gamma-Funktion korrigierten Werten \(I_{out}\) verknüpfen. Erstellen die für beide \(\gamma\)-Werte unabhängige LUT.
Plotten Sie jeweils die Abhängigkeit zwischen \(I_{in}\) und \(I_{out}\).
Führen Sie anschließend die Gammakorrektur für sämtliche Pixel der drei Farbkanäle des Bildes durch. Verwenden Sie hierzu die Möglichkeit der Indizierung eines Numpy.array nach dem Schema
```
I_out = lut[I_in]
```

Verwenden Sie das nachfolgende Bild “Gammakorrektur.jpg” für diese Aufgabe:

../../../../_images/Gammakorrektur.jpg — Fig. 3.5 Bild mit falscher Gammakorrektur.#

Bildverarbeitung

Contents

Bildverarbeitung#

Weißabgleich#

Aufgabe#

Lösungsvorschlag#

Image Stacking#

Aufgabenteil 1#

Lösungsvorschlag#

Aufgabenteil 2#

Lösungsvorschlag#

Freistellen von Objekten#

Aufgabe#

Lösungsvorschlag#

Gammakorrektur#

Aufgabe#

Lösungsvorschlag#