Dateien

Contents

3.2.4. Dateien#

Das Modul numpy stellt Funktionen zum lesen und schreiben von strukturierten Textdateien bereit.

import numpy as np
np.set_printoptions(precision=2, linewidth=65)

import matplotlib.pyplot as plt

Lesen#

Zum lesen von strukturierten Textdateien, z.B. im CSV-Format (comma separated values), kann die np.loadtxt-Funktion verwendet werden. Diese bekommt als Argumente den einzulesenden Dateinamen und weitere Optionen zur Definition der Struktur der Daten. Der Rückgabewert ist ein (mehrdimensionales) Array.

Im folgenden Beispiel wird die Datei TC01.csv eingelesen und deren Inhalt graphisch dargestellt. Die erste Zeile der Datei wird dabei ignoriert, da sie als Kommentar – eingeleitet durch das #-Zeichen – interpretiert wird.

dateiname = 'TC01.csv'
daten = np.loadtxt(dateiname)
print("Daten:", daten)
print("Form:", daten.shape)
Daten: [20.1 20.1 20.1 ... 24.3 24.2 24.2]
Form: (1513,)
plt.plot(daten)
plt.xlabel('Datenindex')
plt.ylabel('Temperatur in °C');
../../../_images/879baaf1b6d1940ef139b7fd41b15cbc239a338704c9753d1ca3c846b1a2da4f.png

Schreiben#

Zum Schreiben von Arrays in Dateien kann die in numpy verfügbare Funktion np.savetxt verwendet werden. Dieser müssen mindestens die zu schreibenden Arrays als auch ein Dateiname übergeben werden. Darüber hinaus sind zahlreiche Formattierungs- bzw. Strukturierungsoptionen möglich.

Folgendes Beispiel skaliert die oben eingelesenen Daten und schreib jeden zehnten Wert in eine Datei. Dabei wird auch ein Kommentar (header-Argument) am Anfang der Datei erzeugt. Das Ausgabeformat der Zahlen kann mit dem fmt-Argument angegeben werden. Das Format ähnelt der Darstellungsweise, welche bei den formatierten Zeichenketten vorgestellt wurde.

wertebereich = np.max(daten) - np.min(daten)
daten_skaliert = ( daten - np.min(daten) ) / wertebereich
daten_skaliert = daten_skaliert[::10]
plt.plot(daten_skaliert)
plt.xlabel('Datenindex')
plt.ylabel('Skalierte Temperatur');
../../../_images/ca63118a4385e1e7205e997d07a595b6c9e455123a93fe02ba56c7d5d34fa715.png

Beim schreiben der Datei wird ein mehrzeiliger Kommentar mithilfe des Zeilenumbruchzeichens \n definiert. Die Ausgabe der Gleitkommazahlen wird mit %5.2f formatiert, was 5 Stellen insgesamt und zwei Nachkommastellen entspricht.

# Zuweisung ist auf mehrere Zeilen aufgeteilt, aufgrund der 
# schmalen Darstellung im Skript
kommentar = f'Daten aus {dateiname} skaliert auf den Beriech' + \
             '0 bis 1\noriginales Min / Max:' + \
            f'{np.min(daten)}/{np.max(daten)}'
neu_dateiname = 'TC01_skaliert.csv'

np.savetxt(neu_dateiname, daten_skaliert, 
           header=kommentar, fmt='%5.2f')

Zum Veranschaulichen werden die ersten Zeilen der neuen Datei ausgegeben.

# Einlesen der ersten Zeilen der neu erstellten Datei
datei = open(neu_dateiname, 'r')
for i in range(10):
    print( datei.readline() , end='')
datei.close()
# Daten aus TC01.csv skaliert auf den Beriech0 bis 1
# originales Min / Max:20.1/31.1
 0.00
 0.00
 0.00
 0.01
 0.01
 0.01
 0.01
 0.01