Modellierung

3.3. Modellierung#

Die Modellierung von Daten hat das Ziel eine Menge von Daten durch einen funktionalen Zusammenhang abzubilden. Beispielhaft können Daten aus Experimenten oder Simulationen stark verrauscht und so für eine Weiterverarbeitung nicht geeignet sein. Eine mittelnde Funktion kann den Datensatz stark vereinfachen. Oder es existieren nur wenige Datenpunkte und die Zwischenstellen müssen durch eine Funktion bestimmt werden.

Generell kann die Modellierung von Daten auf folgendes Problem verallgemeinert werden:

  1. Gegeben sind \(\sf n\) Messpunktpaare \(\sf (x_i, y_i)\) mit \(\sf x_i, y_i \in \mathbb{R}\)

  2. Gesucht ist eine Modellfunktion \(\sf y(x)\), welche die Messpunktpaare approximiert

Ein möglicher Ansatz ist die Darstellung der Modellfunktion als Summe von \(\sf m\) Basisfunktionen \(\sf \phi_i(x)\) mit den Koeffizienten \(\sf \beta_i\).

\[ \sf y(x) = \sum_{i=1}^{m}\beta_i \cdot \phi_i(x) = \beta_1\cdot \phi_1(x) + \cdots + \beta_m\cdot \phi_m(x) \]

Die Koeffizienten \(\sf \beta_i\) müssen dabei so bestimmt werden, dass \(\sf y(x)\) so gut wie möglich – oder gar exakt – die Messpunkte approximieren.

Als Abstandmaß zwischen einer Modellfunktion und den Messpunkten kann die L2-Norm verwendet werden. Diese ist definiert als

\[ \sf || y(x) - (x_i, y_i) ||_2 = \sum_{i=1}^n \left(y(x_i) - y_i\right)^2 \quad .\]

Eine solche Norm gibt ein Maß für die Qualität einer Approximation: je kleiner der Abstand, desto besser die Qualität. Dies ermöglicht das Finden optimaler Koeffizienten und wird beispielsweise in der Methode der kleinsten Quadrate genutzt, in der ein Satz an Koeffizienten gesucht wird, der die L2-Norm minimiert.

In diesem Kapitel werden Verfahren vorgestellt um Daten zu Modellieren: die Polynominterpolation und das Fitting durch Polynome und Splines.