SciPy - interpoluj

W tym rozdziale omówimy, w jaki sposób interpolacja pomaga w SciPy.

Co to jest interpolacja?

Interpolacja to proces znajdowania wartości między dwoma punktami na linii lub krzywej. Aby pomóc nam zapamiętać, co to znaczy, powinniśmy pomyśleć o pierwszej części słowa „inter” jako o znaczeniu „wejść”, które przypomina nam, abyśmy zajrzeli „do wnętrza” danych, które mieliśmy pierwotnie. To narzędzie, interpolacja, jest przydatne nie tylko w statystykach, ale jest również przydatne w nauce, biznesie lub gdy istnieje potrzeba przewidywania wartości mieszczących się w dwóch istniejących punktach danych.

Utwórzmy trochę danych i zobaczmy, jak można wykonać tę interpolację za pomocą scipy.interpolate pakiet.

import numpy as np
from scipy import interpolate
import matplotlib.pyplot as plt
x = np.linspace(0, 4, 12)
y = np.cos(x**2/3+4)
print x,y

Powyższy program wygeneruje następujące dane wyjściowe.

(
   array([0.,  0.36363636,  0.72727273,  1.09090909,  1.45454545, 1.81818182, 
          2.18181818,  2.54545455,  2.90909091,  3.27272727,  3.63636364,  4.]),
            
   array([-0.65364362,  -0.61966189,  -0.51077021,  -0.31047698,  -0.00715476,
           0.37976236,   0.76715099,   0.99239518,   0.85886263,   0.27994201,
          -0.52586509,  -0.99582185])
)

Teraz mamy dwie tablice. Zakładając, że te dwie tablice są dwoma wymiarami punktów w przestrzeni, wykreślmy za pomocą następującego programu i zobaczmy, jak wyglądają.

plt.plot(x, y,’o’)
plt.show()

Powyższy program wygeneruje następujące dane wyjściowe.

Interpolacja 1-D

Klasa interp1d w scipy.interpolate jest wygodną metodą tworzenia funkcji opartej na stałych punktach danych, które można oceniać w dowolnym miejscu w dziedzinie określonej przez dane za pomocą interpolacji liniowej.

Korzystając z powyższych danych, stwórzmy funkcję interpolacji i narysuj nowy wykres interpolowany.

f1 = interp1d(x, y,kind = 'linear')

f2 = interp1d(x, y, kind = 'cubic')

Korzystając z funkcji interp1d, utworzyliśmy dwie funkcje f1 i f2. Te funkcje dla danego wejścia x zwraca y. Trzeci rodzaj zmiennej reprezentuje typ techniki interpolacji. „Linear”, „Nearest”, „Zero”, „Slinear”, „Quadratic”, „Cubic” to tylko kilka technik interpolacji.

Teraz stwórzmy nowe wejście o większej długości, aby zobaczyć wyraźną różnicę w interpolacji. Będziemy używać tej samej funkcji starych danych w nowych danych.

xnew = np.linspace(0, 4,30)

plt.plot(x, y, 'o', xnew, f(xnew), '-', xnew, f2(xnew), '--')

plt.legend(['data', 'linear', 'cubic','nearest'], loc = 'best')

plt.show()

Powyższy program wygeneruje następujące dane wyjściowe.

Splajny

Aby narysować gładkie krzywe przez punkty danych, kreślarze używali kiedyś cienkich elastycznych pasków z drewna, twardej gumy, metalu lub tworzywa sztucznego, zwanych wielowypustami mechanicznymi. Aby użyć mechanicznego splajnu, kołki zostały umieszczone w rozsądnym wyborze punktów wzdłuż krzywej w projekcie, a następnie splajn został wygięty, tak aby dotykał każdego z tych kołków.

Oczywiście w tej konstrukcji splajn interpoluje krzywą na tych kołkach. Może być użyty do odtworzenia krzywej na innych rysunkach. Punkty, w których znajdują się szpilki, nazywane są węzłami. Możemy zmienić kształt krzywej zdefiniowanej przez splajn, dostosowując położenie węzłów.

Splajn jednowymiarowy

Jednowymiarowy splajn wygładzający pasuje do danego zestawu punktów danych. Klasa UnivariateSpline w scipy.interpolate to wygodna metoda tworzenia funkcji w oparciu o klasę stałych punktów danych - scipy.interpolate.UnivariateSpline (x, y, w = None, bbox = [None, None], k = 3, s = Brak, ext = 0, check_finite = False).

Parameters - Poniżej przedstawiono parametry splajnu jednowymiarowego.

  • Dopasowuje to splajn y = spl (x) stopnia k do podanych danych x, y.

  • „w” - określa wagi dopasowania splajnu. Musi być pozytywny. Jeśli brak (domyślnie), wszystkie wagi są równe.

  • „s” - określa liczbę węzłów poprzez określenie warunku wygładzenia.

  • „k” - stopień splajnu wygładzającego. Musi być <= 5. Domyślnie k = 3, sześcienny splajn.

  • Ext - steruje trybem ekstrapolacji dla elementów spoza przedziału zdefiniowanego przez sekwencję węzłów.

    • if ext = 0 lub „extrapolate”, zwraca ekstrapolowaną wartość.

    • jeśli ext = 1 lub „zero”, zwraca 0

    • jeśli ext = 2 lub 'raise', podnosi ValueError

    • if ext = 3 of „const”, zwraca wartość graniczną.

  • check_finite - czy należy sprawdzić, czy tablice wejściowe zawierają tylko liczby skończone.

Rozważmy następujący przykład.

import matplotlib.pyplot as plt
from scipy.interpolate import UnivariateSpline
x = np.linspace(-3, 3, 50)
y = np.exp(-x**2) + 0.1 * np.random.randn(50)
plt.plot(x, y, 'ro', ms = 5)
plt.show()

Użyj domyślnej wartości parametru wygładzania.

spl = UnivariateSpline(x, y)
xs = np.linspace(-3, 3, 1000)
plt.plot(xs, spl(xs), 'g', lw = 3)
plt.show()

Ręcznie zmień stopień wygładzania.

spl.set_smoothing_factor(0.5)
plt.plot(xs, spl(xs), 'b', lw = 3)
plt.show()