Articles

Regressione locale

Nel 1964, Savitsky e Golay proposero un metodo equivalente a LOESS, che viene comunemente indicato come filtro Savitzky–Golay.William S. Cleveland riscoprì il metodo nel 1979 e gli diede un nome distinto. Il metodo è stato ulteriormente sviluppato da Cleveland e Susan J. Devlin (1988). LOWESS è anche conosciuto come regressione polinomiale ponderata localmente.

In ogni punto dell’intervallo del set di dati un polinomio di basso grado è montato su un sottoinsieme dei dati, con valori di variabili esplicative vicino al punto la cui risposta viene stimata., Il polinomio è montato utilizzando i minimi quadrati ponderati, dando più peso ai punti vicino al punto la cui risposta viene stimata e meno peso ai punti più lontani. Il valore della funzione di regressione per il punto viene quindi ottenuto valutando il polinomio locale utilizzando i valori delle variabili esplicative per quel punto dati. L’adattamento LOESS è completo dopo che i valori della funzione di regressione sono stati calcolati per ciascuno dei punti dati n {\displaystyle n}. Molti dei dettagli di questo metodo, come il grado del modello polinomiale e i pesi, sono flessibili., La gamma di scelte per ogni parte del metodo e i valori predefiniti tipici sono brevemente discussi di seguito.

Sottoinsiemi localizzati di dataEdit

I sottoinsiemi di dati utilizzati per ogni minimo quadrato ponderato in LOESS sono determinati da un algoritmo neighbors più vicino. Un input specificato dall’utente per la procedura chiamata “larghezza di banda” o “parametro smoothing” determina la quantità di dati utilizzata per adattarsi a ciascun polinomio locale. Il parametro smoothing, α {\displaystyle \ alpha}, è la frazione del numero totale n di punti dati utilizzati in ogni adattamento locale., Il sottoinsieme di dati utilizzati in ogni adattamento dei minimi quadrati ponderati comprende quindi i punti n α {\displaystyle n\alpha} (arrotondati al numero intero più grande successivo) i cui valori delle variabili esplicative sono più vicini al punto in cui viene stimata la risposta.

α {\displaystyle \alpha } è chiamato il parametro smoothing perché controlla la flessibilità della funzione di regressione LOESS. Grandi valori di α {\displaystyle \ alpha } producono le funzioni più lisce che si muovono meno in risposta alle fluttuazioni dei dati., Più piccolo è α {\displaystyle \ alpha}, più vicina sarà la funzione di regressione conforme ai dati. L’utilizzo di un valore troppo piccolo del parametro smoothing non è tuttavia auspicabile, poiché la funzione di regressione inizierà a catturare l’errore casuale nei dati.

Grado di polinomi localimodifica

I polinomi locali adatti a ciascun sottoinsieme dei dati sono quasi sempre di primo o secondo grado; cioè, localmente lineari (nel senso di linea retta) o localmente quadratici. L’utilizzo di un polinomio di grado zero trasforma LOESS in una media mobile ponderata., I polinomi di grado superiore funzionerebbero in teoria, ma producono modelli che non sono realmente nello spirito di LOESS. LOESS si basa sulle idee che qualsiasi funzione può essere ben approssimata in un piccolo quartiere da un polinomio di ordine basso e che i modelli semplici possono essere facilmente adattati ai dati. I polinomi ad alto grado tenderebbero a sovraccaricare i dati in ciascun sottoinsieme e sono numericamente instabili, rendendo difficili calcoli accurati.,

Funzione pesomodiFica

Come accennato in precedenza, la funzione peso fornisce il maggior peso ai punti dati più vicini al punto di stima e il minor peso ai punti dati più lontani. L’uso dei pesi si basa sull’idea che i punti vicini l’uno all’altro nello spazio variabile esplicativo hanno maggiori probabilità di essere correlati tra loro in modo semplice rispetto ai punti che sono più distanti. Seguendo questa logica, i punti che probabilmente seguono il modello locale influenzano al meglio le stime dei parametri del modello locale., I punti che hanno meno probabilità di conformarsi effettivamente al modello locale hanno meno influenza sulle stime dei parametri del modello locale.

La funzione di peso tradizionale utilizzata per LOESS è la funzione di peso tri-cube,

w (x) = (1 – / d / 3) 3 {\displaystyle w(x)=(1 – / d|^{3})^{3}}

dove d è la distanza di un dato punto dati dal punto sulla curva da montare, scalato per trovarsi nell’intervallo da 0 a 1.

Tuttavia, è possibile utilizzare anche qualsiasi altra funzione di peso che soddisfi le proprietà elencate in Cleveland (1979)., Il peso per un punto specifico in qualsiasi sottoinsieme localizzato di dati si ottiene valutando la funzione di peso alla distanza tra quel punto e il punto di stima, dopo aver scalato la distanza in modo che la massima distanza assoluta su tutti i punti nel sottoinsieme di dati sia esattamente uno.

RSS x RSS ( A) = i i = 1 N ( y i − A x ^ i ) T w i ( x ) ( y i − A x ^ i ) . Il nostro sito utilizza cookie tecnici e di terze parti per migliorare la tua esperienza di navigazione.,} Tr ⁡ ( W ( x ) ( Y − X ^ ) T ( Y − X ^ ) ) {\displaystyle \operatorname {Tr} (W(x)(Y-A{\hat {X}})^{T}(Y-A{\hat {X}}))} X ^ W ( x ) X ^ T = Y W ( x ) X ^ T . Il nostro sito utilizza cookie tecnici e di terze parti per migliorare la tua esperienza di navigazione.} A (x ) = Y W (x ) X ^ T − X ^ W (x ) X ^ T) – 1 . Il nostro sito utilizza cookie tecnici e di terze parti per migliorare la tua esperienza di navigazione.}

Una scelta tipica per w(x , z ) {\displaystyle w ( x,z)} è il peso gaussiano

w (x , z ) = exp ex (−(x − z ) 2 2 σ 2 ) {\displaystyle w (x,z)=\exp \left (- {\frac {(x-z)^{2}}{2\sigma ^{2}}}\right)}