fbpx
Wikipedia

Verallgemeinerte lineare Modelle sind nicht mit dem allgemeinen linearen Modell zu verwechseln, dessen natürliche englische Abkürzung ebenfalls GLM ist, aber im Gegensatz zu verallgemeinerten linearen Modellen von der Voraussetzung einer normalverteilten Antwortvariablen ausgeht. In vielen statistischen Programmpaketen werden – da die Abkürzung GLM schon für das allgemeine linearen Modell belegt ist – zur besseren Unterscheidung andere Abkürzungen wie VLM bzw. GLZ für englisch GeneraLiZed linear models (in STATISTICA) oder GzLM für englisch GeneraLiZed Linear Models (in SPSS) verwendet. Manche Autoren verwenden zu besseren Unterscheidung statt der Abkürzung GLM die Abkürzung GLiM.

Ebenso sind verallgemeinerte lineare Modelle nicht mit dem verallgemeinerten linearen Regressionsmodell der verallgemeinerten Kleinste-Quadrate-Schätzung (VKQ-Schätzung) zu verwechseln, bei der jedoch eine verallgemeinerte Struktur bzgl. der Störgrößen vorliegt.

Die Modellklasse der verallgemeinerten linearen Modelle besteht aus drei Komponenten:

η i = β 0 + x i 1 β 1 + x i 2 β 2 + + x i k β k = x i β {\displaystyle \eta _{i}=\beta _{0}+x_{i1}\beta _{1}+x_{i2}\beta _{2}+\dotsc +x_{ik}\beta _{k}=\mathbf {x} _{i}^{\top }{\boldsymbol {\beta }}} . Hier erkennt man, dass der lineare Prädiktor den Vektor der Regressionskoeffizienten β = ( β 0 β 1 , , β k ) {\displaystyle {\boldsymbol {\beta }}=\left(\beta _{0}\,\beta _{1},\dots ,\beta _{k}\right)^{\top }} in das Modell miteinführt.
  • Kopplungsfunktion: Für ein verallgemeinertes lineares Modell ist eine (oft nichtlineare) Kopplungsfunktion g ( ) {\displaystyle g(\cdot )} vorhanden, die die durch den linearen Prädiktor η i {\displaystyle \eta _{i}} beschriebene systematische Komponente und die durch den Erwartungswert μ = E ( Y i ) {\displaystyle \mu =\operatorname {E} (Y_{i})} der Antwortvariablen beschriebene stochastische Komponente der Verteilung von Y i {\displaystyle Y_{i}} koppelt: g ( μ ) = η i {\displaystyle g(\mu )=\eta _{i}} . Die Umkehrfunktion der Kopplungsfunktion, die sogenannte Antwortfunktion h ( ) {\displaystyle h(\cdot )} überführt die Linearkombination der erklärenden Variablen in den (bedingten) Erwartungswert μ = E ( Y i ) {\displaystyle \mu =\operatorname {E} (Y_{i})} : μ i = h ( η i ) {\displaystyle \mu _{i}=h(\eta _{i})} .

In die Modellklasse der verallgemeinerten lineare Modelle lassen sich einbetten die Normalverteilung, Binomial-Verteilung, Poisson-Verteilung, Gammaverteilung und die Inverse Normalverteilung, Bernoulli-Verteilung, Skalierte Poisson-Verteilung, Skalierte Binomial-Verteilung, Skalierte negative Binomial-Verteilung.

Die Verteilung einer Antwortvariablen Y i {\displaystyle Y_{i}} gehört zur eindimensionalen Exponentialfamilie, wenn sich die Dichtefunktion bzw. Wahrscheinlichkeitsfunktion in folgender Form schreiben lässt:

f ( y i θ i ) = exp ( y i θ i b ( θ i ) ϕ w i + c ( y i , ϕ , w i ) ) {\displaystyle f(y_{i}\mid \theta _{i})=\exp \left({\frac {y_{i}\theta _{i}-b(\theta _{i})}{\phi }}\cdot w_{i}+c(y_{i},\phi ,w_{i})\right)} .

Hierbei sind:

  • y i {\displaystyle y_{i}} die Beobachtungswerte der Antwortvariablen (bekannt)
  • w i {\displaystyle w_{i}} die spezifizierten Gewichte (bekannt)
  • b ( θ i ) {\displaystyle b(\theta _{i})} eine vorspezifizierte zweifach differenzierbare Funktion (bekannt)
  • θ i {\displaystyle \theta _{i}} der reellwertige Verteilungsparameter der Dichte; der sogenannte kanonische (natürliche) Parameter (unbekannt)
  • ϕ {\displaystyle \phi } ein vom Erwartungswert unabhängiger Skalenparameter (auch Streuungsparameter genannt), der für die Varianz relevant ist (bekannt)
  • und c ( y i , ϕ , w i ) {\displaystyle c(y_{i},\phi ,w_{i})} eine geeignete Funktion zur Normierung der Dichte (Normalisierungskonstante) und die nicht von θ i {\displaystyle \theta _{i}} abhängt (bekannt)

Für die Funktion b ( θ i ) {\displaystyle b(\theta _{i})} ist notwendig, dass f ( y i θ i ) {\displaystyle f(y_{i}\mid \theta _{i})} normalisiert werden kann und die erste b ( θ i ) = d b ( θ i ) d θ i {\displaystyle b^{\prime }(\theta _{i})={\frac {\mathrm {d} \,b(\theta _{i})}{\mathrm {d} \,\theta _{i}}}} und zweite Ableitung b ( θ i ) = d 2 b ( θ i ) d θ i 2 {\displaystyle b^{\prime \prime }(\theta _{i})={\frac {\mathrm {d} ^{2}\,b(\theta _{i})}{\mathrm {d} \,\theta _{i}^{2}}}} existiert. Die zweite Ableitung b ( θ i ) {\displaystyle b^{\prime \prime }(\theta _{i})} bestimmt neben dem Skalenparameter ϕ {\displaystyle \phi } die Varianz der Verteilung und wird daher als Varianzfunktion bezeichnet. Für alle Verteilungen der Exponentialfamilie gilt:

  1. E ( Y i ) = μ = b ( θ i ) {\displaystyle \operatorname {E} (Y_{i})=\mu =b^{\prime }(\theta _{i})}
  2. Var ( Y i ) = σ 2 = ϕ b ( θ i ) / w i {\displaystyle \operatorname {Var} (Y_{i})=\sigma ^{2}=\phi \cdot b^{\prime \prime }(\theta _{i})/w_{i}}

Der Parameter ϕ {\displaystyle \phi } ist nicht primär von Interesse und wird daher als Störparameter betrachtet. Beispiele für Verteilungen, die zur Exponentialfamilie gehören:

Verteilung
E ( Y i ) = μ {\displaystyle \operatorname {E} (Y_{i})=\mu }
Kanonischer Parameter
θ i {\displaystyle \theta _{i}}
Skalenparameter
ϕ {\displaystyle \phi }
vorspezifizierte Funktion
a ( ϕ ) {\displaystyle a(\phi )}
vorspezifizierte Funktion
b ( θ i ) {\displaystyle b(\theta _{i})}
Normalisierungskonstante
c ( y i , ϕ , w i ) {\displaystyle c(y_{i},\phi ,w_{i})}
Wahrscheinlichkeitsfunktion
f ( y i ) {\displaystyle f(y_{i})}
Normalverteilung μ {\displaystyle \mu } σ 2 {\displaystyle \sigma ^{2}} ϕ {\displaystyle \phi } θ i 2 2 {\displaystyle {\frac {\theta _{i}^{2}}{2}}} y i 2 2 ϕ log ( 2 π ϕ ) {\displaystyle {\frac {-y_{i}^{2}}{2\phi }}-\log \left({\sqrt {2\pi \phi }}\right)} 1 2 π σ 2 exp ( ( y i μ ) 2 2 σ 2 ) {\displaystyle {\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\exp \left(-{\frac {(y_{i}-\mu )^{2}}{2\sigma ^{2}}}\right)}
Bernoulli-Verteilung log ( μ 1 μ ) {\displaystyle \log \left({\frac {\mu }{1-\mu }}\right)} {\displaystyle -} 1 {\displaystyle 1} log ( 1 + e θ i ) {\displaystyle \log(1+e^{\theta _{i}})} 0 {\displaystyle 0} μ y i ( 1 μ ) 1 y i {\displaystyle \mu ^{y_{i}}(1-\mu )^{1-y_{i}}\,}
mit y i = 0 oder 1 {\displaystyle y_{i}=0{\text{ oder }}1}
Binomialverteilung log ( μ n μ ) {\displaystyle \log \left({\frac {\mu }{n-\mu }}\right)} {\displaystyle -} 1 {\displaystyle 1} n log ( 1 + e θ i ) {\displaystyle n\log(1+e^{\theta _{i}})} log ( n y i ) {\displaystyle \log {\binom {n}{y_{i}}}} ( n y i ) ( μ n ) y i ( 1 μ n ) n y i {\displaystyle {\binom {n}{y_{i}}}\left({\frac {\mu }{n}}\right)^{y_{i}}\left(1-{\frac {\mu }{n}}\right)^{n-y_{i}}\;}
mit y = 0 , 1 , , n {\displaystyle \;y=0,1,\ldots ,n}
Poisson-Verteilung log ( μ ) {\displaystyle \log(\mu )} {\displaystyle -} 1 {\displaystyle 1} exp ( θ i ) {\displaystyle \exp(\theta _{i})} log ( y i ! ) {\displaystyle -\log(y_{i}!)} μ y i y i ! exp ( μ ) {\displaystyle {\frac {\mu ^{y_{i}}}{y_{i}!}}\exp(-\mu )}
mit y i = 0 , 1 , {\displaystyle y_{i}=0,1,\ldots }
  • John Nelder, Peter McCullagh: Generalized Linear Models, Chapman and Hall/CRC Press, 2. Auflage 1989
  1. generalized linear model. Glossary of statistical terms. In: International Statistical Institute. 1. Juni 2011, abgerufen am 4. Juli 2020 (englisch).
  2. John Nelder, Robert Wedderburn: Generalized Linear Models. In: Journal of the Royal Statistical Society, Series A (General). 135, 1972, S. 370–384. doi:10.2307/2344614.
  3. Rencher, Alvin C., und G. Bruce Schaalje: Linear models in statistics., John Wiley & Sons, 2008., S. 513.
  4. Rencher, Alvin C., und G. Bruce Schaalje: Linear models in statistics., John Wiley & Sons, 2008., S. 514.
  5. Ludwig Fahrmeir, Thomas Kneib, Stefan Lang, Brian Marx: Regression: models, methods and applications. Springer Science & Business Media, 2013, ISBN 978-3-642-34332-2, S. 301.
  6. Torsten Becker, et al.: Stochastische Risikomodellierung und statistische Methoden. Springer Spektrum, 2016. S. 308.
  7. Ludwig Fahrmeir, Thomas Kneib, Stefan Lang, Brian Marx: Regression: models, methods and applications. Springer Science & Business Media, 2013, ISBN 978-3-642-34332-2, S. 301.
  8. Ludwig Fahrmeir, Thomas Kneib, Stefan Lang, Brian Marx: Regression: models, methods and applications. Springer Science & Business Media, 2013, ISBN 978-3-642-34332-2, S. 302.

Verallgemeinerte lineare Modelle Statistisches Modell Sprache Beobachten Bearbeiten Dieser Artikel behandelt eine Modellklasse die der Zielgrosse erlaubt eine andere Verteilung als die Normalverteilung anzunehmen Fur das verallgemeinerte Modell der Kleinste Quadrate Schatzung siehe Das verallgemeinerte lineare Regressionsmodell VLR Verallgemeinerte lineare Modelle 1 VLM auch generalisierte lineare Modelle GLM oder GLiM sind in der Statistik eine von John Nelder und Robert Wedderburn 1972 eingefuhrte wichtige Klasse von nichtlinearen Modellen die eine Verallgemeinerung des klassischen linearen Regressionsmodells in der Regressionsanalyse darstellt 2 Von spezieller Bedeutung ist die Verwendung einer nichtlinearen Kopplungsfunktion Wahrend man in klassischen linearen Modellen annimmt dass die Storgrosse die unbeobachtbare Zufallskomponente normalverteilt ist kann sie in GLMs eine Verteilung aus der Klasse der Exponentialfamilie besitzen Diese Verteilungsklasse beinhaltet neben der Normalverteilung auch die Binomial Poisson Gamma und inverse Gaussverteilung Damit bietet die Verwendung der Exponentialfamilie in verallgemeinerten linearen Modellen ein einheitliches Rahmenwerk fur diese Verteilungen Die grosse Klasse von vektorverallgemeinerten linearen Modellen englisch vector generalized linear models kurz VGLMs beinhaltet die Klasse der verallgemeinerten linearen Modelle als Spezialfall Ebenso in dieser grossen Modellklasse enthalten sind loglineare Modelle fur kategoriale Daten und das Modell der Poisson Regression fur Zahldaten 3 Um die Einschrankungen der verallgemeinerten linearen Modelle und verallgemeinerten additiven Modelle zu uberwinden wurden sogenannte Verallgemeinerte additive Modelle fur Lage Skalen und Formparameter entwickelt Inhaltsverzeichnis 1 Begriffsklarung 2 Modellkomponenten 3 Verteilungen aus der Familie der verallgemeinerten linearen Modelle 4 Exponentialfamilie 5 Literatur 6 EinzelnachweiseBegriffsklarung BearbeitenVerallgemeinerte lineare Modelle sind nicht mit dem allgemeinen linearen Modell zu verwechseln dessen naturliche englische Abkurzung ebenfalls GLM ist aber im Gegensatz zu verallgemeinerten linearen Modellen von der Voraussetzung einer normalverteilten Antwortvariablen ausgeht In vielen statistischen Programmpaketen werden da die Abkurzung GLM schon fur das allgemeine linearen Modell belegt ist zur besseren Unterscheidung andere Abkurzungen wie VLM bzw GLZ fur englisch GeneraLiZed linear models in STATISTICA oder GzLM fur englisch GeneraLiZed Linear Models in SPSS verwendet Manche Autoren verwenden zu besseren Unterscheidung statt der Abkurzung GLM die Abkurzung GLiM Ebenso sind verallgemeinerte lineare Modelle nicht mit dem verallgemeinerten linearen Regressionsmodell der verallgemeinerten Kleinste Quadrate Schatzung VKQ Schatzung zu verwechseln bei der jedoch eine verallgemeinerte Struktur bzgl der Storgrossen vorliegt Modellkomponenten BearbeitenDie Modellklasse der verallgemeinerten linearen Modelle besteht aus drei Komponenten Zufallskomponente Wie bei den klassischen linearen Modellen nimmt man unabhangige Zufallsvariablen Y 1 Y 2 Y n displaystyle Y 1 Y 2 ldots Y n mit Erwartungswert E Y i m i displaystyle operatorname E Y i mu i an die eine Dichtefunktion aus der Exponentialfamilie z B eine Binomial Poisson oder Gamma Verteilung besitzen Systematische Komponente Gegeben ist der Kovariablenvektor x i 1 x i 1 x i k k 1 1 displaystyle mathbf x i top 1 x i1 ldots x ik k 1 times 1 siehe Das klassische Modell der linearen Mehrfachregression der die Verteilung der Y i displaystyle Y i nur durch eine lineare Funktion beeinflusst Diese lineare Funktion heisst linearer Pradiktor und ist in der multiplen linearen Regression in folgender Form gegeben h i b 0 x i 1 b 1 x i 2 b 2 x i k b k x i b displaystyle eta i beta 0 x i1 beta 1 x i2 beta 2 dotsc x ik beta k mathbf x i top boldsymbol beta Hier erkennt man dass der lineare Pradiktor den Vektor der Regressionskoeffizienten b b 0 b 1 b k displaystyle boldsymbol beta left beta 0 beta 1 dots beta k right top in das Modell miteinfuhrt Kopplungsfunktion Fur ein verallgemeinertes lineares Modell ist eine oft nichtlineare 4 Kopplungsfunktion g displaystyle g cdot vorhanden die die durch den linearen Pradiktor h i displaystyle eta i beschriebene systematische Komponente und die durch den Erwartungswert m E Y i displaystyle mu operatorname E Y i der Antwortvariablen beschriebene stochastische Komponente der Verteilung von Y i displaystyle Y i koppelt g m h i displaystyle g mu eta i Die Umkehrfunktion der Kopplungsfunktion die sogenannte Antwortfunktion h displaystyle h cdot uberfuhrt die Linearkombination der erklarenden Variablen in den bedingten Erwartungswert m E Y i displaystyle mu operatorname E Y i m i h h i displaystyle mu i h eta i 5 Verteilungen aus der Familie der verallgemeinerten linearen Modelle BearbeitenIn die Modellklasse der verallgemeinerten lineare Modelle lassen sich einbetten die Normalverteilung Binomial Verteilung Poisson Verteilung Gammaverteilung und die Inverse Normalverteilung Bernoulli Verteilung Skalierte Poisson Verteilung Skalierte Binomial Verteilung Skalierte negative Binomial Verteilung 6 Exponentialfamilie BearbeitenDie Verteilung einer Antwortvariablen Y i displaystyle Y i gehort zur eindimensionalen Exponentialfamilie wenn sich die Dichtefunktion bzw Wahrscheinlichkeitsfunktion in folgender Form schreiben lasst 7 f y i 8 i exp y i 8 i b 8 i ϕ w i c y i ϕ w i displaystyle f y i mid theta i exp left frac y i theta i b theta i phi cdot w i c y i phi w i right Hierbei sind y i displaystyle y i die Beobachtungswerte der Antwortvariablen bekannt w i displaystyle w i die spezifizierten Gewichte bekannt b 8 i displaystyle b theta i eine vorspezifizierte zweifach differenzierbare Funktion bekannt 8 i displaystyle theta i der reellwertige Verteilungsparameter der Dichte der sogenannte kanonische naturliche Parameter unbekannt ϕ displaystyle phi ein vom Erwartungswert unabhangiger Skalenparameter auch Streuungsparameter genannt der fur die Varianz relevant ist bekannt und c y i ϕ w i displaystyle c y i phi w i eine geeignete Funktion zur Normierung der Dichte Normalisierungskonstante und die nicht von 8 i displaystyle theta i abhangt bekannt Fur die Funktion b 8 i displaystyle b theta i ist notwendig dass f y i 8 i displaystyle f y i mid theta i normalisiert werden kann und die erste b 8 i d b 8 i d 8 i displaystyle b prime theta i frac mathrm d b theta i mathrm d theta i und zweite Ableitung b 8 i d 2 b 8 i d 8 i 2 displaystyle b prime prime theta i frac mathrm d 2 b theta i mathrm d theta i 2 existiert Die zweite Ableitung b 8 i displaystyle b prime prime theta i bestimmt neben dem Skalenparameter ϕ displaystyle phi die Varianz der Verteilung und wird daher als Varianzfunktion bezeichnet Fur alle Verteilungen der Exponentialfamilie gilt 8 E Y i m b 8 i displaystyle operatorname E Y i mu b prime theta i Var Y i s 2 ϕ b 8 i w i displaystyle operatorname Var Y i sigma 2 phi cdot b prime prime theta i w i Der Parameter ϕ displaystyle phi ist nicht primar von Interesse und wird daher als Storparameter betrachtet Beispiele fur Verteilungen die zur Exponentialfamilie gehoren Verteilung E Y i m displaystyle operatorname E Y i mu Kanonischer Parameter 8 i displaystyle theta i Skalenparameter ϕ displaystyle phi vorspezifizierte Funktion a ϕ displaystyle a phi vorspezifizierte Funktion b 8 i displaystyle b theta i Normalisierungskonstante c y i ϕ w i displaystyle c y i phi w i Wahrscheinlichkeitsfunktion f y i displaystyle f y i Normalverteilung m displaystyle mu s 2 displaystyle sigma 2 ϕ displaystyle phi 8 i 2 2 displaystyle frac theta i 2 2 y i 2 2 ϕ log 2 p ϕ displaystyle frac y i 2 2 phi log left sqrt 2 pi phi right 1 2 p s 2 exp y i m 2 2 s 2 displaystyle frac 1 sqrt 2 pi sigma 2 exp left frac y i mu 2 2 sigma 2 right Bernoulli Verteilung log m 1 m displaystyle log left frac mu 1 mu right displaystyle 1 displaystyle 1 log 1 e 8 i displaystyle log 1 e theta i 0 displaystyle 0 m y i 1 m 1 y i displaystyle mu y i 1 mu 1 y i mit y i 0 oder 1 displaystyle y i 0 text oder 1 Binomialverteilung log m n m displaystyle log left frac mu n mu right displaystyle 1 displaystyle 1 n log 1 e 8 i displaystyle n log 1 e theta i log n y i displaystyle log binom n y i n y i m n y i 1 m n n y i displaystyle binom n y i left frac mu n right y i left 1 frac mu n right n y i mit y 0 1 n displaystyle y 0 1 ldots n Poisson Verteilung log m displaystyle log mu displaystyle 1 displaystyle 1 exp 8 i displaystyle exp theta i log y i displaystyle log y i m y i y i exp m displaystyle frac mu y i y i exp mu mit y i 0 1 displaystyle y i 0 1 ldots Literatur BearbeitenJohn Nelder Peter McCullagh Generalized Linear Models Chapman and Hall CRC Press 2 Auflage 1989Einzelnachweise Bearbeiten generalized linear model Glossary of statistical terms In International Statistical Institute 1 Juni 2011 abgerufen am 4 Juli 2020 englisch John Nelder Robert Wedderburn Generalized Linear Models In Journal of the Royal Statistical Society Series A General 135 1972 S 370 384 doi 10 2307 2344614 Rencher Alvin C und G Bruce Schaalje Linear models in statistics John Wiley amp Sons 2008 S 513 Rencher Alvin C und G Bruce Schaalje Linear models in statistics John Wiley amp Sons 2008 S 514 Ludwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 S 301 Torsten Becker et al Stochastische Risikomodellierung und statistische Methoden Springer Spektrum 2016 S 308 Ludwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 S 301 Ludwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 S 302 Abgerufen von https de wikipedia org w index php title Verallgemeinerte lineare Modelle amp oldid 222536417, wikipedia, wiki, deutsches, deutschland,

buch

, bücher, bibliothek,

artikel

, lesen, herunterladen, kostenlos, kostenloser herunterladen, MP3, Video, MP4, 3GP, JPG, JPEG, GIF, PNG, Bild, Musik, Lied, Film, Buch, Spiel, Spiele