Sample-Selection-Problem
Übersicht
zuletzt besuchte Definitionen...
Das Problem der endogenen Selektion kann sich einerseits aufgrund des Umfragedesigns ergeben, indem man die Stichprobe nur aus einer Teilpopulation der interessierenden Grundgesamtheit zieht. Bspw. werden bei einer Vermögensanalyse nur private Haushalte mit einem Vermögen von mehr als 100.000 Euro berücksichtigt. In diesem Fall spricht man vom gestutzten Regressionsmodell (engl. truncated regression), was nicht mit dem Tobit-Modell verwechselt werden sollte. Man hat hier im Gegensatz zum Tobit-Modell sowohl für die endogene als auch die exogenen Variablen in bestimmten Teilmengen keine Beobachtungen. Andererseits kann sich das Problem der endogenen Selektion durch das Verhalten der Untersuchungssubjekte ergeben. Bspw. hängt die Antwortbereitschaft der Individuen bei Umfragen in irgendeiner Weise von der persönlichen Ausprägung der endogenen Variablen ab.
Das Verhalten der Individuen kann auch zu komplexeren Formen der endogenen Selektion führen (Self-Selection oder Sample-Selection im engeren Sinne). Angenommen man will eine Lohngleichung für Frauen schätzen. Den Lohn kann man aber nur für diejenigen Frauen beobachten, die am Arbeitsmarkt partizipieren. Die Partizipationsentscheidung beruht wiederum auf einem nutzenmaximierenden Kalkül. Selbst wenn alle beobachteten Einflussfaktoren der Partizipationsentscheidung (Selektionsgleichung) strikt exogen in Bezug auf den Störterm der eigentlich interessierenden Beziehung (im Beispiel Lohngleichung) sind, kann es zum Problem der endogenen Selektion kommen, wenn die unbeobachteten Einflussfaktoren der Selektionsgleichung mit dem Störterm der eigentlich interessierenden Beziehung korreliert sind. In diesem Fall hängt die Beobachtbarkeit nicht von bestimmten Werten der endogenen Variablen selbst ab, sondern wird von den Ausprägungen einer anderen endogenen Variablen bestimmt. Manche Autoren bezeichnen diesen Spezialfall zur Abgrenzung von den anderen Fällen als Incidental-Truncation oder Self-Selection (Selbstselektion), da das Verhalten des Individuums die Beobachtbarkeit bestimmt. Heckman (1979) hat hierzu ein zweistufiges Schätz- und Testverfahren vorgeschlagen (Heckman-Zweistufen-Verfahren).