FFB-Diskussionspapier Nr. 10

Microdata Adjustment by the Minimum Information Loss Principle

 

Zusammenfassung

Mikrodaten sind von zunehmender Bedeutung für wirtschafts- und sozialpolitische Analysen. Ein besonderes Problem für fast alle praktischen Analysen mit Mikrodaten überhaupt, seien es zu analysierende Mikrodaten als singuläre Querschnitts- oder Längsschnitt-Stichproben oder im Bereich der statischen Mikrosimulation zur Aktualisierung und Fortschreibung der Situation sozioökonomischer Gruppen, ist es, repräsentative Ergebnisse zu erhalten.In dieser Studie wird eine konsistente Lösung der Hochrechnung von Mikrodaten - repräsentative Mikrodaten durch eine entsprechende (Um-)Gewichtung der Mikrodaten zu gewinnen - basierend auf dem Prinzip des minimalen Informationsverlustes (MIL) vorgestellt. Auf informationstheoretischer Basis sichert das MIL-Prinzip vor allem die gewünschte Positivitätsbedingung der zu berechnenden Gewichtungsfaktoren. Für die konsistente Lösung des Hochrechnungsproblems, die simultan hierarchische Mikrodaten (bspw. Haushalt- und Personeninformationen im Haushalts- / Familienrahmen) anpaßt, wird eine relativ schnelle numerische Lösung mit einer spezifischen Newton-Raphson (MN) Prozedur bei globaler exponentieller Approximation vorgeschlagen.Praktische Erfahrungen mit großen Mikrodatenfiles mit mehr als 60.000 Haushalten und 240 simultan zu erreichende Restriktionen innerhalb des Sfb 3 Mikrosimulationsmodells zeigen, daß diese MN-Prozedur denRechenaufwand um 75% reduzieren konnte. Das verfügbare effiziente PC-Computerprogramm ADJUST wurde erfolgreich auch in einer Mikrosimulationsanalyse von Wirkungen der deutschen Steuerreform 1990 auf markt- und nichtmarktmäßige Arbeitsangebot in der formellen und informellem Ökonomie sowie in einer neueren Mikrosimulationsanalyse zu Determinanten erfolgreicher Firmen in der deutschen Maschinenbauindustrie angewendet.Schlagwörter: Hochrechnung von Mikrodaten, Mikroanalysen, Statische Mikrosimulation, Minimaler Informationsverlust, Modifizierter Newton-Raphson Algorithmus, PC-Programmpaket ADJUST


Download

Summary

Microdata have become increasingly important for economic and social analyses. One striking problem with almost any practical analysis of microdata, microdata as a singular cross or longitudinal sample or within (static) microsimulation, is to achieve representative results.
In this study a consistent solution of the microdata adjustment problem - that is to achieve representative results by re-weighting microdata to fit aggregate control data - is presented based on the Minimum Information Loss (MIL) principle. Based on information theory this principle satisfies the desired positivity constraint on the weighting factors to be computed. For the consistent solution which simultaneously adjusts hierarchical microdata (e.g. household and personal information), a fast numerical solution by a specific modified Newton-Raphson (MN) procedure with a global exponential approximation is proposed.
Practical experiences for large microdata sets in a pension reform analysis with e.g. more than 60.000 households and 240 restrictions simultaneously to be achieved within the Sfb 3 microsimulation model show that this MN procedure was able to rather largely reduce the computional expenses by 75%. The available efficient PC-computer program ADJUST is also succesfully applied in a described microsimulation analyses of the recent 1990 German tax reform investigating the impacts on market and non-market labour supply within the formal and informal economy, and in a recent firm microsimulation analysis on explaining factors of successful firms in the German engineering industry.

Keywords: Microdata Adjustment, Microanalyses, Microsimulation, Minimum Information Loss, Modified Newton-Raphson Algorithm, PC program package ADJUST

 

Download