Orakel der Beliebigkeit
Drei Tage vor den Bundestagswahlen sind Politik und vor allem die schreibende Zunft anscheinend bereits bestens im Bilde, bei welcher Partei die Bürger ihr Kreuzchen machen werden. Das ifD Allensbach befand am Dienstag im Auftrag der FAZ, dass die CDU mit 35%, die SPD mit 24%, die Grünen mit 11%, die FDP mit 13,5%, die Linken mit 11,5% und die anderen Parteien mit 5% der Stimmen rechnen können. Eine gestern veröffentlichte Umfrage des Forsa-Instituts im Auftrag von Stern und RTL sieht die CDU ebenfalls bei 35%, die SPD bei 26%, die Grünen bei 11%, die FDP bei 13%, die Linken bei 10% und die Sonstigen bei 5%. Zahlen, die Genauigkeit vertäuschen, wo keine ist. Leider lassen sich selbst seriöse Blätter wie der Allensbach-Auftraggeber FAZ von diesem Orakel der Beliebigkeit faszinieren und unken bedeutungsschwanger, dass die Mehrheit von Schwarz-Gelb bröckeln würde. Was hätte die FAZ getitelt, wenn sie die Umfrageergebnisse seriös bewertet hätte?
Bei den berühmt-berüchtigten Sonntagsfragen werden zwischen 1.000 und 2.500 Bürger von freundlichen jungen Anrufern des Institutes XYZ am frühen Abend per Telefon befragt – nur das ifD Allensbach führt persönliche Interviews durch, die Stichprobengröße ist allerdings ebenfalls unzureichend. Auch die Demoskopen wissen, dass ihre Stichproben gar nicht repräsentativ sein können. Früher, als es klare Trennlinien zwischen den alttradierten Lagern gab, konnte man mit dieser Methodik noch ein halbwegs realistisches Abbild der Grundgesamtheit simulieren, heute ist dies schlichtweg unmöglich. Hätte beispielweise das ifD Allensbach 1.000 andere Bürger interviewt, so hätte es auch andere Zahlen bekommen. Die veröffentlichten Zahlen haben daher eine statistische Fehlermarge von 5% bei den großen Parteien und 3% bei den kleinen Parteien. Fehlermarge heißt in diesem Zusammenhang, dass das echte Ergebnis, das bei einer Befragung aller Bürger herauskäme, mit 95% Wahrscheinlichkeit innerhalb des Bereiches von plus bzw. minus fünf Prozentpunkten liegt.
Die Zahlen des ifD Allensbach würden also bei seriöser Interpretation folgendes aussagen – die CDU wird am Sonntag zwischen 30 und 40% der Stimmen bekommen, die SPD zwischen 19 und 29%, die Grünen zwischen 8 und 14%, die FDP zwischen 10,5 und 16,5%, die Linken zwischen 8,5 und 14,5% und die Sonstigen zwischen 3 und 8%. Eine Vorbedingung für diese Aussage wäre jedoch, dass die Zahlen nicht von Allensbach gewichtet, spricht manipuliert, wurden – und das ist kaum wahrscheinlich. Wäre der Auftraggeber FAZ seriös, hätte er titeln können – „Schwarz-Gelb wird wahrscheinlich am Sonntag zwischen 40,5% und 56,5% der Stimmen bekommen – ob dies für eine Mehrheit reicht, wissen wir auch nicht“. Natürlich können wir Leser noch ewig auf eine solche Überschrift warten, die zwar denkbar belanglos aber ehrlich ist. Stattdessen gaukeln Demoskopen und Medien dem Volk und der Politik immer wieder Phantasiezahlen vor, die sich am Wahlsonntag als Fehlprognosen herausstellen. Aus diesen Fehlern lernen wollen die Medien jedoch nicht. Um das System „Demoskopie“ zu verstehen, lohnt es sich, einen Blick hinter die Kulissen zu werfen.
Zu Beginn des letzen Jahrhunderts gab es so etwas wie Demoskopie noch gar nicht. Als legendärer Erfinder der modernen Demoskopie gilt George Horace Gallup, der 1936 unvergänglichen Ruhm erlangte, als er der einzige Meinungsforscher war, der Roosevelts Sieg bei den Präsidentschaftswahlen voraussagte. Gallups Idee war eben so einfach wie genial – anstatt auf der Strasse willkürlich Menschen zu befragen, suchte er sich Stichprobengruppen heraus, die in etwa dem gesellschaftlichen Querschnitt entsprachen. Zum ersten Mal befragte ein Meinungsforscher auch Schwarze oder sozial Schwache – die Gruppen, die 1936 überproportional für Roosevelt stimmen sollten. In Gallups legendärem Erfolg steckte jedoch bereits das Grundübel moderner Demoskopie – er sagte zwar Roosevelts Sieg korrekt voraus, lag aber um 6,8% daneben. 1948 sagte er fälschlicherweise einen Sieg von Dewey gegen Truman voraus, 1960 war er bereits klüger und enthielt sich einer Prognose im äußerst knappen Duell zwischen Kennedy und Nixon. Gallup ist somit repräsentativ für das System der modernen Demoskopie – mal liegt man richtig, mal liegt man falsch, nur enthalten will und kann sich heute niemand mehr.
Ein grundsätzliches Problem der Demoskopie ist die Wahl der Stichprobe. Selbst wann man in einem Lotterieverfahren 1.000 Bürger aus der Gesamtbevölkerung auswählen könnte, so wäre diese Gruppe nie repräsentativ, zu individuell und zu verschieden ist unsere Gesellschaft. In der Demoskopie werden jedoch nicht 1.000 Bürger aus der Gesamtbevölkerung ausgewählt, es werden 1.000 Interviewpartner befragt – der Unterschied mag sich zwar unbedeutend anhören, ist dies aber keinesfalls. Um in den Genuss zu kommen, als Teil einer Stichprobe an einer Sonntagsfrage teilzunehmen, muss man folgende Vorraussetzungen erfüllen:
- man hat einen Festnetzanschluss und ist wochentags zwischen 18.00 und 21.00 daheim
- man geht ans Telefon, wenn zu dieser Zeit ein Anrufer mit unbekannter Nummer anruft
- man ist zufällig das Familienmitglied, das wahlweise als letztes oder als nächstes Geburtstag hat und über 18 Jahre alt ist (mit dieser Vorauswahl will man eine Verzerrung verhindern, da in Familien oft ein bestimmtes Familienmitglied den Telefonhörer abnimmt)
- man lässt sich nicht nur auf die Sonntagsfrage, sondern auch auf ein bis zu 50 Minuten langes Interview ein, in dem vor allem nach Kaufentscheidungen und Erfahrungen mit Konsumprodukten gefragt wird*
- man lässt sich auch dadurch nicht abschrecken, dass der Interviewer nicht flexibel und kooperativ sein darf, sondern darauf bestehen muss, seine Antwortvorgaben jedes mal in voller Länge vorzutragen (sind sie mit dem Waschmittel XZY sehr zufrieden, zufrieden, unzufrieden, sehr unzufrieden oder kennen sie das Waschmittel XZY nicht)
- man beantwortet zum Schluss auch persönliche Fragen, wie die nach dem Nettohaushaltseinkommen, ohne brüskiert aufzulegen
Nur wenn man diese Eigenschaften erfüllt, wird man erfolgreicher Teil der Sonntagsfrage. Ganze Bevölkerungsgruppen gehören daher gar nicht zu den potentiell Befragten. Wer beispielsweise nur ein Handy oder einen VOIP-Anschluss hat, fällt bereits aus dem Raster. Wer abends entweder arbeitet oder seinem Hobby nachgeht, ebenfalls. Wer abends Besseres zu tun hat, als mit Call-Centern zu sprechen und entweder gar nicht den Hörer abnimmt oder ein Interview ablehnt, wird ebenfalls nicht erfasst. Meine jahrelange Erfahrung als Interviewer und Supervisor in einem Call-Center des Emnid-Instituts hat bei mir folgenden Eindruck hinterlassen:
- die Personen, deren Antworten verarbeitet wurden, waren meist erheblich älter als der Durchschnitt – junge Menschen sind abends oft nicht daheim, haben keinen Festnetzanschluss, sehr alte Personen sind oft schwerhörig, misstrauisch oder leben bereits im Altenheim
- die interviewten Personen haben meist eine durchschnittliche Bildung. Ungebildete Menschen verstehen oft gar nicht, was man von ihnen will, vermuten ein Verkaufsinteresse oder haben nicht die Disziplin, einen ganzen Fragebogen mit komplexeren Fragen durchzuhalten. Gebildete Menschen erkennen häufiger, dass man nicht nur an ihrer politischen Meinung interessiert ist, sondern sie auch im Auftrag von Unternehmen nach ihrem Kaufverhalten aushorcht und lehnen dies kategorisch ab
- die interviewten Personen haben oft ein geringes Selbstvertrauen, sind es gewohnt, Anweisungen zu befolgen und wagen oft nicht zu widersprechen. Selbstbewusste „Führungsnaturen“ oder aufgeklärte Individualisten weigern sich oft, dem monotonen Fragebogen zu folgen oder geben klare Zeit- und Zielvorgaben für das Interview, die der Interviewer nicht einhalten kann
Alleine der charakterliche Querschnitt der Zielpersonen ist daher nicht repräsentativ für die Grundgesamtheit. Wähler bestimmter Parteien fallen häufiger aus dem Raster, als Wähler anderer Parteien. Während die treuherzige bürgerliche Hausfrau sicherlich alle Fragen beantwortet, auch wenn sie eigentlich schon längst zum Kegelabend wollte, wird der unangepasste Jungakademiker sich noch nicht einmal auf ein solches Interview einlassen. Es kann daher auch kaum verwundern, dass die CDU bei Sonntagsfragen fast immer stärker abschneidet als an den Wahlurnen.
Die Demoskopen wissen jedoch, dass sie mit ihren Rohdaten eigentlich gar nichts anfangen können. Daher hat jedes Institut einen eigenen Anpassungs-Algorithmus, der so geheim gehalten wird wie das Rezept von Coca Cola. Wichtigstes Element dieser Zahlenmassage ist die Recall-Frage – „was haben sie bei der letzten Bundestagswahl gewählt“. Anhand der Auskunft auf diese Frage kann man einschätzen, ob die Stichprobe wirklich relativ repräsentativ ist, oder ob man die Rohdaten ein wenig beherzter verbiegen muss. Auch die demographischen Merkmale Alter, Geschlecht, Berufsstand und Haushaltseinkommen helfen, die Rohdaten zielorientierter anzupassen. Problem ist lediglich – die Leute sagen nicht immer die Wahrheit. Nach den sachsen-anhaltinischen Landtagswahlen 1998, bei denen die DVU auf 12,9% kam, beantworteten in den Umfragen der nächsten Jahre meist nur ein Prozent der Befragten die Recall-Frage mit DVU. Ähnlich gering war die Zahl der bekennenden DVU-Wähler vor und nach den Wahlen – nur im Wahllokal sah dies anders aus. Liegen die DVU-Wähler abends bereits betrunken unter dem Sofa? Nicht nur, sie genieren sich allerdings im Gespräch mit einem jungen freundlichen Interviewer zuzugeben, dass sie zu den gesellschaftlich isolierten Naziwähler gehören. Aber das ist noch nicht alles. Frauen geben häufiger an, sie seien jünger als sie eigentlich sind, Männer schrauben ihr Gehalt schon mal gerne nach oben, arbeitslos ist kaum jemand und alle haben einen höheren Schulabschluss – der arbeitslose Schulabbrecher, der rechtsextrem wählt, ist in der real existierenden Welt der Demoskopie nur extrem selten anzutreffen.
Selbst wenn die Demoskopen es schaffen würden, von einem möglichst repräsentativen Querschnitt der Bevölkerung ehrliche Antworten zu bekommen, so wäre ihr Ergebnis dennoch kaum aussagekräftig. Unentschlossene werden bei der Sonntagsfrage nämlich entweder gar nicht erfasst oder zu einer Antwort genötigt, die oft nicht der Wahlentscheidung entspricht. Angeblich weiß rund ein Drittel der Bevölkerung noch nicht, ob und wenn doch, dann wen sie wählen wird. So wird eine Person, die zwar auf die Sonntagsfrage spontan SPD antwortet, aber noch gar nicht weiß, ob sie überhaupt zur Wahl geht, als SPD-Wähler gewertet. Eine andere Person, die die Sonntagsfrage nicht beantworten kann oder will und am Sonntag die Linken wählt, taucht in der Prognose gar nicht auf. Besonders unglücklich sind Interviewer, wenn sich am Ende einer 45minütigen Befragung herausstellt, dass die Dame, deren Stimme doch schon so erwachsen klang, erst 17 Jahre alt ist und gar nicht wählen darf. Fast jeder Interviewer, der ja nach Erfolgshonorar bezahlt wird, macht sein Kreuz in einem solchen Fall bei der Kategorie 18 bis 25 Jahre. Wenn die Qualitätskontrolle bei diesem Kunstgriff jedoch mitgehört hat, darf er sich schon mal eine gute Ausrede überlegen.
Nicht jedoch die Interviewer, sondern die obersten Demoskopen der Republik sind dafür verantwortlich, dass ihre Umfragen kaum einen echten Informationswert haben. Frau Noelle-Neumann, die Grand Old Dame der Demoskopie und Gründerin des ifD Allensbach, gab einmal ganz offen zu, dass zwischen den Rohdaten und ihrer Prognose manchmal eine Differenz von zehn oder elf Prozentpunkten liegt. Renate Köcher, neben Noelle-Neumann Geschäftsführerin bei Allensbach, wiederum gestand den Medien, dass sie 1996 im Vorfeld der Landtagswahlen in Baden-Württemberg die Umfragewerte der Republikaner absichtlich unter die 5% Marke gedrückt hat, um zu verhindern, dass die guten Umfragewerte dieser antidemokratischen Partei einen zusätzlichen Aufschwung geben – es half nichts, die Republikaner zogen mit einem Ergebnis von 9,1% in den Landtag ein. Mag das Motiv auch noch so ehrenhaft sein, die Intransparenz der Methoden und die teils offene Nähe der Institute zu bestimmten Parteien sind ein Einfallstor für absichtliche Manipulationen jeglicher Art.
Dabei ist die Gefahr einer Manipulation keine Bagatelle, sondern höchst gefährlich für die Demokratie. Der Politik fehlt es an Rückkanälen zum Wähler, anhand von Umfragewerten wird von den Medien und der Politik eine politische Erfolgsbilanz geführt, die gar keine ist. Wäre Kurt Beck als SPD-Vorsitzender zurückgetreten, wenn die Institute keinen Absturz seiner Partei in der Wählergunst orakelt hätten? Hätte Peter Harry Carstensen die Große Koalition in Schleswig-Holstein aufgekündigt, wenn ihm die Institute keinen CDU-Hype bescheinigt hätten? Entweder stutzen die Medien die Demoskopie auf die Kaffeesatzleserei zurück, die sie eigentlich ist, oder es müssen Regeln gefunden werden, die die Methodik der Demoskopen endlich transparent und damit manipulationssicher machen. Die Demoskopie hat eine zu wichtige Rolle eingenommen, als dass man sie nach eigenen Regeln arbeiten lassen könnte. Bei welcher Partei der Wähler am Sonntag sein Kreuz machen wird, ist daher immer noch komplett offen. Ich wage es einmal, mich mit den Instituten zu messen. Ich sage der Union 30%, der SPD 27,5%, den Grünen 13,5%, der FDP 16% und der Linken ebenfalls 16% voraus, 3% werden die rechtsextremen Parteien bekommen, 2,5% die Piraten und 1,5% bleiben für den Rest übrig – durch Überhangmandate wird Schwarz-Gelb jedoch die Regierung bilden.
P.s.: Der Spiegelfechter wird am Wahlsonntag einen Offenen Thread anbieten, in dem die Leser (und ich selbst) live die Wahl diskutieren können.
P.p.s.: Wer sich einmal ein Bild von der Fehleranfälligkeit demoskopischer Umfragen machen will, dem sei das nette Simulationsgadget vom Statistiker Fritz Ulmer empfohlen.
* Der Autor hat sein Studium zum Teil durch einen Job beim Emnid-Institut finanziert und beschreibt seine persönlichen Eindrücke und Erfahrungen ohne Anspruch auf allgemeine Gültigkeit.
Jens Berger
![]()
© Spiegelfechter for Der Spiegelfechter, 2009. |
Permalink |
No comment |
Add to
del.icio.us
Post tags:
Feed enhanced by Better Feed from Ozh
Kommentar hinzufügen