Willkommen im Faktor-Zoo!

Wie Statistiken Investoren verwirren können. Eine Checkliste für Anleger, die Formeln nicht mit der realen Welt verwechseln.

Paul D. Kaplan 17.04.2018

Mark Twain hat einst Benjamin Disraeli trefflich zitiert: "Es gibt drei Arten von Lügen: Lügen, verdammte Lügen und Statistiken." Dieses Zitat hat besonders hohe Relevanz in der Welt des Investierens, in der wir uns stark auf statistische Analysen stützen, um die Vorzüge von Anlagestrategien und -produkten zu bewerten.

Korrelation nicht mit Kausalität gleichsetzen

Eine Statistik, die besonders häufig in die Irre führt, ist die Korrelation. Das fängt schon mit der Definition an. Wie oft haben wir gehört, dass die Korrelation die Tendenz misst, dass sich zwei Variablen gemeinsam auf und ab bewegen? Das ist nicht ganz richtig. Was die Korrelation tatsächlich misst, ist der Grad, in dem zwei Variablen (die sich dabei jeweils jenseits ihrer Durchschnittswerte bewegen), statistisch zusammenhängen.

Der andere, wirklich große Fehler, der oft mit Blick auf die Korrelation gemacht wird, ist, die Kausalität ins Spiel zu bringen. Da zwei Variablen statistisch zusammenhängen, gelangen wir allzu leicht zum Schluss, dass es einen kausalen Zusammenhang zwischen ihnen gibt. Aber Korrelation und Kausalität sind zwei sehr unterschiedliche Dinge.

Der Akademiker David Leinweber illustrierte diesen Punkt Mitte der 1990er Jahre auf sehr schöne Art und Weise. Er zeigte, dass es eine sehr hohe Korrelation zwischen der Performance des Aktienindex S&P 500 und der jährlichen Butterproduktion in Bangladesch gab. Der Autor stellte fest, dass die Korrelation für den Zeitraum 1981 bis 1993 etwa 87 Prozent betrug.

Nun machte ich mich ans Werk, um herauszufinden, ob sich eine ähnliche Korrelation für den kanadischen Index S&P/TSX Composite (Ihr Morningstar-Analyst arbeitet nun einmal in Toronto) in jüngeren Zeiträumen finden könnte. Es dauerte nicht lange, bis ich herausfand, dass der kanadische Aktienmarkt ganz klar mit der Butterproduktion Brasiliens zwischen 1994 und 2017 korreliert.

Die untere Illustration zeigt die Performance des S&P/TSX Composite für jedes Jahr als roten Kreis, die ich auch als blaue Linie gezeichnet habe, wie sie durch die jährliche Butterproduktion in Brasilien vorhergesagt wird. Die beiden Variablen scheinen tatsächlich stark verwandt zu sein: Wie in Leinwebers Beispiel liegt die Korrelation bei etwa 87 Prozent.

Grafik: Wie die Butterproduktion den kanadischen Aktienmarkt treibt

 

Wenn Sie dem Trick auf die Schliche kommen möchten, gebe ich Ihnen einen Tipp: Sie müssen Trendvariablen verwenden. Sie können den Zusammenhang zwischen beliebige Variablen über beliebige Zeiträume hinweg „beweisen“, so lange die Variablen nach oben tendieren, so, wie es im oberen Beispiel beim Börsenindex und der Butterproduktion der Fall ist. Sie sind positiv korreliert, auch wenn es keinen kausalen Zusammenhang zwischen ihnen gibt.

Um diesen Unfug zu entlarven, müssen sie bei derartigen Trendvariablen nur die Trends entfernen. Etwa indem Sie beim oberen Beispiel den prozentualen Veränderungsgrad jeder der beiden Variablen zu verwenden statt der Trendlinie. Ich habe die jährlichen Veränderungsraten dieser beiden Variablen in die zweite Grafik unten eingetragen und bingo: Jetzt erhalten wir das erwartete Ergebnis von einer unbedeutenden Korrelation von nur rund fünf Prozent.

Grafik: Butterproduktion und Aktienmarkt haben nichts miteinander zu tun!

Aber selbst wenn wir zwei Variablen richtig konstruiert hätten, wäre es immer noch nicht zwingend, von einer Korrelation auf die Kausalität zu schließen. Den auch wenn „A“ und „B“ korreliert sind, könnte es sein, dass es eine dritte „C“-Variable gibt, die sich auf beide bezieht, und die wir gegebenenfalls nicht auf dem Radar hatten.

Wenn man versucht, eine Ursache zu finden, muss man auf ökonomische Überlegungen achten, nicht nur auf statistische Zusammenhänge. Dies ist besonders wichtig bei der Bewertung quantitativer Anlagestrategien, insbesondere derjenigen, die hinter neuen Strategic Beta ETFs stehen. Nebst der sicher schön aufbereiteten Statistik der ETF-Anbieter müssen Anleger nach kausalen Erklärungen suchen!

Den Back-Test immer im Blick behalten

Die Korrelation ist nicht das einzige Maß, das statistische Signifikanz mit Kausalität verwechselt. Ein gängiges statistisches Verfahren in der Vermögensverwaltung ist das so genannte Backtesting. Back-Tests werden unternommen, da die Dauer der Live-Performance eines Fonds oft sehr begrenzt ist bzw. der Fonds nicht existierte, als die Strategie entwickelt wurde. Die Idee ist, dass eine Strategie, die im Test gut funktionierte, auch in Echtzeit gut funktionieren sollte.

Dies ist aber nur dann der Fall, wenn es kausale Zusammenhänge zwischen dem gibt, was die Strategie zu jedem Zeitpunkt tut, und ihrer späteren Performance. Es muss eine ökonomische Begründung für die Strategie geben, bevor sie getestet wird. Es gibt mehrere Punkte, die bei der Bewertung eines Backtestes berücksichtigt werden sollten, insbesondere bei einer faktorbasierten Strategie:

Positive Ergebnis-Bias

Wie mein Kollege Ben Johnson sagt: "Es gibt schlicht und ergreifend keinen Back-Test, der schlechte Ergebnisse hervorbringt." Wenn wir mit beeindruckenden Back-Test-Ergebnissen konfrontiert werden, wissen wir nicht, wie viele andere Strategien oder Faktoren ausprobiert wurden, die nicht gut ausgefallen sind.

Willkommen im Zoo der Faktoren!

Es gibt so viele Faktoren, dass John Cochrane von der University of Chicago den Begriff "Zoo der Faktoren" geprägt hat. Angesichts dieses Zoos von Hunderten von Faktoren konnte jedermann mit dem richtigen Datensatz, einem Computer und einigen Programmierkenntnissen eine beliebige Anzahl von faktorbasierten Strategien in kurzer Zeit testen und nur die günstigen Ergebnisse melden. Wie der verstorbene Nobelpreisträger Ronald H. Coase eins sagte: "Wenn Sie die Daten lange genug quälen, werden sie alles gestehen."

Simulationen statt Realität

Der Zweck eines Backtestes ist es, zu sehen, wie eine Strategie in der Vergangenheit funktioniert hätte. Aber wir können nie sicher sein, wie sie wirklich performt hätte. Einige Back-Tests versuchen, realistischere Ergebnisse zu erzielen als andere, etwa indem sie Annahmen zu Handelskosten einbeziehen, aber davon gibt es nicht viele. Aber egal, welche Annahmen getroffen werden, ein Backtest ist eine Simulation und keine Abbildung historischer Tatsachen.

Keine kontrollierten Experimente

In den „harten“ Wissenschaften besteht die empirische Arbeit hauptsächlich darin, kontrollierte Experimente durchzuführen, bei denen die Auswirkungen anderer Faktoren als der untersuchten Variable minimiert oder eliminiert werden. Leider können Ökonomen in der Regel keine kontrollierten Experimente durchführen. Stattdessen wird eine statistische Analyse der historischen Daten durchgeführt, wobei davon ausgegangen wird, dass die zugrunde liegenden Prozesse, die die Daten generieren, im Laufe der Zeit gleich geblieben sind. Backtesting ist ein Beispiel für eine solche statische Analyse.

Vorsicht: Statistik!

Es ist allzu einfach, unsinnige Statistiken zu berechnen, wie zum Beispiel die Korrelation zwischen einem Börsenindex und der Butterproduktion. Darüber hinaus kann die statistische Analyse in Ermangelung einer ökonomischen Analyse dazu missbraucht werden, fast alles zu demonstrieren, was demonstriert werden soll. Back-Tests, die keinen Bezug zur ökonomischen Vernunft haben, sind so ein Beispiel.

Schließlich kann die Verwendung von richtig konstruierten Statistiken auch zu falschen Schlussfolgerungen führen, wenn andere relevante Fakten außenvorgelassen werden. Ein Beispiel hierfür ist, einem Anleger, dem es an Geduld mangelt, einen Aktienfonds zu empfehlen. Man kann sicher sein, dass dieser Anleger bei der ersten schwachen Marktphase vorzeitig das Handtuch werfen werden wird und den Fonds verkauft. Indem wir den Realitäten der Wirtschaft und der Anleger besondere Aufmerksamkeit schenken, können wir verhindern, dass uns Statistiken ein Schnippchen schlagen.

Über den Autor

Paul D. Kaplan