Mensch trifft Maschine: Die quantitativen Morningstar Ratings

Mit den Morningstar Analyst Ratings bewerten wir Fonds bereits seit sieben Jahren qualitativ. Um das Universum der bewerteten Fonds zu vergrössern, haben wir die Analyst Ratings mit einem Machine-Learning-Algorithmus repliziert. Eine Einführung.

Morningstar 13.11.2018

Die Analyse von Investmentfonds ist ein Bestandteil der DNA von Morningstar. Wie kein anderes unserer Rating-Systeme steht dafür das Morningstar Analyst Rating. Es wird von unseren Fondsanalysten verfasst und hat den Anspruch, Anlegern einen qualitativen Einblick in die wichtigsten Eigenschaften eines Fonds zu geben. Morningstar verfügt mit mehr als 100 Analysten über eines der grössten unabhängigen Manager-Research-Teams weltweit, die mehr als 3.700 Fonds prüfen. Das Analyst Rating bietet eine zukunftsorientierte Bewertung, wie sich Fonds in verschiedenen Marktumfeldern verhalten könnten und hilft Investoren bei der Auswahl überlegener Fonds. Es basiert auf der Überzeugung eines Analysten, dass ein Fonds in der Lage ist, seine Peer Group und/oder eine relevante Benchmark risikoadjustiert über einen gesamten Marktzyklus von mindestens fünf Jahren zu übertreffen. 

Den Hebel angesetzt: Das Morningstar Quantitative Rating™ for Funds 

Die Sache hat allerdings einen Haken. Wegen des hohen Aufwands des Rating-Prozesses ist die Anzahl der Fonds, die ein Analyst Rating halten, begrenzt. Um die Anzahl der analysierten Fonds zu erweitern, haben wir deshalb ein quantitatives Modell entwickelt, das die Entscheidungsprozesse unserer Analysten repliziert. Bei der Entwicklung wurden ihre bisherigen Rating-Entscheidungen und die zur Unterstützung dieser Entscheidungen verwendeten Daten genutzt. Das Ergebnis des Machine-Learning-Modells ist das Morningstar Quantitative Rating for Funds (MQR). Es wird ausschliesslich bei Fonds angewendet, die kein qualitatives Morningstar Analyst Rating halten. Es drückt eine Bewertung aus, die ein Morningstar-Analyst dem Fonds zuweisen könnte, wenn er den Fonds analysieren würde. Mit diesem neuen Ansatz können wir fast sechsmal so viele Fonds analysieren, wie es bisher möglich war. 

Für das quantitative Rating kommen nur Publikumsfonds (inklusive ETFs) in Frage, die derzeit kein Analyst Rating halten und die sich in einer Kategorie befinden, in der Analyst Ratings vergeben werden. Im Folgenden wollen wir das MQR, das monatlich berechnet wird, näher erläutern. 

Die Philosophie hinter dem Morningstar Quantitative Rating™ for Funds 

Zu Beginn standen uns zwei Wege offen, um unsere Analyst Ratings quantitativ zu erweitern: Wir hätten entweder den Denkungsprozess des Analysten replizieren können, ohne auf die Frage Rücksicht zu nehmen, ob die Output-Ergebnisse in Einklang mit den Research Ergebnissen unserer Fondsanalysten stehen würden. Als Alternative stand der Versuch, den Analysten-Output so genau wie möglich zu replizieren, ohne Rücksicht auf den Research-Prozess als solchen zu nehmen. Weil der Versuch, einen gedanklichen Analyseprozess mechanisch zu automatisieren, eine enorme Komplexität mit sich gebracht hätte, haben wir uns entschieden, ein Modell zu entwickeln, das die Ergebnisse des Analyseprozesses so genau wie möglich wiedergibt. 

Das Analyst Rating zu replizieren, war wünschenswert, da die Empfehlungen unserer Analysten für Investoren einen Mehrwert darstellen. Wir haben zuletzt Ende 2017 die Performance des Morningstar Analyst Ratings überprüft und sind von den Ergebnissen ermutigt. Daher schien es von Anfang an plausibel, dass auch eine synthetische Replikation der Entscheidungsprozesse unserer Analysten wertvolle Ergebnisse liefern kann. Dass uns dies mit dem MQR gelungen ist, wollen wir weiter unten darlegen. Doch der Reihe nach. Halten wir zunächst die Vorteile unseres MQR fest. Es liefert nicht nur eine Abdeckung des weltweiten Fondsuniversums. Es wird zudem auch monatlich aktualisiert. Eine derartig hohe Frequenz zu erreichen, wäre in dem aufwendigen händischen Analyseprozess nicht möglich. 

Die Methodik der quantitativen Bewertung im Überblick 

Das MQR besteht aus einer Serie von elf Einzelmodellen, die so zusammenwirken, dass eine bestmögliche Annäherung an das Analyst Rating möglich ist. Visuell kann man sich dieses Verfahren als einen zweistufigen Prozess vorstellen. Zuerst schätzen wir die fünf Pillar-Ratings (Pillar ist englisch für Säule) für jeden Fonds einzeln. Die Pillar-Ratings sind die Grundlagen der Analyst Ratings. Hier geht es um die Analyse des Anbieters (Parent), des Fondsmanagers (People), der Performance-Konsistenz (Performance), der Fondskosten (Price) und des Investmentprozesses (Process). Danach wird das Gesamt-Rating ermittelt. 

Um die fünf Einzelbewertungen zu ermitteln, haben wir einen maschinellen Lernalgorithmus gewählt, der auch als "Random Forest" bekannt ist. Er ermöglicht es, eine Beziehung zwischen den Bewertungen gemäss der fünf Pillars und der tatsächlichen Fonds-Attribute herzustellen. Um auf der Ebene der fünf Säulen zu einem Rating zu kommen, wurden Daten zu den Fonds erhoben, die von unseren Analysten derzeit geprüft werden. Es wurden insgesamt mehr als 180 Attribute und mehr als 10.000 Rating-Updates berücksichtigt, um das Machine Learning Modell zu trainieren. Nach zahlreichen Iterationen wurden nur die für die Klassifizierung der einzelnen Säulen wichtigsten Attribute beibehalten. 

Für jede Säule wurden zwei Random Forest-Modelle geschätzt, die darauf abzielen, die Wahrscheinlichkeit zu bestimmen, dass der Fonds in dieser Säule ein positives oder ein negatives Rating erhält. Jedes Modell spuckt einen Wahrscheinlichkeitswert aus, ob eine Säule positiv oder negativ bewertet wird. Durch die Kombination dieser beiden Wahrscheinlichkeiten über eine gewichtete Summierung wird ein robusterer Schätzwert erreicht. Da es fünf Säulen gibt, haben wir also zehn einzelne Random Forest Modelle programmiert, um diese Fragen zu beantworten - und um zehn Wahrscheinlichkeiten (zwei pro Säule) zu erhalten. Dann werden diese Wahrscheinlichkeiten zu einem Gesamt-Rating für jede Säule aggregiert. 

Die Berechnung des MQR 

Nach der Schätzung der fünf Einzel-Ratings folgt im letzten Schritt die Berechnung des MQR auf der Skala „Negative“, „Neutral“, „Bronze“, „Silver“ oder „Gold“. Das Modell beruht auf einfachen Prämissen. Zuerst nehmen wir unsere Stichprobe der echten Morningstar Analyst Ratings und weisen ihnen Zahlenwerte zu: „Negative“ = 1, „Neutral“ = 2, „Bronze“ = 3, „Silver“ = 4 und „Gold“ = 5. Anschliessend weisen wir den echten Pillar-Ratings folgende numerische Werte zu: „Negative“ = 0, „Neutral“ = 0,5 und „Positive“ = 1. 

Danach führen wir eine multivariable lineare Regression durch, um Steigungskoeffizienten für jede Säule zu identifizieren. Dieses Modell hat den Vorteil, dass es uns nicht nur darüber informiert, wie wir bei einem falschen Pillar-Rating eine Änderung des Gesamtratings erwarten können, sondern auch, wie wir Gesamt-Ratings auf der Grundlage einer Reihe von Pillar-Ratings aufbauen. 

Grafik: Von der Datenanalyse über fünf Einzel-Ratings hin zum Gesamt-Rating

 

Das Modell schneidet gut ab, wenn es darum geht, die Analysten-Einschätzungen Out of Sample vorherzusagen. Im Vergleich zu anderen Methoden hat diese Regression offensichtliche Vorteile in Bezug auf Transparenz. Basierend auf den Ergebnissen der Regression sehen wir, dass das Gewicht jeder Säule mit unterschiedlichen Werten zu Buche schlägt. So scheint beispielsweise die Säule „Process“ die grösste Determinante für das Gesamt-Rating zu sein. Die Steigungskoeffizienten können wie folgt interpretiert werden: Bei einer Änderung der entsprechenden Pillar-Bewertung (0 bis 0,5 oder 0,5 bis 1) ist mit einer Veränderung des Gesamtratings um die Stufe X zu rechnen. Sagen wir, zum Beispiel, dass wir die Bewertung einer „Parent“-Säule von „Negative“ zu „Positive“ erhöhen (das heisst, auf von 0 auf 1). Dann würden wir erwarten, dass die Gesamtbewertung um 0,83 Einheiten steigt, wobei 1 Einheit gleich 1 Bewertung ist. Diese Steigungskoeffizienten, auch Korrelationskoeffizienten genannt, werden in unserem Modell jeden Monat neu berechnet. 

Anschliessend verwenden wir einen Chi-Quadrat-Verteilungsalgorithmus, um diese diskreten Gesamt-Ratings in einer kontinuierlichen Verteilung abzubilden und verwenden dabei feste Perzentil-Schwellenwerte für die endgültige Rating-Zuweisung. In der unteren Tabelle sind die Bemessungsschwellen für das MQR abgebildet. 

Die Bemessungsschwellen für das MQR

 

Die Modellgenauigkeit 

So weit, so gut. Wir haben das Morningstar Quantitative Rating Modell entwickelt, um das Verhalten der Fondsanalysten beim Fonds-Rating nachzuahmen. Und obwohl wir glauben, dass die Vorhersage einer zukünftigen Out-of-Sample-Performance der wichtigste Aspekt für Investoren ist, haben wir getestet, wie genau die quantitativen Ratings im Vergleich mit Analyst Ratings abschneiden. 

Der Vergleich der MQR mit den Analyst Ratings fällt zufriedenstellend aus. Das Modell kann die Unterschiede zwischen „Negative“ und „Neutral“ oder dem „Neutral“-Rating und den positiven Rating-Stufen recht gut erfassen. Die untere Tabelle zeigt die weitgehende Übereinstimmung zwischen den beiden Rating-Systemen.

Tabelle: Sind MQR und Analyst Ratings deckungsgleich?

Wenn beispielsweise ein Fonds mit einer der drei positiven Analyst Rating-Stufen ausgezeichnet wird, so ergibt sich für diese Fonds im MQR mit einer Wahrscheinlichkeit von 77,8 Prozent auch ein positives Rating. Nur 4,4 Prozent der von unseren Analysten mit „Negative“ bewerteten Fonds erhalten im MQR ein positives Rating. Umgekehrt werden nur 0,9 Prozent der von den Analysten empfohlenen Fonds im MQR negativ bewertet. Insgesamt sind wir mit der Genauigkeit des quantitativen Ratings zufrieden. 

Ein Grossteil der Inkonsistenz, die wir zwischen dem MQR und den Analyst Ratings beobachten, beschränkt sich auf die Abstufungen der positiven Ratings (Gold, Silver und Bronze). Es fällt dem Modell besonders schwer, die Unterschiede zwischen den drei verschiedenen positiven Stufen zu unterscheiden.

Und was ist mit der Performance des MQR? 

Auch mit Blick auf die Performance lieferte das MQR im Test signifikante und aussagekräftige Prognosen für zukünftige Alphas und Sharpe Ratios von Fonds. Je höher ein Fonds bewertet wurde, desto besser war seine nachfolgende Wertentwicklung über einen Zeitraum von einem, drei und fünf Jahren. So ist beispielsweise die Verbesserung auf ein „Gold“-Rating von einem „Negative“-Rating mit einem Anstieg des durchschnittlichen 36-monatigen Forward-Alpha um annualisiert 0,81 Prozent verbunden. Darüber hinaus ist die zukünftige Wertentwicklung der Fonds mit MQR über die Rating-Dezile hinweg monoton, was bedeutet, dass aus diesem System noch wertvollere Informationen gewonnen werden können, wenn es granularer wird. 

Das untere Schaubild zeigt, dass das MQR im Out-of-Sample Test eindeutige Vorteile für positive Rating-Stufen gegenüber „Neutral“ und „Negative“ Ratings zeigt (auch wenn das CAPM Alpha im Vergleich zur Kategorie Benchmark negativ ist, das ist das Los der aktiv verwalteten Fonds!). Der getestete Zeitraum erstreckte sich von Januar 2003 bis Dezember 2016.

Grafik: Rückrechnung der MQR-Bilanz seit 2003 

Wie stabil ist das MQR? 

Blicken wir zum Schluss auf die Stabilität des MQR über die Zeit. Um handhabbar für Investoren zu sein, muss von einem Rating ein gewisses Mass an Stabilität erwartet werden. Dieses Kriterium erfüllt das MQR eindeutig. Es ist über die Zeit recht stabil. Wenn ein Fonds ein negatives Rating erhält, würden wir erwarten, dass er nur mit einer Wahrscheinlichkeit von 0,39 Prozent ein Jahr später ein „Bronze“-Rating erhalten könnte und nur zu 0,09 Prozent ein „Gold“- oder „Silver“-Rating. Ebenso würden wir erwarten, dass ein Fonds mit MQR „Gold“ nur mit einer Wahrscheinlichkeit von 4,6 Prozent ein Jahr später ein neutrales Rating erhalten würde, und mit einer Wahrscheinlichkeit von 0,11 Prozent das Rating „Negative“ erhalten würde. Mit anderen Worten: Test bestanden!

Tabelle: Die Übergangswahrscheinlichkeiten der MQR

 

Weitere Informationen zu unserem MQR erhalten Sie hier.

 

Über den Autor

Morningstar