Bei der Analyse großer Datensätze, die sich insbesondere auch durch eine hohe Zahl an Variablen auszeichnen, ist es immer ein interessanter erster Schritt, herauszufinden, welche Variablen am ehesten die interessierenden Zielgrößen beeinflussen. Die Bildung eines Random Forest bietet hier einen geeigneten Ansatz, da er keine besonderen Ansprüche an die Eigenschaften der Variablen stellt. Zudem ist das Verfahren geeignet, auch mit fehlenden Werten umzugehen, und es ist effizient in der Durchführung.