Schätzung globaler Migrationsströme anhand von traditionellen Datenquellen und maschinellen Lernverfahren
Zusammenfassung
Das Ziel dieses Projekts ist es, auf jährlicher Basis Schätzungen von bilateralen Migrationsströmen zu liefern, indem traditionelle und neue Datenquellen mit maschinellen Lernverfahren kombiniert werden. Das Forschungsteam wertet derzeit herkömmliche Datenquellen auf Jahresbasis aus (z.B. Volkszählungen, Umfragen oder Behördendaten) und erstellt eine Datenbank, die bilaterale Migrationsströme weltweit seit 1991 berücksichtigt. In einem zweiten Schritt wird das Projekt maschinelle Lernverfahren heranziehen, um jährliche Migrationsströme zu prognostizieren. Dabei werden innovative Datenquellen wie Google-Suchanfragen und Daten zum Luftverkehr ausgewertet. In einem letzten Schritt werden alle Daten anhand von Simulationen und Vergleichen mit nationalen bzw. internationalen Migrationsstatistiken validiert.
Resultate
Die ersten Ergebnisse zeigen Diskrepanzen aus geografischer und historischer Sicht. Beim Thema Migration sind Daten aus traditionellen Quellen weiter verbreitet. Jedoch sind in Regionen Afrikas, Asien sowie in der Karibik und in Osteuropa weiterhin erhebliche Datenlücken festzustellen. In Nord- und Lateinamerika, Europa und Ozeanien ist ein größeres Datenvolumen festzustellen, jedoch erschweren unterschiedliche Definitionen des Migrationsbegriffs in diesen Breiten die Vergleichbarkeit der Daten. Es wurden verschiedene maschinelle Lernverfahren geprüft, die jeweils unterschiedliche Ergebnisse im Hinblick auf die Genauigkeit hervorbrachten. Somit liegen positive erste Ergebnisse vor. Bevor endgültige Schlüsse gezogen und definitive Empfehlungen ausgesprochen werden, müssen jedoch weitere Prüfungen am Datenmaterial vorgenommen werden.
(Bild: © University of Liverpool)