Modelling species distributions has been widely used to understand present and future potential distributions of species, and can provide adaptation and mitigation information as references for conservation and management under climate change. However, various methods of data splitting to develop and validate functions of the models do not get enough attention, which may mislead the interpretation of predicted results. We used the Taiwanese endemic birds to test the influences of temporal independence of datasets on model performance and prediction. Training and testing data were considered to be independent if they were collected during different survey periods (1993–2004 and 2009–2010). The results indicated no significant differences of six model performance measures (AUC, kappa, TSS, accuracy, sensitivity, and specificity) among the combinations of training and testing datasets. Both species- and grid cell-based assessments differed significantly between predictions by the annual and pooled training data. We also found an average of 85.8% similarity for species presences and absences in different survey periods. The remaining dissimilarity was mostly caused by species observed in the late survey period but not in the early one. The method of data splitting, yielding training and testing data, is critical for resulting model species distributions. Even if similar model performance exists, different methods can lead to different species distributional maps. More attention needs to be given to this issue, especially when amplifying these models to project species distributions in a changing world.
Die Modellierung der Verbreitung von Arten wurde weithin angewendet, um die gegenwärtige und die zukünftige potentielle Verbreitung von Arten zu verstehen. Sie kann auch Informationen zu Anpassung und Vorbeugung als Bezugspunkte für Naturschutz und Management in Hinblick auf den Klimawandel liefern. Indessen wird verschiedenen Methoden der Datenaufteilung für die Entwicklung und Validierung der Funktionen von Modellen nicht genügend Aufmerksamkeit geschenkt, was zu irrigen Interpretationen der Vorhersageergebnisse führen kann. Wir wählten die endemischen Vögel Taiwans, um den Einfluss zeitlicher Unabhängigkeit der Datensätze auf Modellleistung und -vorhersage zu prüfen. Die Trainings- und Testdaten wurden als unabhängig angesehen, wenn sie aus unterschiedlichen Erfassungsperioden stammten (1993–2004 bzw. 2009–2010). Die Ergebnisse zeigten für sechs Maßzahlen der Modellleistung (AUC, kappa, TSS, accuracy, sensitivity und specificity) keine signifikanten Unterschiede zwischen den getesteten Kombinationen von Trainings- und Testdatensätzen. Sowohl artbezogene als auch Rasterzellen-basierte Schätzungen differierten signifikant hinsichtlich der Vorhersagen, wenn Beobachtungen aus Einzeljahren bzw. über die Erfassungsperiode kumulierte Beobachtungen zugrundegelegt wurden. Wir fanden auch eine durchschnittliche Ähnlichkeit der Artenidentität von 85.8% zwischen den beiden Erfassungsperioden. Die verbleibende Unähnlichkeit wurde hauptsächlich durch einen Zugewinn an Arten in der späteren Erfassungsperiode verursacht. Die Vorgehensweise bei der Datenaufteilung, die die Trainings- und Testdatensätze ergibt, ist entscheidend für die aus dem Modell resultierenden Verbreitungen der Arten. Selbst bei gleicher Leistungsfähigkeit der Modelle können unterschiedliche Methoden zu unterschiedlichen Verbreitungskarten führen. Größere Aufmerksamkeit muss diesem Umstand gewidmet werden, insbesondere, wenn diese Modelle erweitert werden, um die Verbreitung von Arten in einer sich wandelnden Welt vorauszuberechnen.