Aussagekraft kleiner Stichproben in diagnostischen Meta-Analysen
Meta-Analysen spielen eine zentrale Rolle dabei, die diagnostische Genauigkeit bildgebender Verfahren zu bewerten. Sie fassen Ergebnisse aus zahlreichen Primärstudien zusammen, um daraus eine verlässlichere und präzisere Gesamtaussage abzuleiten. Solche Analysen fließen direkt in klinische Leitlinien ein und beeinflussen damit maßgeblich die medizinische Praxis. Gleichzeitig sind sie sehr aufwendig, da viele Primärstudien identifiziert, geprüft und statistisch kombiniert werden müssen. In seiner Diplomarbeit untersuchte Moritz Jakob Wimmer daher, ob für eine erste verlässliche Einschätzung nicht auch kleinere Stichproben von Primärstudien (Subsets) ausreichen können.
Für die Analyse wurden sechs aktuelle Meta-Analysen aus dem Gebiet der Brustbildgebung ausgewählt und insgesamt acht Datensätze neu ausgewertet. Aus jedem Datensatz wurden zufällige Stichproben unterschiedlicher Größe – von sehr kleinen Stichproben mit nur zwei Studien bis hin zu größeren Stichproben mit bis zu zwanzig Studien (n = 2–20) – gebildet. Anschließend wurde die diagnostische Genauigkeit dieser Stichproben, gemessen an der AUC (Area under the Curve; ein Maß zur Bewertung der diagnostischen Leistung), erneut berechnet. Ziel war es zu prüfen, wie gut kleinere Stichproben die Ergebnisse der vollständigen Meta-Analysen widerspiegeln.
Die Ergebnisse zeigen, dass bereits 5–6 Primärstudien in fünf der acht Datensätze AUC-Schätzungen lieferten, die nahe an jener der vollständigen Meta-Analyse lagen. Abgesehen von der Stichprobengröße spielen jedoch auch andere Faktoren wie die Heterogenität der eingeschlossenen Studien, deren Qualität, das jeweilige Studiendesign sowie statistische Ausreißer eine wichtige Rolle und können das Gesamtergebnis ebenfalls beeinflussen.
Somit ersetzen kleine Stichproben keine vollständige systematische Meta-Analyse, können jedoch eine wertvolle Ergänzung darstellen – insbesondere dann, wenn frühzeitige evidenzbasierte Einschätzungen benötigt werden oder neue diagnostische Technologien bewertet werden sollen. Die Ergebnisse der Arbeit zeigen, dass unter geeigneten Bedingungen bereits wenige gut ausgewählte Studien eine robuste erste Orientierung liefern können.
Hier finden Sie die gesamte Diplomarbeit.
