Q&A Webinar Medische Statistiek
Auteur: dr. Wing Tong, LUMC
De Mann-Whitney toets is een non-parametrische toets. Deze toets wordt gebruikt om een verschil te kunnen aantonen van één afhankelijke variabele tussen twee onafhankelijke steekproeven. In de presentatie wordt het voorbeeld gebruikt van mean arterial pressure als afhankelijke variabele, en de subgroepen pre-eclampsie mild en pre-eclampsie severe.
De Man-Whitney toets kan altijd worden gebruikt, maar bij grote steekproeven (n≤100) en na controle van de normaliteit van de verdeling, kan ook gebruik worden gemaakt van de Student T-toets. Deze is in dat geval nauwkeuriger dan de Mann-Whitney toets om het gemiddelde van een afhankelijke variabele te kunnen toetsen tussen twee subgroepen.
Een 95%-CI geeft het interval waarbinnen de werkelijke waarde met 95% waarschijnlijkheid ligt. De breedte van een betrouwbaarheidsinterval zegt iets over de nauwkeurigheid van het daadwerkelijke effect van de interventie (of een exposure). Anders gezegd: bij een smalle CI is het daadwerkelijke effect van de interventie met meer precisie aan te geven.
In de presentatie vergelijken we de voorbeelden met een 95%-CI bij de OR en een 95%-CI bij de uitwerking van een Students t-toets.
Als voorbeeld van een T-toets pairs analyse gebruiken we de subgroep high dose edoxaban van 60 mg in de ENGAGE-AF studie. Je wil het verschil weten in de pharmacokinetiek (PK) voor de start van één dosis edoxaban van 60mg en 2 dagen na de start. In dit geval zou je een T-toets pairs analyse gebruiken, omdat de subgroep meer dan 7000 patiënten omvat en je een steekproef doet met 2 variabelen (een voor- en nameting).
Dit is te onthouden als je denkt aan het feit dat je een ‘delta change’ (een verschil) wilt bestuderen tussen twee variabelen van één steekproef (of subgroep).
Een p-waarde bij een HR wordt niet altijd gegeven, omdat dit een stijlkeuze is van een journal. Het valt wel op dat in figuren (de Kaplan-Meier curves) vaak zowel de HR, 95%-CI of 97.5%-CI en de p-waarde worden weergegeven.
Een HR zal vaak niet in het midden staan van een horizontale errorbar, omdat de HR met een 95% zekerheid zich binnen een interval kan bevinden. De kans dat een HR wel ongeveer in het midden ligt is afhankelijk van de grootte van een CI. Hoe breder een CI (wat samengaat met minder waarnemingen van patienten “at risk”), hoe minder de kans er is dat een HR in het midden zich zal bevinden. Dit zie je ook terug in de forest plots in de presentatie.
Hierbij gaat het om de Kaplan-Meier curves (slide 21). Er is een toelichting gegeven over 95%-CI versus 97.5%-CI. Bij een “noninferiority” wordt eenzijdig getoetst, en een 97.5% CI gebruikt. Bij een “superiority” wordt tweezijdig getoetst, en een 95% CI gebruikt. Bij een tweezijdige toetsing (dus een 95%-CI), kan je ervan uitgaan dat als het getal 1 binnen de CI valt, dat het resultaat niet significant is. Valt het getal 1 niet binnen de CI dan is het resultaat wel significant. Deze regel gaat niet op voor een eenzijdige toetsing.
Via deze link vind je meer informatie over deze begrippen. Je kunt Tabel 2 uit het NEJM artikel ter illustratie gebruiken. Let dan met name op de verwijzingen onderaan de tabel.
Bij beide toetsen staat centraal dat je een verband wil kunnen leggen tussen categorische variabelen. Een voorbeeld van categorische variabelen zou kunnen zijn geslacht (M/V) versus AF (ja/nee). Als je deze vergelijkt krijg je bij zowel de Chi-square als de Fisher’s Exact toets een resultaat gerapporteerd.
Als je een categorische variabele met twee of meer vrijheidsgraden hebt, dan kun je enkel de Chi-square toets gebruiken. Een voorbeeld hiervan is de diagnose zwangerschapsvergifitiging, waarbij er 3 variabelen zijn: pre-eclampsie mild, pre-eclampsie severe of pregnancy induced hypertension (PIH) (een voorstadium van pre-eclampsie). Deze diagnose is te verdelen in 3 subgroepen (en dus 2 vrijheidsgraden, 3-1=2), en die wil je vergelijken met de categorische variabele Diabetes Mellitus (ja/nee), dan kan je hiervoor enkel een Chi-square toets gebruiken.
Tenslotte is de Fisher’s Exact toets bij een 2 bij 2 vergelijking van de categorische variabelen nauwkeuriger dan de waarde die je verkrijgt middels de Chi-square toets, met name bij kleine steekproeven.
Er is niet echt een online bron, forum of blog waar je dit kunt checken. High impact journals, zoals NEJM en The Lancet, doen veelal tijdens het reviewproces ook een statistical review. Een blad als The BMJ heeft een open peer review, waarin ook vaak statistiek- en methodologische vragen gesteld worden aan de auteurs.
Via deze link vind je ook een checklist om zelf een randomized controlled trial (RCT) beter te kunnen begrijpen.
- © 2023 Daiichi Sankyo Nederland B.V. Alle rechten voorbehouden
- CVD/22/0004
- Laatste wijziging: maart 2022