Opbouw van een wetenschappelijk artikel
Wetenschappelijk onderzoek wordt naar de buitenwereld gecommuniceerd aan de hand van een wetenschappelijk artikel. Onderzoekers schrijven er hun doelstelling, onderzoeksmethode en resultaten neer en dit volgens een vast stramien. Een wetenschappelijk artikel is steeds opgebouwd uit de volgende onderdelen:
Geeft een kort antwoord op de volgende vragen: waarover gaat de studie, welke methode werd gebruikt, wat zijn de resultaten? Zij geeft te weinig details om te kunnen besluiten of de studie valabel is maar geeft een eerste indicatie van wat de studie wil aantonen.
Geeft achtergrondinformatie (bv. kadering van de bredere context, een overzicht van de voorgaande studies die de theorie van dit onderzoek ondersteunen of tegenspreken) en uitleg over de doelstellingen van het onderzoek.
Geeft een beschrijving van de gebruikte methodologie. Hieruit kan de kritische lezer opmaken of het onderzoek adequaat is opgezet om de vooropgestelde doelstellingen van het onderzoek te bereiken.
De volgende informatie is belangrijk: de plaats waar de studie is uitgevoerd (de exacte portiegroottes en de nutritionele samenstelling van producten kunnen verschillen van land tot land), de samenstelling en de grootte van de onderzoekgroep(en) rekening houdend met het te onderzoeken effect (grote studies leveren vaak meer betrouwbare resultaten op dan kleine), de bepaling en toediening van de te onderzoeken variabelen, het gemeten eindpunt (bv. een bepaalde aandoening of een marker van een bepaalde aandoening), de duur van de studie, de controle over de variabelen die het resultaat kunnen beïnvloeden, de manier waarop de gegevens zijn verzameld en verwerkt.
Presenteert de resultaten die de onderzoekers zelf hebben gevonden.
Biedt een verdere bespreking en interpretatie van de resultaten en geeft mogelijke implicaties van het onderzoek. De onderzoekers geven eventuele beperkingen of zwakke punten van de studie aan en wat nog verder moet worden onderzocht.
Geeft de eindconclusies van de onderzoekers. Kijk na of de conclusies overeenstemmen met de inhoud van het artikel.
Conclusies die worden overgenomen in persberichten of door de media kunnen stelliger zijn dan die van de onderzoekers zelf.
Het volledige onderzoek is verschenen in een wetenschappelijk tijdschrift en voor publicatie nagekeken en beoordeeld op zijn wetenschappelijke kwaliteit door onafhankelijke experten.
Schriftelijke opinies van experten kunnen de lezer helpen om de studie beter te begrijpen en meer zicht te krijgen op de betekenis en de implicaties van het betreffende onderzoek. Zij plaatsen de studie vaak in een bepaald perspectief door ze te vergelijken met andere studies en kunnen wijzen op mogelijke fouten of beperkingen die de bruikbaarheid en de geloofwaardigheid van de resultaten in twijfel kunnen trekken. Ook dergelijke opinies moet men voldoende kritisch lezen.
Correct interpreteren vereist basiskennis statistiek
Epidemiologisch voedingsonderzoek maakt voor de verwerking van gegevens gebruik van statistische analyses om mogelijke relaties tussen voeding en gezondheid op te sporen. Hoewel de gepubliceerde studieresultaten meestal ook zonder kennis van statistiek perfect begrijpbaar lijken, is een basiskennis van statistiek nochtans onontbeerlijk om de resultaten correct te kunnen interpreteren en na te gaan of ze voldoende relevant zijn om te vertalen naar algemene adviezen. Ook de bespreking van de statistische verwerking is dus een interessant onderdeel van elke wetenschappelijke publicatie.
De statistische toets levert een reeks waarden op die wijzen op mogelijke verbanden en op de sterkte van deze verbanden. Hierna volgt een overzicht van de belangrijkste statistische kengetallen.
De statistische toets levert een reeks waarden op die wijzen op mogelijke verbanden en op de sterkte van deze verbanden.
Afhankelijk van de proefopzet, de soort en de hoeveelheid gegevens maakt de epidemioloog gebruik van bepaalde statistische testen of toetsen. Aan de hand van de statistische toets wordt nagegaan of uit het onderzoek een verband blijkt tussen bepaalde factoren, bijvoorbeeld de inname van bepaalde voedingsstoffen of voedingsmiddelen, en het meetresultaat, bijvoorbeeld het al of niet voorkomen van ziekte, overlijden of veranderingen in groei, gewicht of bloedwaarden.
Statistici formuleren het als volgt: door middel van een statistische toets wordt nagegaan of de veronderstelling dat er geen verband is tussen twee of meerdere variabelen (de zogenaamde nulhypothese) in het licht van de resultaten van het onderzoek verworpen of aanvaard dient te worden of dat er een alternatieve hypothese - er is waarschijnlijk wel een verband – kan worden aanvaard. De nulhypothese wordt verworpen als de waargenomen effecten niet meer op toeval lijken te berusten. Er zijn verschillende mathematische modellen beschikbaar. Bekende statistische toetsen zijn de chi-kwadraat, de t-toets en de F-toets.
De keuze van de proefopzet bepaalt welke statistische toets wordt gebruikt en omgekeerd. Bij de uitwerking van de proefopzet moet ook worden nagedacht over hoe de verzamelde gegevens zullen worden verwerkt en geanalyseerd. In sommige gevallen is het aan te raden om meerdere toetsen uit te voeren op eenzelfde reeks data.
De mediaan is het middelste getal in een oplopende reeks. Vijftig procent van de getallen in de reeks zijn groter en 50 % zijn kleiner dan de mediaan. Er wordt vaak gewerkt met de mediaan omdat dit getal minder wordt beïnvloed door uitschieters (extreem hoge of lage getallen) dan het rekenkundig gemiddelde.
De standaardafwijking is een maat voor de spreiding van een variabele of van een verdeling. Hoe kleiner de standaardafwijking op de gevonden resultaten, hoe kleiner het verschil tussen de gevonden resultaten. De standaardafwijking neemt toe naarmate de resultaten sterker van elkaar verschillen of als er belangrijke uitschieters zijn. Dikwijls kennen de resultaten een normale verdeling, voorgesteld door een Gauss-curve. Bij een normale verdeling ligt 95 % van de data in het gebied tussen het gemiddelde plus 2 maal de standaardafwijking en het gemiddelde min 2 maal de standaardafwijking. Hoe kleiner de standaardafwijking, hoe groter de kans dat de gevonden resultaten significant zijn (zie verder).
In voedingsonderzoek is het vaak nuttig om een vergelijking te maken tussen personen met de hoogste waarde voor een bepaalde variabele en personen met de laagste waarde voor deze variabele. Een variabele is bijvoorbeeld de inname van een bepaald nutriënt of voedingsmiddel, het lichaamsgewicht of een bepaalde bloedwaarde. Als een indeling van de onderzoekspopulatie in twee groepen niet volstaat, wordt ze ingedeeld in kwartielen (4 gelijke delen) of kwintielen (5 gelijke delen). Een kwartiel bevat een vierde van de onderzoekspopulatie, een kwintiel een vijfde. Het eerste kwartiel of kwintiel is de groep met de laagste waarden van de beschouwde variabele, het vierde kwartiel of vijfde kwintiel is de groep met de hoogste waarden.
Als men het effect op het grootste deel van de populatie wil kennen en niet noodzakelijk op heel de populatie, dan wordt gebruik gemaakt van percentielen. In de bespreking van de resultaten staat dan bijvoorbeeld vermeld dat men het effect heeft bestudeerd op het 95e percentiel: dit betreft 95 % van de populatie die waarden vertonen die lager liggen dan de gekozen variabele. Dit is typisch voor risico-analyses. Hierbij wordt het risico van de hoeveelheid die door 95 % van de bevolking wordt ingenomen geanalyseerd. De 5 % extreem hoge gebruikers wordt buiten beschouwing gelaten.
Het absolute risico is de verhouding tussen het aantal keer dat iets voorkomt binnen een groep en het totale aantal van die groep.
Het relatieve risico is de verhouding tussen de kans op een bepaalde uitkomst (bv. ziekte, sterfte, overgewicht) bij enerzijds een groep die aan bepaalde factoren is blootgesteld (bv. veel groenten en fruit eten) en anderzijds een groep die niet aan deze factoren is blootgesteld. Als het relatieve risico groter is dan 1, dan heeft de blootgestelde groep meer kans op de bestudeerde uitkomst. Als het relatieve risico kleiner is dan 1, dan heeft ze minder kans op deze uitkomst. Een relatief risico dat gelijk is aan 1 wijst erop dat er geen verband is tussen de blootstelling en de uitkomst.
Het relatieve risico kan ook worden gebruikt om de sterkte van bepaalde verbanden met elkaar te vergelijken. Hoe hoger het relatieve risico, hoe sterker het verband. Hoe sterker het verband, hoe groter de relevantie voor eventuele aanpassingen van de algemene voedingsaanbevelingen.
Het belang van het relatieve risico kan ten slotte niet los worden gezien van het absolute risico. Als het absolute risico op een bepaalde aandoening zeer laag is en het relatieve risico ook niet bijzonder hoog is, dan is er geen grote reden tot bezorgdheid. Als zowel het absolute als het relatieve risico hoog zijn, dan kunnen aangepaste maatregelen nodig zijn.
De odds ratio is de verhouding tussen de kans dat een bepaalde uitkomst optreedt en de kans dat dit niet gebeurt. Een odds ratio groter dan 1 wijst op een verhoogd risico, een odds ratio kleiner dan 1 op een lager risico.
Het verschil met het relatieve risico is dat men vertrekt vanuit de uitkomst en niet vanuit de blootstelling. Voor zeldzame aandoeningen benadert de odds ratio het relatieve risico.
De overschrijdingskans is de kans dat het gevonden resultaat ook zou worden bekomen als er geen effect zou zijn. Het is dus de kans dat de nulhypothese – er is geen effect – verkeerdelijk wordt verworpen en de alternatieve hypothese verkeerdelijk wordt aanvaard. Hoe kleiner de overschrijdingskans of p-waarde, hoe groter de waarschijnlijkheid dat het gevonden effect reëel is. Met ander woorden: een p-waarde kleiner dan 5 % (p < 0,05) betekent dat het resultaat minder dan 5 % van de keren zou voorkomen indien er geen effect zou zijn.
Afhankelijk van het onderzoek kiest men een grenswaarde (a) voor de p-waarde waaronder de resultaten als significant worden beschouwd. In de praktijk ligt deze grenswaarde veelal op 5 % of 0,05. Bij een p-waarde kleiner dan 1 % of 0,01 is sprake van een sterk significant resultaat. Een significant resultaat betekent dat de kans dat het gevonden verband op toeval berust klein is.
Significantie is een louter statistische grootheid. Een significant verband is nog geen sluitend bewijs van een oorzakelijk verband. Hiervoor zijn andere studies naar vooral de werkingsmechanismen nodig. Een niet-significant resultaat is evenmin het bewijs dat er geen verband of effect zou zijn. Een andere proefopzet of een grotere steekproef laat misschien wel toe om een verband aan te tonen.
Significantie is evenmin een garantie voor voldoende relevantie om er algemene adviezen op te baseren. Het gevonden effect kan immers bijzonder klein zijn of slechts voor een zeer beperkte groep personen van toepassing zijn. Om de relevantie van de resultaten van een voedingsonderzoek te beoordelen zijn gegevens over de context belangrijker dan de mate van significantie.
Het onderscheidend vermogen (“power” of p) van een statistische toets is de kans om een nulhypothese terecht te verwerpen of de kans dat de test geen vals-negatieve resultaten oplevert. Hoe groter de steekproef, hoe kleiner de kans op een vals-negatief resultaat. De epidemioloog stelt vooraf vast hoe groot het onderscheidend vermogen (meestal 80 of 90 %) van het onderzoek moet zijn. Bij de proefopzet kan dan worden berekend hoe groot de onderzoekspopulatie moet zijn zodat de kans dat het verband tussen twee variabelen ook echt gevonden wordt, groter is dan 80 of 90 %.
Als de resultaten van een onderzoek worden uitgedrukt in termen van relatief risico of odds ratio wordt de mate waarin toeval verantwoordelijk zou kunnen zijn voor het gevonden verband uitgedrukt door het betrouwbaarheidsinterval. Het betrouwbaarheidsinterval wordt berekend op basis van de verzamelde data en geeft het interval aan waarbinnen de werkelijke uitkomst met een zekere graad van waarschijnlijkheid ligt. Meestal wordt een 95 % betrouwbaarheidsinterval berekend. Dit betekent dat de kans dat de werkelijke waarde van bijvoorbeeld het relatieve risico binnen het opgegeven interval ligt, 95 % is. Of nog, indien de studie 100 maal in vergelijkbare omstandigheden zou worden herhaald, dan zal het resultaat in 95 % van de gevallen binnen het betrouwbaarheidsinterval van de eerste studie liggen. Bij de bepaling van het betrouwbaarheidsinterval speelt ook het onderscheidend vermogen van een studie een rol. Een laag onderscheidend vermogen levert een breed betrouwbaarheidsinterval op, een hoog onderscheidend vermogen een nauw betrouwbaarheidsinterval.
Er is sprake van een correlatie tussen twee variabelen als er een zeker lineair verband is tussen beide. Dit verband kan recht evenredig zijn of omgekeerd evenredig. De sterkte van de correlatie blijkt uit de correlatiecoëfficiënt. Deze varieert tussen plus 1, een perfecte evenredige lineaire cor relatie, en min 1, een perfecte omgekeerd evenredige correlatie. Hoe verder de correlatiecoëfficiënt afwijkt van plus 1 of min 1, hoe zwakker de correlatie.
Vaak wordt de significantie voor de correlatie berekend. Dit is echter niet altijd een goede maat om de correlatie te beoordelen. Enkele extreme waarden kunnen een hoge significantie opleveren, terwijl de intermediaire waarden nauwelijks gecorreleerd zijn. Grafisch uitgezet geeft dit dan een lijn door een zeer grote wolk van data.
Correlatie kan wijzen op een causaal verband maar geeft hierover geen enkele zekerheid.
Gerelateerde artikels
Soorten voedingsonderzoek
Er zijn verschillende soorten voedingsonderzoek. Ze zijn stuk voor stuk interessant maar hun bijdrage tot de bewijslast varieert.
Voedingsonderzoek correct interpreteren
Veel variabelen spelen mee in voedingsonderzoek. Vandaar de veel gehoorde afsluiter “meer onderzoek is nodig”. Lees hier meer over correct interpreteren van voedingsonderzoek.
Voedingswetenschap en -communicatie
Onderzoek naar de relatie tussen voeding en gezondheid is complex. Waarop moet je letten bij het lezen, interpreteren en communiceren van voedingswetenschap?