Trudność w interpretacji najczęściej wykorzystywanej wartości p zwiększa się, gdy podczas badania klinicznego trzeba zdecydować, czy należy je przedwcześnie zakończyć oraz jak (i czy) ocenić wyniki uzyskane w podgrupach chorych po zakończeniu badania. Podobny problem pojawia się podczas analizy bezpieczeństwa RCT. We wszystkich tych okolicznościach wielokrotne przeprowadzanie testów znamienności statystycznej – z wykorzystaniem konwencjonalnej wartość p (<0,05) – zwiększa prawdopodobieństwo uzyskania przynajmniej jednego wyniku znamiennego. Na przykład, jeśli bada się 10 odrębnych parametrów, prawdopodobieństwo, że jeden z nich uzyska znamienność statystyczną (p<0,05), wynosi 40%. Zjawisko to określa się mianem problemu multiplikacji. Statystycy, opracowując zasady przerywania badań i analizy podgrup, mają bardzo odmienne poglądy na to, jak te trudności pokonać.12

Naturalnym pragnieniem badaczy jest przeprowadzanie w czasie trwania badania analizy danych zgromadzonych na danym jego etapie, by zdecydować, czy badanie kontynuować, czy też przedwcześnie je zakończyć. Wcześniejsze zakończenie badania jest uzasadnione, jeśli przyjęty wcześniej parametr oceny końcowej uzyskał znamienność statystyczną lub wówczas, gdy bezpieczeństwo kontynuowania badania w jednej z grup budzi obawy. Przy podejmowaniu decyzji o wcześniejszym zamknięciu RCT istnieją jednak pewne pułapki. Jeśli analiza w trakcie badania wskazuje na niespodziewaną korzyść, odróżnienie wyniku rzeczywistego od przypadkowego może być trudne.13

W celu rozwiązania problemu multiplikacji tego rodzaju opracowano różne metody statystyczne.12 Wiele z nich zależy od zmiany poziomu znamienności statystycznej (tj. wartości p) podczas każdej z przeprowadzanych analiz, co oznacza, że odrzucenie wyjściowej hipotezy wymaga przyjęcia mniejszej wartości p we wcześniejszych analizach. Statystycy nie ustalili jednak wspólnego stanowiska dotyczącego zasad wstrzymywania badań.12,14 Konieczność rozwiązania problemu staje się zatem pilna. Wczesne przerwanie badania z powodu uzyskanych korzyści może w sposób systemowy przeszacowywać efekty leczenia, co stwarza realne zagrożenie, że pewne wnioski dotyczące skuteczności leczenia, szczególnie w onkologii, mogą być nieuzasadnione.12,15

Analiza skutków leczenia przeprowadzona w podgrupach chorych może mieć ważne znaczenie dla określenia, czy różni chorzy inaczej reagują na leczenie.16 Najczęstszym rozwiązaniem problemu multiplikacji w analizie podgrup jest przyjęcie tylko ograniczonej liczby, klinicznie i biologicznie uprawdopodobnionych podgrup, określonych na etapie planowania badania.12,17 Nie ustalono jednak, ile podgrup można uznać za ograniczoną liczbę. Analizowanie podgrup wyłonionych po zakończeniu badania wzbudza różne opinie. Niektórzy unikają analizy post hoc, podczas gdy inni sugerują ostrożne skorygowanie poziomu istotności statystycznej (wartości p).17

Metoda Bayesa

Coraz więcej statystyków uważa,18 że rozwiązanie wielu trudności, wynikających z konserwatywnego sposobu projektowania, analizy i interpretacji RCT, ułatwia zastosowanie metody statystycznej Bayesa. Wzięła ona swoją nazwę od nazwiska Thomasa Bayesa (1701-61), nonkonformistycznego pastora z Tunbridge Wells. Bajezjańskie rozumienie prawdopodobieństwa – zwanego subiektywnym lub odwróconym – polega na przyjęciu hipotezy badawczej na podstawie pewnych danych.

Twierdzenie Bayesa łączy znane wcześniej prawdopodobieństwo wyjściowe, tj. przed rozpoczęciem eksperymentu, jakim może być np. RCT, z prawdopodobieństwem końcowym, ponownie obliczonym po zakończeniu badania. Ogniwem łączącym prawdopodobieństwo wyjściowe z końcowym jest wynik samego doświadczenia. Końcowe prawdopodobieństwo zapewnia możliwość oceny prawdopodobieństwa hipotezy uzależnionej od obserwowanych wyników, ale po uwzględnieniu informacji znanych już (wcześniejszych) sprzed rozpoczęcia badania.19,20

Zastosowanie metody Bayesa podczas analizy wyników RCT przedstawiono na rycinie 1. Badanie GREAT zaprojektowano w celu oceny słuszności hipotezy, zgodnie z którą wczesne podanie leków trombolitycznych w domu chorego z ostrym zawałem mięśnia sercowego powinno być korzystniejsze niż rozpoczęcie takiego leczenia później w szpitalu.21 Przeprowadzono zatem RCT porównujące skuteczność leczenia trombolitycznego podejmowanego przez lekarzy podstawowej opieki zdrowotnej w domu chorego ze skutecznością takiego leczenia włączanego dopiero wówczas, gdy chory znalazł się w miejscowym szpitalu. Po trzech miesiącach względne zmniejszenie umieralności z wszelkich przyczyn wyniosło 49% (p=0,04) wśród chorych rozpoczynających leczenie w domu w porównaniu z chorymi leczonymi dopiero po przyjęciu do szpitala. Choć wczesne podjęcie leczenia może korzystnie wpłynąć na przeżycie, zmniejszenie dzięki temu umieralności o niemal 50% wydaje się mało przekonujące, biorąc pod uwagę fakt, że włączenie takiego leczenia w szpitalu zmniejsza umieralność o około 25%.

Pocock i Spiegelhalter przeprowadzili ponową analizę metodą Bayesa (ryc. 1).22 W oparciu o wyniki wcześniejszego RCT ustalili rozkład badanej zmiennej dla leczenia trombolitycznego zastosowanego w szpitalu (ryc. 1a). Przypuszczali, że dzięki wcześniejszemu podaniu leków bardzo prawdopodobne jest zmniejszenie umieralności o 15-20%, ale takie skrajności – jak brak korzyści wynikających z takiego leczenia lub zmniejszenie umieralności o 40% – są nieprawdopodobne. Rycina 1b ukazuje rozkład prawdopodobieństwa z wyników badania GREAT. Rycina 1c przedstawia rozkład uzyskany dzięki pomnożeniu wcześniejszych danych i prawdopodobieństwa uzyskanego w badaniu. Oznacza to, że prawdopodobieństwo wynikające z oryginalnej analizy badania GREAT zostało formalnie zakwestionowane, aby uzasadnić tezę, że oryginalne wyniki były zbyt dobre, by mogły być prawdziwe.22

Zastosowanie metody Bayesa pozwala uniknąć bezkrytycznego posługiwania się hipotezą zerową, pomaga też pokonywać problemy podczas projektowania RCT i analizowania ich wyników, a także zagadnień związanych z multiplikacją.19,20 Dlaczego zatem metoda ta nie jest bardziej upowszechniona? Wydaje się, że składa się na to pięć głównych przyczyn.

Po pierwsze, chociaż subiektywne podejście do prawdopodobieństwa ma XVIII-wieczne korzenie, niektórzy (zwłaszcza ci o pospolitym sposobie myślenia) traktują taką interpretację prawdopodobieństwa z osobistą odrazą.20 Wolą trzymać się złudnego bezpieczeństwa prostej definicji, która podczas testowania hipotezy zerowej przesądza o wynikach. Niechętnie natomiast akceptują to, że osobiste przekonanie lub opinia powinny być brane pod uwagę podczas podejmowania decyzji.

Po drugie, duże kontrowersje budzi określenie wyjściowego prawdopodobieństwa (znanego przed przeprowadzeniem badania). Jeśli istnieją dowody pochodzące z uprzednich badań, tzw. wyjściowe prawdopodobieństwo kliniczne jest łatwo dostępne. Gdy ich nie ma, wykorzystuje się prawdopodobieństwo domyślne (standardowe).20 Do rzekomych trudności z jego zastosowaniem i całej metody Bayesa przywiązuje się zbyt dużą wagę. Zwykle jednak przy braku danych o wyjściowym prawdopodobieństwie klinicznym (lub czasami, w analizie wrażliwości metody, nawet przy jego znajomości) wykorzystuje się kilka wartości prawdopodobieństwa domyślnego.

Po trzecie, analizy Bayesa zawierają złożone obliczenia i wymagają więcej pracy niż metody stosowane podczas bardziej konserwatywnych analiz.

Po czwarte, niektórzy statystycy – choć jest ich coraz mniej – nie mają doświadczenia w stosowaniu technik analizy Bayesa i nie chcą (lub nie są w stanie) ich przyswoić. Niektórzy sądzą, że umiejętność tę nabywa się wraz z innymi podczas studiów uniwersyteckich.23 Inni, mniej życzliwi, uważają ją za właściwą danemu pokoleniu statystyków. Jeden ze zwolenników metody Bayesa powiedział mi, że statystycy nauczeni korzystania z tablic logarytmicznych i suwaka logarytmicznego zwykle nie potrafią posługiwać się metodą statystyczną Bayesa.

Na koniec, agendy rządowe do spraw rejestracji czasem wahają się przyznać, że metoda Bayesa ma swoje zalety.24 Obserwuje się coraz częstsze zainteresowanie oceną urządzeń medycznych.25 Ich producenci coraz częściej wykorzystują metodę Bayesa podczas badań II lub III fazy.26,27

W przyszłości metoda Bayesa prawdopodobnie odegra większą rolę w projektowaniu i analizie RCT.18 Korzyściami, które warto w ten sposób uzyskać będzie wyeliminowanie sztywnej wartości p i rozwiązanie kilku problemów związanych z multiplikacją. Poza tym metoda Bayesa może ułatwić decydentom wyciąganie bardziej stosownych wniosków.

Uogólnianie

Small 2714

Tabela 2. Czynniki wpływające niekorzystnie na uogólnianie wyników randomizowanych badań z grupą kontrolną (RCT)

RCT podejmuje się na ogół w wybranych populacjach chorych i trwają one określony, zwykle krótki czas. W praktyce klinicznej badaną metodę stosuje się w bardziej zróżnicowanej populacji – często obciążonej współistniejącymi chorobami – i przez dłuższy czas. Coraz większego znaczenia nabiera pytanie, w jakim stopniu wyniki uzyskane podczas RCT wymagają potwierdzenia w innych badaniach, a także możliwość ich ekstrapolacji i uogólnienia na większą populację chorych.28,29 Najważniejsze zagadnienia wymieniono w tabeli 2.

Poważne obawy związane z uogólnianiem wyników badań opisywano wielokrotnie.10 Na przykład Bartlett i wsp. przeanalizowali kryteria wykluczenia przyjęte w RCT oceniających zarówno statyny (27 badań), jak i niesteroidowe leki przeciwzapalne (NLPZ) (25 badań).30 Stwierdzili, że w badanych grupach znalazło się zbyt mało kobiet, osób w podeszłym wieku i przedstawicieli mniejszości etnicznych w porównaniu z ogólną populacją chorych przyjmujących te leki. Podobną zbyt małą reprezentatywność pewnych podgrup obserwowano w RCT poświęconych innym metodom leczenia chorób układu sercowo-naczyniowego.31

Do góry