Statystyka do prac naukowych
Właściwe przygotowanie statystyki do pracy naukowej ma zasadnicze znaczenie, ponieważ oryginale doniesienia są istotą badań naukowych, a wyniki analiz statystycznych stanowią serce każdej pracy naukowej. Szczególnie jeśli chcemy przygotować wyniki do publikacji w dobrym czasopiśmie, analizy statystyczne muszą być opracowane nienagannie.
Biostatystyka
Biostatystyka, inaczej statystyka medyczna, to nauka zajmująca się projektowaniem badań i rozwojem metod statystycznych na użytek badań biomedycznych. Biostatystycy posiadają wiedzę statystyczną i umiejętności z dziedziny data science, co pozwala na sprawne manipulowanie danymi, dobór odpowiednich metod statystycznych oraz właściwe prezentowanie wyników. Dla różnych typów badań medycznych opracowano rekomendacje ułatwiające systematyczne raportowanie wyników, takie jak CONSORT dla badań randomizowanych oraz STROBE dla badań obserwacyjnych. Jednak niewiele jest poradników pokazujących, jak najpraktyczniej przystąpić do opracowania analiz statystycznych na potrzeby oryginalnych prac naukowych z medycyny. Dlatego w tym tekście zawarliśmy wiele pomocnych wskazówek, korzystając z wieloletniego doświadczenia w przygotowywaniu analiz statystycznych do publikacji w czołowych czasopismach medycznych.
Miejsce analiz statystycznych w artykule naukowym
Oryginalny artykuł naukowy jest podstawową formą prezentacji wyników badań naukowych. Artykuł taki jest zwięzłym sprawozdaniem o strukturze IMRaD: Introduction, Methods, Results (Wyniki), and Discussion. Jak łatwo się domyślić, wyniki analiz statystycznych opisuje się w części określanej jako Wyniki. W ostatnim akapicie Metod wyjaśnia się natomiast techniki statystyczne użyte w danym badaniu. Obecnie prace doktorskie coraz bardziej przypominają oryginalne artykuły naukowe i skupiają się na nowych obserwacjach a nie na przeglądzie literatury. Dlatego też wskazówki dotyczące prezentacji wyników w artykule naukowym można niemal bezpośrednio zastosować w pracy doktorskiej.
Ponieważ wyniki analiz statystycznych są najważniejszą częścią każdej pracy naukowej, pisanie takiej pracy najlepiej zacząć właśnie od opracowania analiz statystycznych. Doświadczeni naukowcy zaczynają pisanie artykułów od Metod i Wyników z dwóch powodów. Po pierwsze, znając dobrze przebieg badania i mając doświadczenie pisarskie, te części pisze się najłatwiej. Po drugie, opracowanie Wyników umożliwia sprawne napisanie pozostałych części pracy naukowej, ponieważ każda z nich nawiązuje do Wyników.
Analizy statystyczne muszą mieć główny przekaz
Przygotowując statystykę do pracy naukowej pamiętaj, że mniej znaczy lepiej. Błędem jest wklejenie kilkunastu tabel i rycin przedstawiających kilkadziesiąt lub kilkaset nieuporządkowanych zależności. Tego typu eksploracyjne raporty statystyczne są zrozumiałe jedynie dla samego badacza, który jest dobrze zaznajomiony z badaniem. Z pewnością takie raporty nie nadają się do publikacji. Dlatego w Wynikach pracy naukowej nie umieszcza się wszystkich dostępnych analiz, lecz wybiera te bezpośrednio związane z pytaniami badawczymi i hipotezami. Ponadto, zgodnie z coraz bardziej popularnym podejściem anglosaskim, analizy statystyczne powinny być „zaserwowane na tacy”, tak aby czytelnik niczego nie musiał się domyślać. Musimy o tym pamiętać, szczególnie wtedy, gdy przygotowujemy analizy statystyczne do publikacji naukowej.
Kluczowe dla całej pracy naukowej jest, aby wyniki miały główny przekaz (central contribution). Główny przekaz jest esencją całego badania i powinien być na tyle zwięzły, aby mógł służyć jako tytuł pracy naukowej. Skupienie wyników analiz statystycznych wokół jednego głównego przekazu sprawia, że praca naukowa jest przekonywająca i zapada w pamięć. Główny przekaz jest też motywem przewodnim powtarzanym w każdej części artykułu naukowego.
W badaniach klinicznych główny przekaz to zazwyczaj wyniki dotyczące pierwszorzędowego punktu końcowego i najważniejszych punktów drugorzędowych. W badaniach przedklinicznych główny przekaz może opowiadać dłuższą historię, która podsumowuje najważniejsze wyniki wszystkich eksperymentów. Dla przykładu, w naszym raporcie, dotyczącym pacjentów z gammapatią monoklonalną o nieokreślonym znaczeniu, główny przekaz analiz statystycznych jest następujący:
Większe wyjściowe stężenie białka monoklonalnego nie było związane z przeżyciem, ale zwiększało ryzyko szpiczaka mnogiego.
Główny przekaz należy wyrazić jasno, w czym pomaga zobrazowanie go na rycinie. Poniżej umieszczamy rycinę obrazującą główny przekaz naszego raportu.

Rycina przedstawia główny przekaz badania wśród pacjentów z gammapatią monoklonalną o nieokreślonym znaczeniu. A. Przeżycie od rozpoznania. B. Ryzyko konwersji do szpiczaka mnogiego. PCM, plasma cell myeloma; low M spike, niskie stężenie białka monoklonalnego przy rozpoznaniu; high M spike, wysokie stężenie białka monoklonalnego przy rozpoznaniu.
Tabele i ryciny w pracy naukowej
Opracowanie wszystkich tabel i rycin przed napisaniem reszty wyników pomaga uniknąć długich i skomplikowanych opisów. Przygotowując statystykę do pracy naukowej, pamiętajmy, że tabele i ryciny muszą być samowystarczalne, czyli zrozumiałe bez sięgania do artykułu. Czytelnicy oczekują takiego przygotowania tabel i rycin, ponieważ zazwyczaj przeglądają je zanim zdecydują, czy warto przeczytać cały artykuł. Często postępują tak też redaktorzy przed decyzja, czy przyjąć artykuł do recenzji.
Nic tak nie ułatwia przyswojenia wyników badania naukowego jak czytelne tabele i ryciny. W naszym przykładowym raporcie statystycznym, przygotowanym na potrzeby oryginalnego artykułu naukowego, najważniejsze wyniki można przyswoić dzięki tabelom i rycinom bez zaglądania do reszty raportu: Fig. 1 pokazuje jak wybrano grupę badaną; Tab. 1 szczegółowo opisuje tę grupę; Fig. 2 przedstawia kluczowe wyniki; a Tab. 2 przedstawia te wyniki szczegółowo. Taki sposób przedstawienia wyników zachęca czytelnika do przeczytania całego artykułu i ułatwia jego zrozumienie.
Ryciny jako reklama pracy naukowej
Ryciny są najlepszym sposobem, aby „sprzedać” badanie naukowe. Po pierwsze, ryciny zwracają uwagę czytelnika. Ma to duże znaczenie, ponieważ portale naukowe często umieszczają ryciny obok streszczenia, a wielu czytelników wyrabia opinię o badaniu przeglądając ryciny. Po drugie, ryciny ułatwiają zrozumienie analiz statystycznych, dzięki czemu wyniki zapadają w pamięć i zwiększają wydźwięk publikacji naukowej w społeczności akademickiej. Z całą pewnością można przyjąć, że nie da się dobrze opracować statystyki do pracy naukowej bez przygotowania profesjonalnych rycin. Dobre ryciny są szczególnie ważne w oryginalnych publikacjach naukowych.
Tworzenie dobrych rycin jest sztuką, którą warto opanować. Przede wszystkim należy wybrać rodzaj wykresu odpowiedni dla danych: np. wykres liniowy dla powtarzanych pomiarów, czy wykres pudełkowy dla zmiennej ciągłej. Najczęstszym błędem w doborze typu wykresu do danych jest przedstawianie średniej arytmetycznej na wykresie słupkowym, co ukrywa zakres zaobserwowanych wartości. Każdy wykres należy przygotować, tak aby stosunek „danych do tuszu” (data-ink ratio) był jak największy. Według tej zasady należy zrezygnować z jakichkolwiek ozdobników, tak aby każdy element wykresu niósł informację. Nie „dekorujmy” więc wykresów za pomocą efektownych funkcji wizualnych dostępnych w programie PowerPoint. Najczęstszym tego typu błędem jest dodawanie trzeciego wymiaru w wykresach słupkowych, co utrudnia odczytanie wartości na osi Y i porównanie wysokości poszczególnych słupków.
Tabele zawierają szczegółowe wyniki
Tabele przedstawiają szczegółowe wyniki analiz statystycznych, przeglądane są więc głównie przez czytelników zainteresowanych daną pracą naukową. Pierwsza tabela zazwyczaj opisuje charakterystykę badanej grupy, zawierając statystyki opisowe dla wyjściowych zmiennych, takich jak wiek, płeć, czy badania laboratoryjne. Kolejna tabela przedstawia wyniki związane z głównym przekazem badania, a następne – mniej ważne wyniki. Często uzupełniające wyniki pracy naukowej umieszcza się w tabelach towarzyszących (supplemental tables), dostępnych na stronie czasopisma publikującego artykuł.
Tekst Wyników
Mając gotowe tabele i ryciny można napisać zwięzły tekst Wyników, który oprowadza czytelnika po analizach statystycznych. Opracowując analizy statystyczne na potrzeby pracy naukowej, zawsze pamiętaj o czytelniku. Nie pisz dla siebie i kolegów z zespołu badawczego, ale załóż, że czytelnik nie zna Twojego obszaru badawczego. Wyniki pracy naukowej powinny przedstawiać analizy statystyczne w sposób systematyczny, co pozwoli opowiedzieć logiczną historię skupioną wokół głównego przekazu badania. Tekst Wyników nie powinien przytłaczać nadmierną ilością danych. Gdy wyniki stają się skomplikowane, warto przedstawić je w tabeli. Należy również unikać powtarzania w tekście wyników z tabel i rycin, choć czasami powtórzenie jest niezbędne dla zachowania spójności.
Wyniki najlepiej podzielić na akapity lub podsekcje. W naszym przykładowym raporcie pierwszy akapit przedstawia krótko charakterystykę uczestników, odnosząc czytelnika do Tab. 1 i Fig. 1 po więcej szczegółów. Następnie przedstawiamy główny przekaz, również odnosząc czytelnika w odpowiednich miejscach do poszczególnych tabel i rycin. Bezpośrednio w tekście umieszczamy wyniki, które nie wymagają ustrukturyzowania, np. czas obserwacji, czy wartość p dla pojedynczego testu statystycznego. Należy unikać wymieniania w tekście Wyników nazw konkretnych testów statystycznych, ponieważ utrudnia to czytanie. Techniki statystyczne użyte w badaniu powinny być wyjaśnione na tyle dobrze w Metodach, aby dalsze objaśnienia nie były potrzebne.
- Jak wykazał test t-Studenta, stężenie glukozy było istotnie większe u kobiet niż u mężczyzn (143±14 vs 122±15 mg/dl; p < 0.001) .
- Lepiej: Stężenie glukozy było istotnie większe u kobiet niż u mężczyzn (143±14 vs 122±15 mg/dl; p < 0.001).
- Współczynnik korelacji Pearsona wykazał silną dodatnią zależność miedzy wiekiem i ciśnieniem skurczowym (r = 0.85, p = 0.004).
- Lepiej: Wiek i ciśnienie skurczowe silnie dodatnio ze sobą korelowały (r = 0.85, p = 0.004).
- W modelach efektów mieszanych dla pomiarów powtarzanych efekt interakcji wykazał istotnie większy wzrost masy ciała w grupie leku niż w grupie placebo (4.22±2.11 vs. 1.22±0.99 kg; p = 0.034).
- Lepiej: Przyrost masy ciała był istotnie większy w grupie leku niż w grupie placebo (4.22±2.11 vs. 1.22±0.99 kg; pinterkacji = 0.034).
Rzetelność i obiektywizm
Wyniki analiz statystycznych w pracy naukowej należy przedstawić obiektywnie, bez stronniczości lub narzucania określonej interpretacji. Taki sposób prezentacji sprawia, że badanie odbierane jest jako rzetelne. Nigdy nie pisz, że analizy statystyczne czegoś dowiodły. Zgodnie z metodą naukową hipotezy nie można dowieść, lecz jedynie ją odeprzeć. Należy również przedstawić wyniki negatywne i nieistotne statystycznie, co świadczy o obiektywizmie badacza. Wyniki muszą korespondować z Metodami. Dlatego nie umieszczaj wyników, których nie wprowadzono w Metodach, ale również nie powtarzaj opisu metod w Wynikach. Przytaczając statystyki opisowe i wielkości efektu zawsze podawaj miary rozproszenia – np. odchylenie standardowe dla średniej arytmetycznej, czy 95% przedział ufności dla ilorazu szans. Opracowując wyniki analiz statystycznych po angielsku, pamiętaj, aby stosować czas przeszły i zdania w pierwszej osobie. W tekście Wyników nie cytuj poprzednich badań – zrób to w Dyskusji, w której możesz interpretować wyniki w kontekście dostępnej wiedzy.
Podsumowanie
- Wyniki przygotuj przed innymi częściami manuskryptu
- Wyniki muszą mieć główny przekaz
- Tabele i ryciny przygotuj przed napisaniem Wyników
- Tabele i ryciny muszą być zrozumiałe niezależnie od tekstu
- Wyniki muszą być zwięzłe i nie powtarzać informacji z tabel i rycin
Czy mogę oczekiwać od statystyka, że przygotuje wyniki gotowe do publikacji?
Niestety z reguły statystycy nie mają wystarczającej wiedzy przedmiotowej, żeby zorganizować analizy na potrzeby artykułu oryginalnego lub pracy dyplomowej. Często nie widzą nawet takiej potrzeby, ponieważ sami nie publikują jako pierwsi autorzy. Zamiast tego dostarczają ogrom trudnych do przyswojenia analiz, żeby udokumentować ilość włożonej pracy. Niestety ilość analiz jest przeważnie ujemnie związana z ich jakością. Zamawiając analizy statystyczne powinniśmy oczekiwać dobrze zorganizowanych wyników, a nie stosu danych, tak jak od architekta wnętrz oczekujemy funkcjonalnego projektu, a nie przypadkowego rozmieszczenia niepasujących do siebie mebli. PaperAccepted.net wyróżnia właśnie to, że przygotowujemy zorganizowane analizy statystyczne, które są gotowe do publikacji w czasopismach naukowych.
Jak poznać dobrego statystyka?
Dobry statystyk pracuje w programie obsługiwanym przez interfejs wiersza poleceń.
Tego typu programy (R, SAS, Stata) są używane przez profesjonalnych statystyków i analityków danych, w przeciwieństwie do „klikalnych” programów, takich jak SPSS lub Statistica, które stosowana są głównie przez użytkowników z podstawowymi umiejętnościami statystycznymi. Używanie interfejsu wiersza poleceń ma mnóstwo zalet, m.in. zapewnia doskonałą powtarzalność analiz, dostęp do niestandardowych metod statystycznych i możliwość tworzenia profesjonalnych rycin (głównie R).
Dobry statystyk publikuje własne badania jako pierwszy autor
Choć biegłość w matematycznych podstawach statystyki jest ważna, nie pomaga w przygotowaniu statystyki do pracy naukowej. Jeśli chcesz opublikować swoje badanie, najlepiej znajdź statystyka, który publikuje jako pierwszy autor i zna niuanse procesu recenzji. Wpisz nazwisko i pierwszą literą imienia oraz tag [1au] w wyszukiwarkę PubMed, aby sprawdzić, czy możesz liczyć na profesjonalną pomoc statystyka w przygotowaniu wyników do publikacji.
Opublikuj z nami Twoje badanie
Pomożemy Ci na każdym etapie, od zaprojektowania badania, przez przygotowanie statystyki i napisanie artykułu, do publikacji w recenzowanym czasopiśmie.