Współczynnik Z - Z-factor
Współczynnik Z jest miarą wielkości efektu statystycznego . Zaproponowano go do stosowania w wysokowydajnych badaniach przesiewowych (gdzie jest również znany jako Z-prime) i powszechnie zapisywany jako Z', aby ocenić, czy odpowiedź w konkretnym teście jest wystarczająco duża, aby uzasadnić dalszą uwagę.
Tło
Na ekranach o wysokiej przepustowości eksperymentatorzy często porównują dużą liczbę (setki tysięcy do dziesiątek milionów) pojedynczych pomiarów nieznanych próbek z próbkami kontroli pozytywnej i negatywnej . Szczególny wybór warunków eksperymentalnych i pomiarów nazywa się testem. Duże ekrany są drogie pod względem czasu i zasobów. Dlatego przed rozpoczęciem dużego badania przesiewowego stosuje się mniejsze ekrany testowe (lub pilotażowe), aby ocenić jakość testu, próbując przewidzieć, czy będzie on użyteczny w warunkach wysokiej przepustowości. Współczynnik Z jest próbą ilościowego określenia przydatności konkretnego testu do zastosowania w pełnoskalowym, wysokowydajnym badaniu przesiewowym.
Definicja
Współczynnik Z jest zdefiniowany za pomocą czterech parametrów: średniej ( ) i odchylenia standardowego ( ) zarówno kontroli pozytywnej (p) jak i negatywnej (n) ( , , i , ). Biorąc pod uwagę te wartości, współczynnik Z definiuje się jako:
W praktyce współczynnik Z jest szacowany na podstawie średnich próbek i odchyleń standardowych próbki
Interpretacja
Następujące interpretacje współczynnika Z pochodzą z:
Współczynnik Z | Interpretacja |
---|---|
1,0 | Ideał. Współczynniki Z nigdy nie mogą przekroczyć 1. |
od 0,5 do 1,0 | Doskonały test. Zauważ, że jeśli , 0.5 jest równoznaczne z oddzieleniem 12 standardowych odchyleń między a . |
od 0 do 0,5 | Test marginalny. |
mniej niż 0 | Zbyt duże nakładanie się kontroli pozytywnych i negatywnych, aby test był użyteczny. |
Należy zauważyć, że według standardów wielu rodzajów eksperymentów zerowy współczynnik Z sugerowałby duży rozmiar efektu, a nie graniczny bezużyteczny wynik, jak sugerowano powyżej. Na przykład, jeśli σ p = σ n =1, to μ p =6 i μ n =0 dają zerowy współczynnik Z. Jednak dla normalnie rozproszonych danych z tych parametrów, prawdopodobieństwo tego, że wartość dodatnia kontrola będzie mniejsza niż wartość ujemna kontrola jest mniejsza niż 1 na 10 5 . W badaniach przesiewowych o wysokiej przepustowości stosuje się ekstremalny konserwatyzm ze względu na dużą liczbę wykonywanych testów.
Ograniczenia
Stały współczynnik 3 w definicji współczynnika Z jest motywowany rozkładem normalnym , dla którego ponad 99% wartości występuje w granicach 3 odchyleń standardowych średniej. Jeżeli dane mają rozkład zdecydowanie odbiegający od normalnego, punkty odniesienia (np. znaczenie wartości ujemnej) mogą wprowadzać w błąd. Inną kwestią jest to, że zwykłe oszacowania średniej i odchylenia standardowego nie są solidne ; w związku z tym wielu użytkowników w społeczności zajmującej się badaniami przesiewowymi o wysokiej przepustowości preferuje „Solidną liczbę pierwszą Z”, która zastępuje średnią średnią i medianę bezwzględnego odchylenia dla odchylenia standardowego. Ekstremalne wartości (wartości odstające) w kontrolach dodatnich lub ujemnych mogą niekorzystnie wpływać na współczynnik Z, potencjalnie prowadząc do pozornie niekorzystnego współczynnika Z, nawet jeśli test wypadłby dobrze w rzeczywistych badaniach przesiewowych. Ponadto zastosowanie pojedynczego kryterium opartego na współczynniku Z do dwóch lub więcej kontroli pozytywnych o różnej mocy w tym samym teście będzie prowadzić do mylących wyników . Znak bezwzględny w współczynniku Z sprawia, że niewygodne jest matematyczne wyprowadzenie statystycznego wnioskowania współczynnika Z. Niedawno zaproponowany parametr statystyczny, ściśle standaryzowana średnia różnica ( SSMD ), może rozwiązać te problemy. Jedno oszacowanie SSMD jest odporne na wartości odstające.
Zobacz też
Bibliografia
Dalsza lektura
- Kraybill, B. (2005) „Ilościowa ocena i optymalizacja testu” (notatka niepublikowana)
- Zhang XHD (2011) „Optymalne badania przesiewowe o wysokiej przepustowości: praktyczne projektowanie eksperymentów i analiza danych dla badań RNAi w skali genomu, Cambridge University Press”