Współczynnik Z - Z-factor

Współczynnik Z jest miarą wielkości efektu statystycznego . Zaproponowano go do stosowania w wysokowydajnych badaniach przesiewowych (gdzie jest również znany jako Z-prime) i powszechnie zapisywany jako Z', aby ocenić, czy odpowiedź w konkretnym teście jest wystarczająco duża, aby uzasadnić dalszą uwagę.

Tło

Na ekranach o wysokiej przepustowości eksperymentatorzy często porównują dużą liczbę (setki tysięcy do dziesiątek milionów) pojedynczych pomiarów nieznanych próbek z próbkami kontroli pozytywnej i negatywnej . Szczególny wybór warunków eksperymentalnych i pomiarów nazywa się testem. Duże ekrany są drogie pod względem czasu i zasobów. Dlatego przed rozpoczęciem dużego badania przesiewowego stosuje się mniejsze ekrany testowe (lub pilotażowe), aby ocenić jakość testu, próbując przewidzieć, czy będzie on użyteczny w warunkach wysokiej przepustowości. Współczynnik Z jest próbą ilościowego określenia przydatności konkretnego testu do zastosowania w pełnoskalowym, wysokowydajnym badaniu przesiewowym.

Definicja

Współczynnik Z jest zdefiniowany za pomocą czterech parametrów: średniej ( ) i odchylenia standardowego ( ) zarówno kontroli pozytywnej (p) jak i negatywnej (n) ( , , i , ). Biorąc pod uwagę te wartości, współczynnik Z definiuje się jako:

W praktyce współczynnik Z jest szacowany na podstawie średnich próbek i odchyleń standardowych próbki

Interpretacja

Następujące interpretacje współczynnika Z pochodzą z:

Współczynnik Z Interpretacja
1,0 Ideał. Współczynniki Z nigdy nie mogą przekroczyć 1.
od 0,5 do 1,0 Doskonały test. Zauważ, że jeśli , 0.5 jest równoznaczne z oddzieleniem 12 standardowych odchyleń między a .
od 0 do 0,5 Test marginalny.
mniej niż 0 Zbyt duże nakładanie się kontroli pozytywnych i negatywnych, aby test był użyteczny.

Należy zauważyć, że według standardów wielu rodzajów eksperymentów zerowy współczynnik Z sugerowałby duży rozmiar efektu, a nie graniczny bezużyteczny wynik, jak sugerowano powyżej. Na przykład, jeśli σ p = σ n =1, to μ p =6 i μ n =0 dają zerowy współczynnik Z. Jednak dla normalnie rozproszonych danych z tych parametrów, prawdopodobieństwo tego, że wartość dodatnia kontrola będzie mniejsza niż wartość ujemna kontrola jest mniejsza niż 1 na 10 5 . W badaniach przesiewowych o wysokiej przepustowości stosuje się ekstremalny konserwatyzm ze względu na dużą liczbę wykonywanych testów.

Ograniczenia

Stały współczynnik 3 w definicji współczynnika Z jest motywowany rozkładem normalnym , dla którego ponad 99% wartości występuje w granicach 3 odchyleń standardowych średniej. Jeżeli dane mają rozkład zdecydowanie odbiegający od normalnego, punkty odniesienia (np. znaczenie wartości ujemnej) mogą wprowadzać w błąd. Inną kwestią jest to, że zwykłe oszacowania średniej i odchylenia standardowego nie są solidne ; w związku z tym wielu użytkowników w społeczności zajmującej się badaniami przesiewowymi o wysokiej przepustowości preferuje „Solidną liczbę pierwszą Z”, która zastępuje średnią średnią i medianę bezwzględnego odchylenia dla odchylenia standardowego. Ekstremalne wartości (wartości odstające) w kontrolach dodatnich lub ujemnych mogą niekorzystnie wpływać na współczynnik Z, potencjalnie prowadząc do pozornie niekorzystnego współczynnika Z, nawet jeśli test wypadłby dobrze w rzeczywistych badaniach przesiewowych. Ponadto zastosowanie pojedynczego kryterium opartego na współczynniku Z do dwóch lub więcej kontroli pozytywnych o różnej mocy w tym samym teście będzie prowadzić do mylących wyników . Znak bezwzględny w współczynniku Z sprawia, że ​​niewygodne jest matematyczne wyprowadzenie statystycznego wnioskowania współczynnika Z. Niedawno zaproponowany parametr statystyczny, ściśle standaryzowana średnia różnica ( SSMD ), może rozwiązać te problemy. Jedno oszacowanie SSMD jest odporne na wartości odstające.

Zobacz też

Bibliografia

Dalsza lektura