Współczynnik Z - Z-factor

Współczynnik Z jest miarą wielkości efektu statystycznego . Zaproponowano go do stosowania w wysokowydajnych badaniach przesiewowych (gdzie jest również znany jako Z-prime) i powszechnie zapisywany jako Z', aby ocenić, czy odpowiedź w konkretnym teście jest wystarczająco duża, aby uzasadnić dalszą uwagę.

Tło

Na ekranach o wysokiej przepustowości eksperymentatorzy często porównują dużą liczbę (setki tysięcy do dziesiątek milionów) pojedynczych pomiarów nieznanych próbek z próbkami kontroli pozytywnej i negatywnej . Szczególny wybór warunków eksperymentalnych i pomiarów nazywa się testem. Duże ekrany są drogie pod względem czasu i zasobów. Dlatego przed rozpoczęciem dużego badania przesiewowego stosuje się mniejsze ekrany testowe (lub pilotażowe), aby ocenić jakość testu, próbując przewidzieć, czy będzie on użyteczny w warunkach wysokiej przepustowości. Współczynnik Z jest próbą ilościowego określenia przydatności konkretnego testu do zastosowania w pełnoskalowym, wysokowydajnym badaniu przesiewowym.

Definicja

Współczynnik Z jest zdefiniowany za pomocą czterech parametrów: średniej ( ) i odchylenia standardowego ( ) zarówno kontroli pozytywnej (p) jak i negatywnej (n) ( , , i , ). Biorąc pod uwagę te wartości, współczynnik Z definiuje się jako: ${\ Displaystyle \ mu}$ $\sigma$ ${\ Displaystyle \ mu _ {p}}$ $\sigma_{p}$ ${\ Displaystyle \ mu _ {n}}$ ${\ Displaystyle \ sigma _ {n}}$

{\ Displaystyle {\ tekst {współczynnik Z}} = 1 - {3 (\ sigma _ {p} + \ sigma _ {n}) \ ponad | \ mu _ {p} - \ mu _ {n} |} }

W praktyce współczynnik Z jest szacowany na podstawie średnich próbek i odchyleń standardowych próbki

{\ Displaystyle {\ tekst {Szacowany współczynnik Z}} = 1 - {3 ({\ kapelusz {\ sigma}} _ {p} + {\ kapelusz {\ sigma}} _ {n}) \ ponad | {\ kapelusz {\mu }}_{p}-{\kapelusz {\mu }}_{n}|}}

Interpretacja

Następujące interpretacje współczynnika Z pochodzą z:

Współczynnik Z	Interpretacja
1,0	Ideał. Współczynniki Z nigdy nie mogą przekroczyć 1.
od 0,5 do 1,0	Doskonały test. Zauważ, że jeśli , 0.5 jest równoznaczne z oddzieleniem 12 standardowych odchyleń między a . ${\ Displaystyle \ sigma _ {p} = \ sigma _ {n}}$ ${\ Displaystyle \ mu _ {p}}$ ${\ Displaystyle \ mu _ {n}}$
od 0 do 0,5	Test marginalny.
mniej niż 0	Zbyt duże nakładanie się kontroli pozytywnych i negatywnych, aby test był użyteczny.

Należy zauważyć, że według standardów wielu rodzajów eksperymentów zerowy współczynnik Z sugerowałby duży rozmiar efektu, a nie graniczny bezużyteczny wynik, jak sugerowano powyżej. Na przykład, jeśli σ _p = σ _n =1, to μ _p =6 i μ _n =0 dają zerowy współczynnik Z. Jednak dla normalnie rozproszonych danych z tych parametrów, prawdopodobieństwo tego, że wartość dodatnia kontrola będzie mniejsza niż wartość ujemna kontrola jest mniejsza niż 1 na 10 ⁵ . W badaniach przesiewowych o wysokiej przepustowości stosuje się ekstremalny konserwatyzm ze względu na dużą liczbę wykonywanych testów.

Ograniczenia

Stały współczynnik 3 w definicji współczynnika Z jest motywowany rozkładem normalnym , dla którego ponad 99% wartości występuje w granicach 3 odchyleń standardowych średniej. Jeżeli dane mają rozkład zdecydowanie odbiegający od normalnego, punkty odniesienia (np. znaczenie wartości ujemnej) mogą wprowadzać w błąd. Inną kwestią jest to, że zwykłe oszacowania średniej i odchylenia standardowego nie są solidne ; w związku z tym wielu użytkowników w społeczności zajmującej się badaniami przesiewowymi o wysokiej przepustowości preferuje „Solidną liczbę pierwszą Z”, która zastępuje średnią średnią i medianę bezwzględnego odchylenia dla odchylenia standardowego. Ekstremalne wartości (wartości odstające) w kontrolach dodatnich lub ujemnych mogą niekorzystnie wpływać na współczynnik Z, potencjalnie prowadząc do pozornie niekorzystnego współczynnika Z, nawet jeśli test wypadłby dobrze w rzeczywistych badaniach przesiewowych. Ponadto zastosowanie pojedynczego kryterium opartego na współczynniku Z do dwóch lub więcej kontroli pozytywnych o różnej mocy w tym samym teście będzie prowadzić do mylących wyników . Znak bezwzględny w współczynniku Z sprawia, że niewygodne jest matematyczne wyprowadzenie statystycznego wnioskowania współczynnika Z. Niedawno zaproponowany parametr statystyczny, ściśle standaryzowana średnia różnica ( SSMD ), może rozwiązać te problemy. Jedno oszacowanie SSMD jest odporne na wartości odstające.

Zobacz też

Bibliografia

Dalsza lektura

Kraybill, B. (2005) „Ilościowa ocena i optymalizacja testu” (notatka niepublikowana)
Zhang XHD (2011) „Optymalne badania przesiewowe o wysokiej przepustowości: praktyczne projektowanie eksperymentów i analiza danych dla badań RNAi w skali genomu, Cambridge University Press”

Languages

In other projects