Sa presupunem ca s-au spus ca atunci cand un grup de subiecti cu valori mici la unele de masurare este mai tarziu reevaluate, valoarea medie a acestora va creste, fara a folosi nici un tratament sau de interventie. Vrei acest lucru va faceti griji? Este sigur ca a avut mai bine!
Daca acest lucru ar fi adevarat si un tratament ineficient au fost aplicate intr-un astfel de grup, cresterea ar putea fi interpretate in mod necorespunzator ca un efect al tratamentului. Acest lucru ar putea duce la punerea in aplicare a programelor costisitoare ineficiente sau politici publice care defecte bloca dezvoltarea de solutii reale pentru problema care a fost menit sa fie abordate.
Comportamentul descris in primul paragraf este real. Este numit efectul de regresie. Din pacate, interpretarea gresita a efectului de regresie descrise in al doilea paragraf este real, de asemenea. Se numeste eroare de regresie.
Efectul de regresie este prezentata grafic si numeric in urmatoarea serie de terenuri si a productiei de calculator.

(Full Data Set)
PRE POST DIFF
N de cazuri 400 400 400
Medie 118.420 118.407 -0.012
Std. Eroare 1.794 1.718 1.526
Standard Dev 35.879 34.364 30.514
Diferenta medie = -0.012
Diferenta SD = 30.514
t = -0.008 asociat (399 df)
P = 0.994
Terenul prima si bucata de iesire arata un esantion de masuratori pre-test si post-test luate inainte si dupa administrarea unui tratament ineficient. Observatiile nu stau exact pe o linie dreapta, deoarece de masurare nu este in intregime reproductibile. In unele cazuri, o persoana de pre-test de masurare va fi mai mare decat masurarea post-test, in alte cazuri de masurare post-test va fi mai mare. Aici, mijloacele de pre-si post-test sunt 118; deviatiile standard sunt 35. Diferenta medie este 0, iar testul t pentru egalitatea de mijloace populatiei da o valoare de 0.994 P. Nu exista nici o schimbare in medie sau SD-a lungul timpului.

(Observatii cu PRE <= 120)
PRE POST DIFF
N de cazuri 201 201 201
Medie 90.029 100.503 10.474
Std. Eroare 1.580 1.844 1.930
Standard Dev 22.394 26.140 27.358
Diferenta medie = 10.474
Diferenta SD = 27.358
pereche t = 5.428 (200 df)
P = <0,001
Terenul a doua si a bucata de productie arata ce se intampla cand post-test masuratorile se efectueaza numai pe cei cu pre-test masuratori mai putin de 120. In complot, observatiile mult mai multe se afla deasupra liniei PRE POST = decat sub ea. De iesire indica faptul ca valoarea medie a pre-test este de 90, in timp ce media post-test este de 100, la circa 10 de unitati mai mari (P <0,001)!

(Observatii cu PRE <= 60)
PRE POST DIFF
N din cazuri 23 23 23
Medie 46.060 76.111 30.050
Std. Eroare 2.733 4.441 4.631
Standard Dev 13.107 21.301 22.209
Diferenta medie = 30.050
Diferenta SD = 22.209
pereche t = 6.489 (22 df)
P = <0,001
Terenul a treia si ultima bucata de iesire arata ceea ce se intampla atunci cand un masuratorile post-test este luata numai pentru cei cu pre-test masuratori mai putin de 60. In complot, cel mai observatiile zac sub linia PRE POST =. De iesire arata ca inseamna pre-test este de 46, in timp ce media post-test este de 76, unele * 30 * de unitati mai mari (P <0,001)!
Acesta este modul in care se comporta un tratament ineficient. Parcele si de iesire a demonstra in mod clar modul in care un analist ar putea fi indus in eroare in interpretarea vigoare regresie ca un efect al tratamentului.
A Closer Look
Efectul de regresie Cauzele unui individ de asteptat post-test de masurare care se incadreaza undeva intre masurare ei pre-test si medie pre-test de masurare. Cei cu foarte mici pre-test de masuratori vor vedea media lor deplasa spre medie globala in timp ce cele cu inalta pre-test de masuratori vor vedea a le muta in jos. Acesta este modul in care a primit numele de regresie - Sir Francis Galton a observat ca fiii lui parintilor inalt tendinta de a fi mai scurte decat parintii lor, in timp ce fiii lui tatilor scurte tind sa fie mai inalt. Fiii "regresat la medie".
Acest lucru se intampla pentru ca exista doua tipuri de oameni cu foarte scazut pre-test masuratori: cei care sunt cu adevarat mici, iar cei cu valori mai mari care stau la baza, dar pare redusa, datorita variatiei aleatoare. Atunci cand post-test masuratorile sunt efectuate, cei care sunt cu adevarat reduse vor avea tendinta sa ramana scazut, dar cei cu scoruri mai mari care stau la baza va tinde sa migreze in sus spre globala medie, glisarea grupului media post-test de masurare cu ei. Un argument similar se aplica pentru cei cu pre-test masuratori mai mare decat media generala.
O alta abordare
O alta modalitate de a obtine o simt pentru efectul de regresie este de a lua in considerare o situatie in care interventia nu are niciun efect, iar pre-test si post-test masuratorile sunt complet necorelate. In cazul in care nu este efectul tratamentului si masuratorile sunt necorelate, atunci cea mai buna estimare a unui subiect post-test de masurare este media generala a pretest masuratorilor. Luati in considerare aceste subiecte a caror pre-test masuratori sunt mai putin decat media globala (cercuri pline). Valoarea medie a acestor subiecti "pre-test de valori trebuie sa fie mai mica decat globale pre-test medie. Cu toate acestea, lor post-test medie va fi egal cu de ansamblu pre-test serios!

(Full Data Set)
PRE POST DIFF
N de cazuri 100 100 100
Medie 100.000 100.000 0.000
Std. Eroare 1.000 1.000 1.414
Standard Dev 10.000 10.000 14.142
Diferenta medie = 0.000
Diferenta SD = 14.142
pereche t = 0.000 (99 df)
P = 1.000
-------------------------------------------------- ---
(Observatii cu PRE <= 100)
PRE POST DIFF
N de cazuri 50 50 50
Medie 92.030 99.966 7.936
Std. Eroare 0.859 1.650 1.761
Standard Dev 6.072 11.666 12.453
Diferenta medie = 7.936
Diferenta SD = 12.453
t = 4.506 (49 df)
P = <0.000
A treia abordare
Atunci cand nu exista nici un efect de interventie sau de tratament, un teren de post-test masuratorile impotriva pre-test masuratori reflecta numai reproductibilitatea masuratorilor. In cazul in care masuratorile sunt perfect reproductibile, observatiile se vor afla pe linia POST = PRE si cea mai buna predictie a unui subiect post-test de masurare va fi de masurare pre-test. La cealalta extrema, in cazul in care nu exista nici o reproductibilitatea, observatiile va afla intr-un nor circulara si cea mai buna predictie a unui subiect post-test de masurare va fi medie a tuturor masuratorilor pre-test. Ecuatia pronosticuri, apoi, este linia de POST = medie (PRE).
In situatii intermediare, in cazul in care exista unele reproductibilitatea, ecuatia de predictie acordate de regresie liniara de post-test privind pre-test se afla intre linia de POST = PRE si orizontala. Aceasta inseamna o persoana post-test de masurare este prevazut sa fie undeva intre masurare lui pre-test si globala medie de pre-test de masurare. Astfel, oricine cu o masuratoare pre-test mai mare decat pretest medie va fi prezis de a avea o oarecum mai mici post-test de masurare, in timp ce oricine cu un pre-test de masurare mai mica de pretest medie va fi prezis de a avea o oarecum mai mare post- incercare de masurare.
Nimic din toate acestea vorbeste impotriva analizei de regresie sau in orice mod anuleaza. Cea mai buna estimare a unui individ post-test de masurare este valoarea medie a masuratorilor post-test pentru cei cu acelasi scor de pre-test. In cazul in care pre-si post-test masuratori sunt necorelate, cea mai buna estimare a unui individ post-test de masurare este valoarea medie a masuratorilor pre-test, indiferent de un individ de pre-test de masurare. Scopul acestei discutii este de a te face constient de modul in care datele se comporta in absenta oricarui efect de tratament, astfel efectul de regresie nu va fi interpretat gresit atunci cand este intalnite in practica.
Schimbarea si Efectul de regresie
In functie de efectul de regresie, cei care au valori extrem de reduse pretest arata cele mai mare crestere in timp ce cei care au valori extrem de ridicate pretest arata cele mai mare scadere. Schimbarea este cel mai pozitiv pentru cei cu valori mai mici pretest si cele mai negative pentru cei cu valori mai mari pretest, ca este, schimbarea este negativ corelata cu pretest valoare.
Eroarea de regresie se produce atunci cand efectul de regresie este confundat cu un efect de tratament real. Eroarea de regresie este de multe ori observat in cazul in care nu exista nici un efect al tratamentului global, determinand anchetatorii de a efectua analize extinse subset. O denaturare tipic este, "In timp ce programul de educatie a produs nici o schimbare generala in aportul de calciu, cele cu nivel scazut initiala a crescut, ulterior, aportul lor in timp ce cei cu consum mai initiala a scazut ulterior aportul lor Recomandam ca program de educatie sa fie continuat si din cauza a demonstrat sale. beneficiu pentru cei cu un nivel scazut. Cu toate acestea, nu ar trebui oferite celor al caror aport este adecvata pentru a incepe cu. " Sau, in cuvintele Fleiss lui, "de interventie o nu a reusit sa efectueze o schimbare puternic sau semnificativa in valoarea medie a lui X fata de valoarea initiala intr-o oarecare timp specificata dupa interventia a fost aplicat, dar o corelatie semnificativa statistic a fost gasit intre valoarea initiala a lui X si schimbare de la valoarea initiala. Astfel, in timp ce eficacitatea A nu poate fi invocata pentru toate persoanele fizice, se poate spune pentru cei care au fost cele mai grave de pe la inceputul. "
O alta varianta populare de regresie eroare apare atunci cand subiectii sunt inrolati intr-un studiu pe baza de o valoare extrema a unor masurare si un tratament eficace este declarata, deoarece masuratorile ulterioare nu sunt la fel de extreme. In mod similar, este falacious sa ia persoanelor fizice cu valori extreme de la instrument de masurare o (cu o frecventa alimentar, spune), le reevalueze folosind un instrument diferit (un record dieta), si sa declare instrumentele care urmeaza sa fie partinitoare fata de celalalt, deoarece al doilea instrument de masuratorile nu sunt la fel de extreme, ca prima. Efectul de regresie garanteaza ca astfel de rezultate trebuie sa fie observate in absenta oricarui efect tratament sau partinire intre instrumente. Pentru a cita Fleiss (p.194), "Studii care incearca sa stabileasca eficacitatea unui nou tratament sau de interventie prin studierea un grup numai, si prin analizarea schimbarilor, fie in grup ca intreg sau intr-un subgrup care a fost initial extrema, sunt inerent eronate. "
In timp ce efectul de regresie este real si complica studiu la subiecti care sunt initial extreme pe variabila rezultat, el nu face astfel de studii imposibila. Randomizare si de control sunt suficiente pentru a compensa pentru aceasta. Luati in considerare un studiu de subiecte selectate pentru masurarea lor unica initial low privind unele masuri (cum ar fi vitamina A de stare), care sunt inscrisi intr-un studiu dieta controlata sa-l ridice. Regresie la medie spune chiar controalelor va afisa o crestere pe parcursul studiului, dar in cazul in care tratamentul este eficient, cresterea va fi mai mare in grupul tratat decat in??controalele.
Onoruri intrebare: Sa presupunem ca un tratament este de asteptat pentru a reduce masuratorile post-test a celor cu inalta pre-test de masuratori si sa mareasca masuratorile post-test a celor cu un nivel scazut de pre-test de masuratori. De exemplu, o baza larga de ingrijire programului de sanatate ar putea fi de asteptat creste in medie greutate la nastere sate unde greutate la nastere a fost prea mica si medie mai mica greutate la nastere si in satele in care a fost prea mare greutate la nastere. Cum s-ar fi distins de regresie la medie?
Raspuns: In cazul in care programul au fost eficace, SD follow-up ar fi mai mica decat initial SD. Atunci cand un tratament este ineficient, distributiile marginale a doua masuratori sunt identice. Daca programul de ingrijire a sanatatii au fost de luare birthweights mai omogen, SD follow-up ar fi mai mica decat initial SD.
Deoarece masuratorile sunt asociate (realizate pe aceleasi teme), testele pentru populatie egal SDD pe baza unor esantioane independente nu pot fi utilizate. Aici, un test de egalitate a SDD initiale si de follow-up este echivalent cu de testare pentru o corelatie de la 0 dintre sumele si diferentele dintre perechi de masurare.