Marcels 2004 (10 martie 2004)
Aici te duci.
Veţi găsi datele pentru toate batters pentru anul 2001 până în 2003. Acest lucru este pur şi simplu un extras din datele pe care le puteţi obţine de la PB Lahman sau baseball-databank.org. Am scos toate ulcioare din lista de batters.
Am, de asemenea, din 2004 Marcels. Acestea au fost calculate folosind următorul proces:
1 - Greutate fiecare sezon ca 5/4/3. 2003 contează ca "5" şi 2001, contează ca "3".
2 - Determinarea medie, fiecare jucător liga. Am scos toate totalurile ulcioare ", lovind de la medie liga. Am lumped în AL şi NL împreună. Am medie ponderată a jucatorului liga prin intermediul procesului de 5/4/3 şi care este AP jucatorului pentru acel sezon. Apoi am fortat, în medie, liga acel jucator sa vina in la un total de 1200 CP pentru fiecare jucător (2 greutati x 600 CP). Aceasta este de regresie spre componenta medie.
3 - Adăugaţi două de mai sus.
4 - Determinarea proiectat AP = 0,5 * 2004PA + 0,1 * 2003PA + 200. Eu iau rezultatul # 3, şi de tarife se la această AP proiectate.
5 - determina o ajustare de vârstă. Varsta = 2004 - yearofbirth. În cazul în care peste 29, AgeAdj = (vârsta - 29) * 0.003. Dacă sub 29, AgeAdj = (vârsta - 29) * 0.006. Aplicaţi această ajustare de vârstă la rezultatul # 4.
6 - Rebaseline rezultatelor faţă de o medie liga asumat din 2003.
Am * nu * verificat numerele mele. Dacă doriţi să-l compara cu fermoare şi PECOTA, nu ezitaţi. Orice rookie 2004 cu nici o experienţă MLB va proiecta la media liga.
Va rugam sa faceti un comentariu doar că numerele sunt greşite, dacă aveţi fie:
a - trecut prin acest proces pas-cu-pas şi au verificat o problemă
b - a comparat rezultatele cu cele ale Marcel, PECOTA, DMB, etc fermoare şi că numerele de Marcel sunt în mod sistematic în afara
Orice eroare aş fi făcut ar fi evidente pentru toţi jucătorii.
I ar putea fi capabil să facă pitchers săptămâna viitoare.
Notă: Eu nu stau în spatele acestor previziuni. Aceste previziuni sunt nivelul minim de competenţă pe care trebuie să vă aşteptaţi de la orice prognoza. Nu ataşaţi numele meu acestor previziuni, în nici un fel de experiment de evaluare. Ei trebuie să fie doar mentionat ca Marcel Sistemul de Prognoza Maimuta, sau pur şi simplu Marcels.
- Postat de TangoTiger la 02:27 EDT
Postat 14:52, 10 martie, 2004 (# 2) - Rob S ( e-mail )
Multumesc Tango.
Postat 14:52, 10 martie, 2004 (# 3) - tangotiger
Am uitat despre asta. Am folosit BDB. Voi actualiza că una. Voi posta un fişier revizuit, vineri, în cazul în care există alte modificări necesare.
Postat 02:56, 10 martie, 2004 (# 4) - tangotiger
Hmmm... mulţumesc Charlie. Văd că am un bug la ajustări de varsta mea. Am împărţit în cazul în care aş-au înmulţit, şi sa înmulţit în cazul în care ar fi trebuit sa divizat. Acest lucru este valabil pentru toţi jucătorii.
Dă-mi 5 minute, şi voi Reupload totul.
Postat 03:02, 10 martie, 2004 (# 5) - tangotiger
Ok, cea mai recentă versiune este de până. Ştii că ai luat cea mai recentă versiune în cazul în care Sori este prezentat cu o varsta de 28. Am vârsta Soriano dintr-o YOB din 1978 până în 1976. Dacă cineva a anului corectă a naşterii, lasă-mă să ştiu.
Postat 15:35, 10 martie, 2004 (# 6) - Bob Mong
Doar pentru a clarifica: Nu ati facut nici ajustări parc, la orice punct în calcule, corect?
Postat 03:42, 10 martie, 2004 (# 7) - tangotiger
Incorect. Am făcut doar şi exact ceea ce am enumerat mai sus. Ar trebui să fie posibil pentru cineva să verifice independent rezultatele mele folosind doar 2001-2003 datele din tabelul de loviturile, şi tabelul master (de la BDB sau Lahman).
Luaţi în considerare acest lucru pentru a fi un exercitiu bun pentru cei care doresc să îmbunătăţească accesul lor / Solicitare / competenţe SQL.
***
Sunt de acord că ajustările parc, "profil" ajustări (cum ar fi puternic, rapid, inteligent, înalt, slab, atletic etc,) ar fi necesare pentru a îmbunătăţi fiabilitatea.
Postat 04:22, 10 martie, 2004 (# 8) - tangotiger
Am adăugat o altă coloană numită "fiabilitate". Asta arată cât de mult a prognoza se bazează pe performanţa sa, şi cât de mult a fost de regresie spre medie.
Bobby Abreu arată o.87. Asta înseamnă că am regresat faţă de medie de 13%. Folosind că, ar trebui să fie destul de uşor să dau seama un interval de încredere pentru fiecare dintre statistici. Dacă aş arăta o fiabilitate de 0.00, aceasta înseamnă că este o ghici absolut pură din partea mea.
Postat 16:45, 10 martie, 2004 (# 9) - Stephen
Multumesc, Tango! Mi-ar plăcea să pună aceste în Excel, dar nu sunt sigur cum să le formatul corect. Ceva despre text la coloane...
Orice ajutor ar fi apreciat foarte mult.
Postat 04:54, 10 martie, 2004 (# 10) - tangotiger
Hmmmm.... deoarece acestea sunt fişiere CSV, Excel ar trebui să-l interpreta în mod automat pentru dumneavoastră în mod corespunzător. Când vedeţi linkul din dosar, nu un "clic dreapta" si "save target as". Apoi, deschide Excel, şi de la Excel, deschideţi acest fişier csv. Excel ar trebui să-l interpreta în mod automat pentru tine.
Dacă Excel nu, procedaţi astfel:
- Date / Text în coloane
- Selectaţi Delimitat
- Faceţi clic pe Virgulă şi a stabilit calificativul Text de nici unul
- Faceţi clic pe Finish
Postat 05:11, 10 martie, 2004 (# 11) - Stephen
Minunat, multumesc din nou, Tango. A funcţionat perfect.
Postat 05:32, 10 martie, 2004 (# 12) - serii mari
Sunt de acord muncă avantajos - am luat deja lovind clasament de echipa din liga a ol ". Da.
Postat 09:43, 11 martie, 2004 (# 13) - Rob S ( e-mail )
Marcel nu se loveşte doar proiecţii?
Sau exista un alt critter prietenos, care nu pitching quesstimates?
Postat 11:39, 11 martie, 2004 (# 14) - Bob Mong ( pagina de start )
Postat 15:35, 10 martie, 2004 (# 6) - Bob Mong
Doar pentru a clarifica: Nu ati facut nici ajustări parc, la orice punct în calcule, corect?
Postat 03:42, 10 martie, 2004 (# 7) - tangotiger
Incorect. Am făcut doar şi exact ceea ce am enumerat mai sus.
Am adus doar asta deoarece aceasta va afecta previziunile pentru unii jucători mai mult decât altele - şi anume, jucătorii care merg din ulcioare "Parcuri de la hitters" parcuri sau invers. Ca şi Alex Rodriguez, Alfonso Soriano, nimeni vin sau se îndreaptă spre Colorado, etc doar ceva de a păstra în minte.
Postat 12:57, 11 martie, 2004 (# 15) - tangotiger
Convenit.
Intenţia mea este doar de a face ceea ce ar face o maimuta: cel mai simplu posibil prognozele: foloseste ultimii 3 ani de date ponderate, de regresie, şi de vârstă.
(Nu ezitaţi să echivoc că această maimuţă este prea destept pentru o maimuţă.)
Postat 05:29, 11 martie, 2004 (# 16) - David Smyth
---"( Simţiţi-vă liber să echivoc că această maimuţă este prea destept pentru o maimuţă.) "
Ei bine, ai face acest punct în glumă uşoară, şi numele meu mijlociu este echivoc, dar...
Da. Desemnarea maimuta poarta implicarea populară de "dezordine". Ar fi o prostie să facă predicţii aleatoare de baseball, astfel încât următorul pas în sus ar fi performanţa de anul trecut. Folosind vârstă, mai mulţi ani, de ponderare, şi mai ales de regresie nu este într-adevăr aşa de bază. De fapt, mă aştept ca unele previziuni publicat nu mai puţin...
Nimic în neregulă cu ceea ce faci - doar o alegere proastă terminologie.
Postat 18:36, 11 martie, 2004 (# 17) - tangotiger
Nu, e la fel ca bursa de valori. Pretul actiunilor se bazează pe toate informaţiile cunoscute. Ce preţ va fi în 1 an este, pentru toate intenţiile şi scopurile, aleatoare. O maimuţă cules un stoc de îmbunătăţire a este ca o maimuţă cules un jucător să funcţioneze mai bine decât previziunile lui Marcel.
Postat 07:39, 11 martie, 2004 (# 18) - David Smyth
Bine atunci, Tango, iau totul înapoi. :-)
Postat 10:09, 12 martie, 2004 (# 19) - Nod Narb
5 - determina o ajustare de vârstă. Varsta = 2004 - yearofbirth. În cazul în care peste 29, AgeAdj = (vârsta - 29) * 0.003. Dacă sub 29, AgeAdj = (vârsta - 29) * 0.006. Aplicaţi această ajustare de vârstă la rezultatul # 4.
Am citit acest drept? Cei peste 29 sunt de aşteptat pentru a îmbunătăţi şi a celor sub 29 sunt de aşteptat să scadă? Nu ar trebui să fie (29 - vârsta)?
Postat 10:23, 12 martie, 2004 (# 20) - tangotiger
Mda, ar trebui să fie 29 - vârsta. Acesta a fost bug am raportat în post # 4.
[A apărut o eroare în timpul procesării prezentei directive] Posted 12:51, 13 martie, 2004 (# 22) - tangotiger ( e-mail )
Dacă se întreabă dacă există ceva din lucrurile banale pe care o fac că aş dori să ia de pe farfuria mea (cum ar fi actualizarea fişierul Echipa Previews, sau dosarul meu Index Primate, sau formatare fişier MGL lui superLWTS [nu am timp pentru că unul], etc), sigur! Dacă asta e ceea ce doriţi să faceţi, atunci e-mail-mă.
Postat 16:20, 13 martie, 2004 (# 23) - Snowboy
Vă mulţumim pentru munca, Tango.
Îmi pare rău să se concentreze pe un singur jucător din 839, pentru că ştiu că nu e ceea ce vrei tu sa auzi. Dar ce se întâmplă cu Carlos Beltran?
3YrAvg Marcel
Execută 107 91
HR 26 22
RBI 102 87
SB 35 27
580 CP nu este o problemă. Nu pot să găsiţi o eroare (de exemplu, alte Royals arata bine, numerele sale sunt toate acolo, în dosarul 01-03, numere de Adrian Beltre uităm rezonabil). Dar ceva nu se uita dreapta? Ce Marcel vedea că eu nu pot? Marcel este speriat de doar 14 camere duble in 2003?
Postat 04:22, 13 martie, 2004 (# 24) - Snowboy
Oh, şi raţiunea # 281 a utiliza propriul creier, şi nu trăiesc doar de Marcel singur: previzibilă în HR de Jason Tyner = 3.
Dar, din nou, mulţumesc Tango.
Postat 04:14, 15 martie, 2004 (# 25) - tangotiger
Ok, să ne uităm la vremea Carlos Beltran de resurse umane.
De la 01 la 03:
HR: 24, 29, 26
PA: 680, 722, 602
lgHR / PA: 0.0300, 0.0279, 0.0285
***
Ponderare sa numere la un nivel 3/4/5, si avem:
HR: 318
PA: 7938
Numerele de liga ar fi:
0.0300 x680x3, x722x4 0.0279, 0.0285 x602x5 = 228. Asta e liga medie HR pentru Beltran lui 7938 AP. Setaţi această AP la 1200, şi ne-am 34.4 liga HR.
***
HR: 318 + 34,4 = 352,4
PA: 7938 + 1200 = 9138
Sau, HR / CP = = 0.0386 352.4/9138
Acestea sunt ratele de aşteptat lui Beltran
***
Suntem proiectarea Beltran la:
PA = 602 *. 5 + 722 *. 1 + 200 = 573 CP
***
PA 573 x 0.0386 HR / CP = 22 HR
***
Beltran este de 27, astfel încât ajustarea vârstă are aproape nici un impact.
***
A se vedea, chestia aia cu Beltran este că el a avut un număr enorm de AP în 2001/2002. AP proiectat pentru anul 2004 este puternic influenţat de AP său în 2003 (corect sau incorect).
Numărul său de medie simplă a AP în perioada 2001-2003 este de 668 AP, sau aproape 100 mai mult decât AP l-am proiectat pentru. Dă-i în cele 4 ÎR număr de AP, şi va ajunge la 26. Şi asta se potriveşte medie lui.
Postat 01:10, 16 martie, 2004 (# 26) - Miko
Am o întrebare în legătură cu ajustările de vârstă în cadrul sistemului.
Dacă unul se aplică în vârstă de ajustare la toate componentele (în proporţie de a proiectat AP), nu are acest rezultat în nudging statistici de numărare în sus sau în jos, lăsând statistici rezultă rata de neschimbat?
Dacă acesta este cazul, atunci sunt imbunatatiri / refuză din cauza vârstei, mai mult sau mai puţin luate în grijă de medie ponderată? Sau este doar faptul că sistemul este ca este suficient de precisă, având în vedere uşurinţa relativă a rezultatelor calcul?
Postat 11:44, 16 martie, 2004 (# 27) - tangotiger
Pentru tot, cu excepţia PA şi AB.
Eu de fapt, trebuie să stabilească faptul că... ar trebui să fie RATELE relativ la bataie departajare (AB-H), şi nu pe PA.
Postat 12:33, 22 martie, 2004 (# 28) - tangotiger
Ok, am terminat în 2004 Marcels pentru pitching. FTP este în prezent în jos, aşa că va trebui să aştepte până la care se deschide în sus.
Prin urmare, procesul de exact aceleaşi ca Marcels pentru bataie. Aici sunt datele care sunt diferite (pe care le puteţi conformitate cu partea de sus a acestui fir).
1 - Greutăţile sunt 3/2/1.
2 - Removed nonpitchers pitching de totaluri (de exemplu, Wade Boggs ca un ulcior.)
3 - aceeaşi
4 - folosit IP in loc de AP. Schimbarea "200" la 25 de relievers şi 60 pentru începători (sau ceva în între part-time pentru început pe GS / G).
5 - Same
6 - Same
Acum, am nevoie pentru a face o modificare final. Pitchers în Ţările de Jos au un avantaj 0.2 sau 0.3 ERA (şi mari-time avantaj K) peste omologii lor din AL (din cauza DH). Pentru a face previziuni mai bune, am nevoie să ştiu dacă aruncător este în prezent în AL sau NL. Chiar acum, am catalogheaza pe toţi în aceeaşi ligă.
Dacă cineva vrea să mă ajute, sa descarcati fisiere (dupa ce le-am posta), şi trimite-mi un fişier CSV de toate pitcherid şi ligile lor.
Dacă nu primesc nici factorii pentru aceasta, voi re-posta fisierele cu marcaje mea de liga a unui jucător actuale: Liga ultima tăbărât inch nu am dornici de a merge prin fiecare ulcior manual ulterior, cum ar fi Clemens şi Vazquez. Marcels va trebui doar să fie un pic off cu privire la aceste.
De asemenea, am adaugat o categorie numită bsrER, care este "componenta" ER, bazat pe BaseRuns. Coloana ERA este un 50/50 între coloana de MEC şi coloanele bsrER.
Asta este...
Postat 16:44, 22 martie, 2004 (# 29) - tangotiger
Ok, toate sunt acolo acum! Pentru ulcioare, am folosit "liga ultima tăbărât în" ca bază. Deci, pentru tipi ca Vazquez si Clemens, va trebui să se adapteze mental le uşor. În ultimii 3 ani, în ERA AL 0.25 a fost mai mare decât în NL.
Pe 9 IP, ratele de resurse umane sunt similare. 0,5 K mai mult şi mai mult în BB 0.2 NL. Asta e un fel de ciudat. Aş aştepta mai mult, deoarece K: bataie ulcioarele şi HR mai permis. Aş aştepta mai mult, deoarece BB: mai mult K şi HR. Aş aştepta BB mai putine, deoarece: ulcioare bataie. Sunt surprins de faptul că rata de BB a crescut la fel de mult cum a făcut-o.
Dacă am face orice modificări, acesta va fi înainte de Ziua de deschidere. După aceea, asta este.
Postat 16:45, 22 martie, 2004 (# 30) - tangotiger
BTW, pentru W / L, fii atent! Ai nevoie să se uite nu mai departe decât Javier Vazquez pentru a vedea cum este inutil.
Postat 17:45, 22 martie, 2004 (# 31) - studes ( pagina de start )
Loc de muncă mare, Tango. Intrebare: te-ai gândit de a lua o FIP / golurilor abordare a cabrare statistici? Sau ar regresie la medie avea grijă de faptul că, în teorie?
Postat 15:23, 23 martie, 2004 (# 32) - tangotiger
Din moment ce sunt după ERA ulcior lui, care include hit-uri permise de fielders său. FIP / goluri nu s-ar aplica aici.
***
Am adaugat un fisier numit: jtoMarcel.zip. Aceasta conţine o bază de date Access 2000 pentru Marcel pentru anul 2001 până în 2003. Programul meu este acum de configurare pentru a genera Marcels pentru orice an din istorie. (Este nevoie de aproximativ 2 minute pentru a genera datele pentru fiecare an.) Nu acum, dar în cele din urmă, eu le-ar putea genera pentru fiecare an. Ar putea fi util ca o modalitate de a îmbunătăţi alte meteorologii motoarele lor.
Postat 07:13, 25 martie, 2004 (# 33) - studes ( pagina de start )
Mă gândeam că o abordare PIF / golurilor este o modalitate mai buna de a prezice ERA decât folosind ERA ultimii trei an. Scoateţi BABIP în ultimii trei ani, mediu şi de regres rezultatul dvs., şi apoi adăugaţi-le înapoi inch
Postat 09:52, 25 martie, 2004 (# 34) - tangotiger
Cea mai bună modalitate ar fi o combinaţie de:
- ERA trecut
- ERA componenta (BaseRuns)
- Goluri / FIP