Sabermetrics 101: Introduction to Baseball Analytics

Jeg tog dette kursus for at genopfriske min SQL og lære R på en engagerende måde. Fordelene har nemt opvejet ulemperne for mig, men jeg gik mere i detaljer for mine ulemper, så du kan få en forståelse for de faldgruber, du skal passe på, og de dele af programmet kan bruge forbedring.
**fordele**
– Baseballaspektet af analysen gør det let at glemme, at man er ved at lære nyttig analyse. Selv en forbigående sportsfan kan se potentialet i analysen, og hvordan data kan føre ned ad en sjov sti med vigtige svar, som fører til yderligere spørgsmål og teorier, der kan afprøves.
– Vækkede min interesse for baseball
– Uden at vide at fremhæve det, lærer kurset dig forskellige
andre aspekter af dataanalyse, der er direkte relateret til mindre interessante emner, som du kan dække i et job.
**Ulemper**
– SQL Sandbox er blevet deaktiveret, så du er nødt til at downloade MySQL (eller, hvis du vil, SQL Server) for at gennemføre aktiviteterne
– Kursets vægt på MySQL. Jeg bruger Microsofts SQL Server til mit arbejde, og derfor brugte jeg det samme til dette kursus. For det første er Lahman Database upload baseret på MySQL filer. De er ikke let kompatible med SQL Server fandt jeg ud af. Efter flere frustrerende timer med at forsøge at portere MySQL-tabeller til SQL Server, gik en pære op i mit hoved. Jeg downloadede Microsoft Access-versionen af Lahman-databasen og brugte derefter SQL Server’s evne til at konvertere Microsoft Access-tabeller til SQL Server-tabeller (jeg brugte SQL Server Express 2014 fyi, men det kan også fungere for ældre versioner)
– Hen imod det 3.-4. modul begyndte TA’en at ringe. Ikke alle, men nogle spørgsmål begynder at blive formuleret på en forvirrende måde. Der er også 1-2 tilfælde, hvor der stilles et spørgsmål baseret på viden, der ikke afsløres i en efterfølgende video … meget frustrerende, når man ikke forstår et emne, for så senere at finde ud af, at der ikke var nogen måde at kende svaret på baseret på det, man har lært indtil nu. FWIW, der er en diskussionsdel på siden, og så hvis jeg var stumped på et spørgsmål, kan jeg kigge på diskussionsafsnittet, og chancerne er, at flere mennesker, der tog kurset, da det først blev tilbudt, også havde problemer og gav udtryk for det i diskussionsafsnittet.
Overordnet set er jeg omkring 70% færdig i øjeblikket. En anden glimrende ressource for dem, der er interesseret i at lære R på en sjov måde, er at tjekke pakken “swirl” i R. Det er et interaktivt program, der lærer dig forskellige facetter af R på en interaktiv måde inden for R. Det officielle websted for pakken er swirlstats.com

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.