Gegeneraliseerde lineaire modellen - natuurlijk 3600 wrijven. vanaf Open onderwijs, training 3 weken, circa 6 uur per week, Datum 29 november 2023.
Gemengde Berichten / / December 01, 2023
Eén van de voorwaarden voor de toepasbaarheid van conventionele lineaire modellen is de onafhankelijkheid van waarnemingen van elkaar, op basis waarvan het model wordt geselecteerd. In de praktijk zijn er echter vaak situaties waarin de inrichting van de materiaalinzameling zodanig is dat overtreding van deze voorwaarde onvermijdelijk is. Stel je voor dat je hebt besloten een model te bouwen dat de relatie tussen de prestaties van lichamelijke opvoeding en de IQ-testscores van leerlingen beschrijft. Om dit probleem op te lossen, heb je bij verschillende instellingen talloze monsters gemaakt. Is het mogelijk om dergelijke gegevens te combineren in één analyse, opgebouwd volgens het traditionele schema? Natuurlijk niet. Studenten aan elke universiteit kunnen in sommige opzichten op elkaar lijken. Zelfs de aard van de relatie tussen de onderzochte grootheden kan enigszins verschillen. Dit soort gegevens, waarin correlaties tussen groepen bestaan, moeten worden geanalyseerd met behulp van lineaire gemengde modellen. We zullen laten zien dat sommige voorspellers in het model moeten worden opgenomen als zogenaamde “willekeurige factoren”. Je zult leren dat willekeurige factoren hiërarchisch ondergeschikt kunnen zijn. We zullen bespreken hoe dergelijke gemengde modellen kunnen worden gebouwd voor afhankelijke variabelen die verschillende soorten distributies volgen. Daarnaast zullen we laten zien dat het willekeurige deel van het model zelfs nog complexer kan zijn: het kan een component hebben die het gedrag van de variantie modelleert als reactie op de invloed van een covariaat. Aan het einde van de cursus vindt u een project waarin u kunt oefenen met het bouwen van gemengde modellen door een van de verschillende datasets te kiezen. Op basis van de analyse van deze gegevens kun je een rapport maken in de traditie van reproduceerbaar onderzoek.
Universitair hoofddocent, afdeling Zoölogie van ongewervelde dieren, Faculteit Biologie, St. Petersburg State University, Ph.D.
Wetenschappelijke interesses: structuur en dynamiek van mariene benthosgemeenschappen, ruimtelijke schaal, successie, interspecifiek en intraspecifiek biotische interacties, groei en voortplanting van ongewervelde zeedieren, demografische structuur van populaties, micro-evolutie, biostatistiek.
De cursus bestaat uit 4 modules:
1) Inleiding tot gegeneraliseerde lineaire modellen
Met gegeneraliseerde lineaire modellen (GLM's) kunt u het gedrag modelleren van grootheden die geen normale verdeling volgen. Om uw eerste stappen in de wereld van GLM gemakkelijker te maken, zullen we hun structuur analyseren aan de hand van het voorbeeld van GLM voor normaal verdeelde hoeveelheden - op deze manier kunt u parallellen trekken met eenvoudige lineaire modellen. Je leert wat een linkfunctie is, hoe maximale waarschijnlijkheid werkt en hoe je GLM-hypotheses kunt testen met behulp van Wald-tests en waarschijnlijkheidsratio-tests.
2) Probleem met modelselectie
In deze module zullen we het hebben over methodologische kwesties die verband houden met het bouwen van modellen. Een model is een vereenvoudigde weergave van de werkelijkheid, en het kiezen tussen verschillende concurrerende methoden voor een dergelijke vereenvoudiging is een frequente taak voor de analist. In deze module leer je modellen vergelijken aan de hand van informatiecriteria. We zullen de belangrijkste opties voor de analyse bespreken bij het kiezen van modellen en praten over de moeilijkheden die zich voordoen in verband met de verborgen veelheid aan modellen. Ten slotte leren we u de belangrijkste vormen van misbruik van modelselectie (data-fishing, p-hacking) te herkennen.
3) Gegeneraliseerde lineaire modellen voor het tellen van gegevens
In deze module bespreken we basismethoden voor het modelleren van telbare hoeveelheden. Eerst zullen we bespreken waarom conventionele lineaire modellen niet geschikt zijn voor het tellen van gegevens. De eigenschappen van telbare distributies helpen u de verschillen te begrijpen tussen de typen GLM voor telbare gegevens en de kenmerken van hun diagnostiek. U zult de linkfunctie aan het werk zien wanneer u GLM-voorspellingen visualiseert op de schaal van de linkfunctie en op de schaal van de responsvariabele.
4) Gegeneraliseerde lineaire modellen met binaire respons
Soms is het nodig om te simuleren of een bepaalde gebeurtenis heeft plaatsgevonden of niet voetbalteam of verloren, of de patiënt herstelde na de behandeling of niet, of de cliënt zich nu begaf kopen of niet. Conventionele lineaire modellen zijn niet geschikt voor het modelleren van dergelijke binaire gegevens (gebeurtenissen met twee uitkomsten), maar dit kan eenvoudig worden gedaan met behulp van gegeneraliseerde lineaire modellen. In deze module leer je de waarschijnlijkheid van gebeurtenissen te modelleren door deze als odds weer te geven. We zullen bekijken hoe de logitlinkfunctie werkt en hoe GLM-coëfficiënten worden geïnterpreteerd wanneer deze wordt gebruikt. Ten slotte kun je oefenen met het analyseren van gegeneraliseerde lineaire modellen met verschillende distributies door een data-analyseproject te voltooien. De resultaten van deze analyse moeten worden gepresenteerd als een rapport in HTML-formaat, geschreven met rmarkdown/knitr.
• Leer welke vaardigheden nodig zijn om aan de slag te gaan met analytics en Data Science • Leer Excel, SQL, Power BI en Google Data Studio gebruiken om mee te werken data en schrijf je eerste code in Python• Ontvang een stapsgewijze handleiding en leer hoe je het data science-veld betreedt en een rol kiest in Data Science
4,4
1 490 ₽