Wiskunde en machinaal leren voor datawetenschap - cursus RUB 50.040. van SkillFactory, training 5,5 maand, Datum: 13 augustus 2023.
Gemengde Berichten / / November 29, 2023
Je kunt overal ter wereld studeren. Nieuwe modules worden één keer per week geopend. Speciaal ontworpen inhoud en aanvullend materiaal helpen u het onderwerp te begrijpen.
De praktijk bestaat uit drie delen: het uitvoeren van eenvoudige rekenoefeningen; het uitvoeren van op Python gebaseerde oefeningen; het oplossen van levensproblemen op het gebied van data-analyse, forecasting en optimalisatie.
Je communiceert voortdurend met je medestudenten in privé Slack-kanalen. Als u iets niet begrijpt of een taak niet aankunt, helpen wij u dit uit te zoeken.
Aan het einde van de cursus krijgt u een speciale taak waarin u alle vaardigheden die u heeft verworven kunt toepassen en kunt bevestigen dat u de stof met succes heeft geleerd.
Wiskunde cursusprogramma
Deel 1 - Lineaire algebra
- We bestuderen vectoren en soorten matrices
- Bewerkingen leren uitvoeren op matrices
- Bepalen van lineaire afhankelijkheid met behulp van matrices
- We bestuderen inverse, enkelvoudige en niet-singuliere matrices
- We bestuderen systemen van lineaire vergelijkingen, eigen en complexe getallen
- Beheersing van matrix en enkelvoudige ontbinding
- Lineaire afhankelijkheidsproblemen oplossen met behulp van matrices
- Optimaliseren met behulp van de hoofdcomponentenmethode
- Versterking van de wiskundige grondslagen van lineaire regressie
Deel 2 - Basisprincipes van wiskundige analyse
- We bestuderen functies van één en vele variabelen en afgeleiden
- Het concept van gradiënt en gradiëntafdaling beheersen
- Training in optimalisatieproblemen
- We bestuderen de Lagrange-multipliermethode, de methode van Newton en gesimuleerd gloeien
- We lossen problemen op bij het voorspellen en zoeken naar een winnende strategie met behulp van afgeleide en numerieke optimalisatiemethoden
- Versterking van de wiskunde achter gradiëntafdaling en gesimuleerd uitgloeien
Deel 3 - Grondbeginselen van waarschijnlijkheid en statistiek
- We bestuderen de algemene concepten van beschrijvende en wiskundige statistiek
- Combinatoriek beheersen
- We bestuderen de belangrijkste soorten verdelingen en correlaties
- De stelling van Bayes begrijpen
- Een naïeve Bayes-classificator leren
- We lossen problemen op het gebied van combinatoriek, validiteit en voorspelling op met behulp van statistiek en waarschijnlijkheidstheorie
- We consolideren de wiskundige grondslagen van classificatie en logistieke regressie
Deel 4 - Tijdreeksen en andere wiskundige methoden
- Introductie van tijdreeksanalyse
- Beheersing van complexere soorten regressies
- Het voorspellen van het budget met behulp van tijdreeksen
- Versterking van de wiskundige basis van klassieke machine learning-modellen
Kort cursusprogramma over Machine Learning
Begeleiding van docenten tijdens de training
Module 1 - Inleiding tot machinaal leren
We maken kennis met de belangrijkste taken en methoden van machine learning, bestuderen praktische cases en passen het basisalgoritme toe voor het werken aan een ML-project
We lossen meer dan 50 problemen op om het onderwerp te versterken
Module 2 - Methoden voor gegevensvoorverwerking
We bestuderen datatypen, leren data opschonen en verrijken, gebruiken visualisatie voor voorbewerking en beheersen feature engineering
We lossen meer dan 60 problemen op om het onderwerp te versterken
Module 3 - Regressie
We beheersen lineaire en logistieke regressie, bestuderen de grenzen van toepasbaarheid, analytische gevolgtrekking en regularisatie. Regressiemodellen trainen
We lossen meer dan 40 problemen op om het onderwerp te versterken
Module 4 - Clustering
We beheersen het leren zonder leraar, oefenen de verschillende methoden ervan, werken met teksten met behulp van ML
We lossen meer dan 50 problemen op om het onderwerp te versterken
Module 5 - Boomgebaseerde algoritmen: inleiding tot bomen
Laten we kennis maken met beslissingsbomen en hun eigenschappen, bomen uit de sklearn-bibliotheek beheersen en bomen gebruiken om een regressieprobleem op te lossen
We lossen meer dan 40 problemen op om het onderwerp te versterken
Module 6 - Boomgebaseerde algoritmen: ensembles
We bestuderen de kenmerken van boomensembles, oefenen met boosten en gebruiken het ensemble om logistische regressie op te bouwen
We lossen meer dan 40 problemen op om het onderwerp te versterken
We doen mee aan een wedstrijd op Kaggle voor het trainen van een op bomen gebaseerd model
Module 7 - Beoordeling van de kwaliteit van algoritmen
We bestuderen de principes van het splitsen van monsters, onder- en overfitting, evalueren modellen met behulp van verschillende kwaliteitsmetrieken, leren het leerproces te visualiseren
Het evalueren van de kwaliteit van verschillende ML-modellen
We lossen meer dan 40 problemen op om het onderwerp te versterken
Module 8 - Tijdreeksen in machinaal leren
Laten we kennis maken met tijdreeksanalyse in ML, lineaire modellen en XGBoost, de principes van kruisvalidatie en parameterselectie bestuderen
We lossen meer dan 50 problemen op om het onderwerp te versterken
Module 9 - Aanbevelingssystemen
We bestuderen methoden voor het construeren van aanbevelingssystemen, beheersen het SVD-algoritme en evalueren de kwaliteit van de aanbevelingen van het getrainde model
We lossen meer dan 50 problemen op om het onderwerp te versterken
Module 10 - Laatste hackathon
We passen alle bestudeerde methoden toe om maximale nauwkeurigheid van modelvoorspellingen op Kaggle te verkrijgen