Data Science - gratis cursus van de School of Data Analysis, opleiding 4 semesters, datum 2 december 2023.
Gemengde Berichten / / December 05, 2023
Voor degenen die problemen willen stellen met behulp van data-analyse, oplossingen willen voorstellen en hun effectiviteit willen evalueren, niet alleen in een synthetisch experiment, maar ook in reële omstandigheden.
Statistiek, machine learning en werken met verschillende soorten data.
Gegevens liggen ten grondslag aan de meeste moderne diensten en producten, van apps voor weersvoorspellingen tot zelfrijdende auto's. Een Data Scientist voert experimenten uit, bouwt metrieken, weet de werking van diensten te optimaliseren en begrijpt waar hun groeipunten liggen.
Elke student moet tijdens het semester ten minste drie cursussen met succes voltooien. Als er bijvoorbeeld twee in het hoofdprogramma staan, moet je een van de speciale cursussen kiezen.
Kennis wordt voornamelijk getest door middel van huiswerk - examens en tests worden slechts bij sommige vakken afgenomen.
Eerste semester
Verplicht
Algoritmen en datastructuren, deel 1
01.Complexiteit en rekenmodellen. Analyse van boekhoudkundige waarden (begin)
02.Analyse van boekhoudkundige waarden (einde)
03. Algoritmen samenvoegen en snel sorteren
04. Ordinale statistieken. Hopen (begin)
05. Hopen (einde)
06. Hashing
07. Bomen zoeken (begin)
08.Bomen zoeken (vervolg)
09.Bomen zoeken (einde). Systeem van onsamenhangende verzamelingen
10. RMQ- en LCA-taken
11.Datastructuren voor geometrisch zoeken
12.Het probleem van dynamische connectiviteit in een ongerichte grafiek
Python-taal
01. Taalbasis (deel 1)
02. Taalbasis (deel 2)
03.Objectgeoriënteerd programmeren
04. Foutafhandeling
05. Codeontwerp en testen
06.Werken met snaren
07. Geheugenmodel
08Functioneel programmeren
09.Bibliotheekoverzicht (deel 1)
10.Bibliotheekoverzicht (deel 2)
11.Parallel computergebruik in Python
12.Geavanceerd werken met objecten
Machine learning, deel 1
01.Basisconcepten en voorbeelden van toegepaste problemen
02.Metrische classificatiemethoden
03.Logische classificatiemethoden en beslisbomen
04. Gradiënt lineaire classificatiemethoden
05. Ondersteuning van vectormachine
06.Multivariate lineaire regressie
07. Niet-lineaire en niet-parametrische regressie, niet-standaard verliesfuncties
08. Tijdreeksvoorspellingen
09.Bayesiaanse classificatiemethoden
10.Logistieke regressie
11. Zoek naar associatieregels
Tweede semester
Verplicht
Grondbeginselen van statistiek in machinaal leren
01.Inleiding
02. Belangrijkste taken en methoden van de theorie van statistische gevolgtrekking
03. Schatting van de verdeling en statistische functionaliteiten
04.Monte Carlo-simulatie, bootstrap
05.Parametrische schatting
06. Hypothesetesten
07. Het verminderen van de dimensionaliteit van multidimensionale gegevens
08.Beoordeling van de gevoeligheid van het model
09.Lineaire en logistische regressie
10. Methoden voor het ontwerpen van experimenten
11.Verschillende soorten regularisaties bij lineaire regressie
12. Niet-lineaire methoden voor het construeren van regressie-afhankelijkheden
13. Niet-parametrische schatting
14.Bayesiaanse benadering van schatting
15.Bayesiaanse benadering van regressie
16. Bayesiaanse benadering van regressie en optimalisatie
17.Gebruik van het willekeurige Gaussiaanse veldmodel bij problemen met data-analyse
18.Gebruik van statistische modellen en methoden bij surrogaatmodellerings- en optimalisatieproblemen
Machine learning, deel 2
01. Neurale netwerkmethoden voor classificatie en regressie
02.Compositionele methoden voor classificatie en regressie
03.Criteria voor het selecteren van modellen en methoden voor het selecteren van functies
04.Ranglijst
05. Versterkend leren
06.Leren zonder leraar
07.Problemen met gedeeltelijke training
08. Gezamenlijk filteren
09. Onderwerpmodellering
Derde semester
Kiezen uit
Automatische tekstverwerking
01Cursusmateriaal
of
Computer visie
De cursus is gewijd aan methoden en algoritmen van computer vision, d.w.z. informatie uit afbeeldingen en video's halen. Laten we eens kijken naar de basisprincipes van beeldverwerking, beeldclassificatie, zoeken naar afbeeldingen op inhoud, gezichtsherkenning, beeldsegmentatie. Daarna zullen we het hebben over videoverwerkings- en analyse-algoritmen. Het laatste deel van de cursus is gewijd aan 3D-reconstructie. Voor de meeste problemen zullen we bestaande neurale netwerkmodellen bespreken. In de cursus proberen we alleen aandacht te besteden aan de modernste methoden die momenteel worden gebruikt bij het oplossen van praktijk- en onderzoeksproblemen. De cursus is grotendeels praktisch en niet theoretisch. Daarom zijn alle hoorcolleges uitgerust met laboratoriumwerk en huiswerk, waardoor je de meeste van de besproken methoden in de praktijk kunt uitproberen. Het werk wordt uitgevoerd in Python met behulp van verschillende bibliotheken.
01. Digitale beeld- en tooncorrectie.
02. Basisprincipes van beeldverwerking.
03.Afbeeldingen combineren.
04. Classificatie van afbeeldingen en zoeken naar soortgelijke.
05. Convolutionele neurale netwerken voor classificatie en zoeken naar vergelijkbare afbeeldingen.
06. Objectdetectie.
07. Semantische segmentatie.
08. Stijloverdracht en beeldsynthese.
09.Videoherkenning.
10. Schaarse 3D-reconstructie.
11. Dichte driedimensionale reconstructie.
12.Reconstructie vanuit één frame en puntenwolken, parametrische modellen.
Vierde semester
Aanbevolen speciale cursussen
Diep leren
01. Cursusmateriaal
Versterkend leren
01. Cursusmateriaal
Zelfrijdende auto's
De cursus behandelt de kerncomponenten van zelfrijdende technologie: lokalisatie, perceptie, voorspelling, gedragsniveau en bewegingsplanning. Voor elk onderdeel worden de belangrijkste benaderingen beschreven. Bovendien zullen studenten vertrouwd raken met de huidige marktomstandigheden en technologische uitdagingen.
01.Overzicht van de belangrijkste componenten en sensoren van een onbemand voertuig. Niveaus van autonomie. Rijd per draad. Zelfrijdende auto’s als zakelijk product. Manieren om de voortgang bij het maken van drones te evalueren. Basisbeginselen van lokalisatie: GPS, wielodometrie, Bayesiaanse filters.
02. Methoden voor lidar-lokalisatie: ICP, NDT, LOAM. Inleiding tot visuele SLAM met ORB-SLAM als voorbeeld. Verklaring van het GraphSLAM-probleem. Het GraphSLAM-probleem reduceren tot een niet-lineaire kleinste kwadratenmethode. Het selecteren van de juiste parametrering. Systemen met een speciale structuur in GraphSLAM. Architecturale aanpak: frontend en backend.
03. Herkenningstaak in een zelfrijdende auto. Statische en dynamische obstakels. Sensoren voor het herkenningssysteem. Weergave van statische obstakels. Detectie van statische obstakels met behulp van lidar (VSCAN, neurale netwerkmethoden). Lidar gebruiken in combinatie met afbeeldingen om statische gegevens te detecteren (semantische beeldsegmentatie, diepteaanvulling). Stereocamera en diepte uit een foto halen. Stixel-wereld.
04.Stel je dynamische obstakels voor in een zelfrijdende auto. Neurale netwerkmethoden voor het detecteren van objecten in 2D. Detectie op basis van vogelperspectief van de weergave van lidarwolken. Lidar gebruiken met beelden om dynamische obstakels te detecteren. Autodetectie in 3D op basis van foto's (3D-boxen passen, CAD-modellen). Radargebaseerde dynamische obstakeldetectie. Object volgen.
05. Rijpatronen van auto's: achterwiel, voorwiel. Padplanning. Het concept van configuratieruimte. Grafiekmethoden voor het construeren van trajecten. Trajecten die schokken minimaliseren. Optimalisatiemethoden voor het construeren van trajecten.
06.Snelheidsplanning in een dynamische omgeving. ST-planning. Het voorspellen van het gedrag van andere weggebruikers.