Data Scientist van nul tot PRO - cursus RUB 233.640. van SkillFactory, training 24 maanden, Datum 15 augustus 2023.
Gemengde Berichten / / November 29, 2023
Na de basiscursus kun je kiezen voor een smallere specialisatie in Data Science - ML Engineer, CV Engineer of NLP Engineer
M.L. Ingenieur — Machine learning-ontwikkelaar
Ontwikkel een voorspellingsmodel voor kredietbeoordelingen
Los het probleem op van het classificeren van spam-sms-berichten
Ontwikkel een systeem om geschikte producten aan te bevelen bij de aankoop
Bouw een model om de omzet in de detailhandel te vergroten
Maak afbeeldingen op basis van tekstbeschrijving met behulp van het DALL-E neurale netwerk
CV-ingenieur — Computervisiespecialist
Leer alle basisproblemen op het gebied van Computer Vision op te lossen
Je verwerft kennis van de echte stroom van het werken met CV-modellen, de huidige benaderingen en geavanceerde tools die nodig zijn voor het creëren van CV-diensten
Creëer in het eindproject een virtuele coach die de juistheid van oefeningen op video kan beoordelen
NLP-ingenieur — Specialist in natuurlijke taalverwerking
Maak kennis met natuurlijke taalverwerking
Krijg inzicht in NLP-taken - classificatie, samenvatting en tekstgeneratie, het creëren van systemen voor automatische vertaling en vraag-antwoordsystemen
In het afstudeerproject ontwikkel je zelfstandig tools voor het geautomatiseerd zoeken naar contexten over bepaalde onderwerpen.
BASEREN
In deze fase leer je de basisprincipes van programmeren in Python, leer je hoe je data voorbewerkt en analyseert, en raak je ook vertrouwd met de belangrijkste taken van een datawetenschapper.
Introductie - 1 week
Je kunt voor jezelf echte leerdoelen formuleren, ontdekken wat de waarde van DS is voor het bedrijfsleven, Maak kennis met de belangrijkste taken van een datawetenschapper en begrijp hoe de ontwikkeling ervan verloopt DS-project.
INTRO-1. Hoe effectief te studeren - onboarding in training
INTRO-2. Beroepsoverzicht. Soorten problemen in Data Science. Fasen en benaderingen voor het ontwikkelen van een Data Science-project
Ontwikkelingsontwerp - 5 weken
Je leert werken met basisgegevenstypen met behulp van Python en kunt looping-constructies, voorwaardelijke instructies en functies gebruiken in je dagelijkse werk.
PYTHON-1. Python-basisprincipes
PYTHON-2. Duiken in gegevenstypen
PYTHON-3. Voorwaardelijke stellingen
PYTHON-4. Cycli
PYTHON-5. Functies en functionele programmering
PYTHON-6. Oefening
PYTHON-7. Python-stijlgids (bonus)
Basiswiskunde - 7 weken
WISKUNDE-1. Getallen en uitdrukkingen
WISKUNDE-2. Vergelijkingen en ongelijkheden
WISKUNDE-3. Basisconcepten van functietheorie
WISKUNDE-4. Basisprincipes van meetkunde: planimetrie, trigonometrie en stereometrie
WISKUNDE-5. Sets, logica en elementen van statistiek
WISKUNDE-6. Combinatoriek en basisprincipes van de waarschijnlijkheidstheorie
WISKUNDE-7. Probleemoplossing
Werken met data - 8 weken
In deze fase beheerst u de basisvaardigheden op het gebied van data: hoe u gegevens kunt voorbereiden, opschonen en transformeren zodat deze geschikt zijn voor analyse. Over analyse gesproken: je analyseert gegevens met behulp van de populaire bibliotheken Matplotlib, Seaborn, Plotly.
PYTHON-8. Hulpmiddelen voor datawetenschap
PYTHON-9. NumPy-bibliotheek
PYTHON-10. Inleiding tot Panda's
PYTHON-11. Basistechnieken voor het werken met gegevens in Pandas
PYTHON-12. Geavanceerde datatechnieken in panda's
PYTHON-13. Gegevens opschonen
PYTHON-14. Data visualisatie
PYTHON-15. Principes van OOP in Python en foutopsporingscode (optionele module)
Project 1. Datasetanalyse over gesloten problemen
Gegevens laden - 6 weken
U kunt gegevens downloaden uit verschillende formaten en bronnen. En SQL, een gestructureerde querytaal, helpt je hierbij. Je leert aggregatiefuncties, tabeljoins en complexe joins gebruiken.
PYTHON-16. Gegevens downloaden uit bestanden van verschillende formaten
PYTHON-17. Gegevens ophalen uit webbronnen en API's
SQL-0. Hallo SQL!
SQL-1. SQL-basisprincipes
SQL-2. Geaggregeerde functies
SQL-3. Tafels samenvoegen
SQL-4. Complexe verbindingen
Project 2. Nieuwe gegevens laden. Het verfijnen van de analyse
Statistische data-analyse - 7 weken
Intelligence Data Analysis (EDA) is waar u zich op zult richten. U raakt vertrouwd met alle fasen van een dergelijke analyse en leert hoe u deze kunt uitvoeren met behulp van de bibliotheken Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Daarnaast kun je werken aan Kaggle, een populaire dienst voor deelname aan wedstrijden.
EDA-1. Inleiding tot de analyse van inlichtingengegevens. EDA-algoritmen en methoden
EDA-2. Wiskundige statistiek in de context van EDA. Soorten functies
EDA-3. Functietechniek
EDA-4. Statistische data-analyse in Python
EDA-5. Statistische data-analyse in Python. Deel 2
EDA-6. Ontwerp van proeven
EDA-7. Kaggle-platform
Project 2
Inleiding tot Machine Learning - 9 weken
Je raakt vertrouwd met ML-bibliotheken voor het modelleren van gegevensafhankelijkheden. U kunt de belangrijkste soorten ML-modellen trainen, validatie uitvoeren, de resultaten van het werk interpreteren en belangrijke kenmerken selecteren (functiebelang).
ML-1. Theorie van machinaal leren
ML-2. Begeleid leren: regressie
ML-3. Begeleid leren: classificatie
ML-4. Leren zonder toezicht: technieken voor clustering en dimensionaliteitsreductie
ML-5. Datavalidatie en modelevaluatie
ML-6. Selectie en selectie van eigenschappen
ML-7. Optimaliseren van modelhyperparameters
ML-8. ML Kookboek
Project 3. Classificatie probleem
HOOFDEENHEID
Lineaire algebra, wiskundige analyse, discrete wiskunde - het klinkt eng, maar wees niet bang: we analyseren al deze onderwerpen en leren je hoe je ermee kunt werken! In de tweede fase duik je in de wiskunde en de basisbeginselen van machinaal leren, leer je meer over DS-beroepen en kies je, via loopbaanbegeleiding, een tweedejaars studietraject.
Wiskunde en machinaal leren. Deel 1 - 6 weken
Je kunt praktische problemen oplossen met behulp van handmatige berekeningen en Python (vector- en matrixberekeningen, werken met verzamelingen, functies bestuderen met behulp van differentiële analyse).
MATH&ML-1. Lineaire algebra in de context van lineaire methoden. Deel 1
MATH&ML-2. Lineaire algebra in de context van lineaire methoden. Deel 2
MATH&ML-3. Wiskundige analyse in de context van een optimalisatieprobleem Deel 1
MATH&ML-4. Wiskundige analyse in de context van een optimalisatieprobleem. Deel 2
MATH&ML-5. Wiskundige analyse in de context van een optimalisatieprobleem. Deel 3
Project 4. Regressie probleem
Wiskunde en machinaal leren. Deel 2 - 6 weken
Je raakt vertrouwd met de basisconcepten van de waarschijnlijkheidstheorie en de wiskundige statistiek, algoritmen clustering, en leer ook de kwaliteit van de uitgevoerde clustering te evalueren en de resultaten daarin te presenteren grafische vorm.
MATH&ML-6. Waarschijnlijkheidstheorie in de context van een naïeve Bayes-classificator
MATH&ML-7. Algoritmen gebaseerd op beslissingsbomen
MATH&ML-8. Boosten en stapelen
MATH&ML-9. Clustering en dimensionaliteitsreductietechnieken. Deel 1
MATH&ML-10. Clustering en dimensionaliteitsreductietechnieken. Deel 2
Project 5. Ensemble-methoden
Discrete Wiskunde - 4 weken
MATH&MGU-1 Sets en combinatoriek
MATH&MGU-2 Logica
MATH&MGU-3-grafieken. Deel 1
MATH&MGU-4 Grafieken. Deel 2
ML in bedrijf - 8 weken
Je leert ML-bibliotheken gebruiken om tijdreeksproblemen en aanbevelingssystemen op te lossen. U kunt een ML-model trainen en valideren, maar ook een werkend prototype maken en het model in de webinterface uitvoeren. En verkrijg ook A/B-testvaardigheden, zodat u het model kunt evalueren.
MATH&ML-11. Tijdreeksen. Deel 1
MATH&ML-12. Tijdreeksen. Deel 2
MATH&ML-13. Aanbevolen systemen. Deel 1
MATH&ML-14. Aanbevolen systemen. Deel 2
PROD-1. Het model gereedmaken voor productie
PROD-2. PrototypeStreamlit+Heroku
PROD-3. Zakelijk begrip. Geval
Project 6. Onderwerp waaruit u kunt kiezen: Tijdreeksen of Aanbevelingssystemen
PRO-NIVEAU
In de derde fase raak je vertrouwd met een van de machine learning-methoden: deep learning (DL). En ook een volwaardig blok van de gekozen specialisatie wacht op je: je kunt machine learning-vaardigheden onder de knie krijgen (ML), maak kennis met de routine van CV (computer vision) of verbeter in NLP*, natuurlijke verwerking taal.
Tweede studiejaar - 3 specialisaties om uit te kiezen
Loopbaanbegeleiding
ML, CV of NLP: in deze fase moet je eindelijk een keuze maken welke weg je vervolgens gaat volgen. Wij vertellen u over elke specialisatie en bieden u de mogelijkheid een aantal praktische problemen op te lossen, zodat u gemakkelijker een keuze kunt maken.
Volg ML - ingenieur
In het ML-traject leer je diepgaande machine learning-problemen oplossen, beheers je de competenties van een data-ingenieur en verbeter je je vaardigheden in het werken met Python-bibliotheken. Je leert ook hoe je een MVP (minimaal levensvatbare versie van een product) maakt, leert alle fijne kneepjes van het uitvoeren van een ML-model naar productie en leert hoe ML-ingenieurs in het echte leven werken.
Inleiding tot diep leren
Basisprincipes van data-engineering
Extra Python- en ML-hoofdstukken
Economische evaluatie van effecten en MVP-ontwikkeling
ML naar productie
Diepgaande studie van ML-ontwikkeling en afstudeerproject over een gekozen onderwerp
Track CV - ingenieur
Op het CV-traject leer je computervisieproblemen oplossen, zoals beeldclassificatie, segmentatie en detectie, beeldgeneratie en stilering, restauratie en kwaliteitsverbetering foto's. Daarnaast leer je hoe je neurale netwerken in productie kunt uitrollen.
Inleiding tot diep leren
Basisprincipes van data-engineering
Extra Python- en ML-hoofdstukken
Economische evaluatie van effecten en MVP-ontwikkeling
ML naar productie
Diepgaande studie van ML-ontwikkeling en afstudeerproject over een gekozen onderwerp
Volg NLP - ingenieur
Tijdens de training op het NLP-traject leer je hoe je de belangrijkste problemen van natuurlijke taalverwerking kunt oplossen inclusief classificatie, samenvatting en tekstgeneratie, automatische vertaling en creatie van dialoog systemen
Inleiding tot diep leren
Neurale netwerkwiskunde voor NLP
Hard & Software voor het oplossen van NLP-problemen
NLP-taken en algoritmen
Neurale netwerken in productie
Diepgaande studie van NLP-ontwikkeling en afstudeerproject over een gekozen onderwerp
Als je kiest voor de CV- of ML-specialisatie, kun je de NLP-cursus gratis volgen zonder mentorondersteuning.
Diep leren en neurale netwerken
Waar worden neurale netwerken gebruikt? Hoe train je een neuraal netwerk? Wat is diep leren? De antwoorden op deze vragen vindt u in het bonusgedeelte van DL.
Inleiding tot data-engineering
Je leert het verschil tussen de rollen van een datawetenschapper en een data-ingenieur, welke tools deze laatste in zijn werk gebruikt en welke taken hij dagelijks oplost. De woorden "sneeuwvlok", "ster" en "meer" zullen nieuwe betekenissen krijgen :)