Data Engineer van nul tot Junior - gratis cursus van Skillbox, training, Datum: 29 november 2023.
Gemengde Berichten / / November 30, 2023
Voor beginners
Leer Python en SQL helemaal opnieuw. Leer data verzamelen, analyseren en verwerken. Los problemen op op basis van echte cases en voeg ze toe aan uw portfolio. Je kunt tijdens je studie een carrière in Data Engineering starten.
Voor programmeurs
Verbeter uw kennis van SQL om met databases te werken. Je doorloopt het hele traject van een data engineer, van het verzamelen van ruwe data tot het implementeren van het model. Ervaring met programmeren helpt je snel een nieuw beroep te begrijpen en je vakgebied te veranderen.
Voor beginnende analisten
Leer alle fasen van het werken met data. Leer informatie uit verschillende bronnen verzamelen, bouw een architectuur om deze op te slaan en visualiseer rapporten. Je bent in staat zelfstandig data voor te bereiden voor verdere analyse.
Auteur van de Machine Learning-cursus. Senior Data Scientist, teamleider bij SberData, Sber. 5+ jaar in het vak
Cursusspreker, R&D-directeur, UBIC Tech. Meer dan 15 jaar ervaring in ontwikkeling
Datawetenschapper bij Sberbank, wiskundige bij het computercentrum van de Russische Academie van Wetenschappen. Blokkeer ‘Fundamentals of Mathematics for Data Science’. Meer dan 4 jaar ervaring in het lesgeven van hogere wiskunde
Eerste niveau: basisopleiding
Maak kennis met de belangrijkste gebieden van Data Science, train en implementeer uw eerste ML-model. Verkrijg basiskennis van wiskunde, statistiek en waarschijnlijkheidstheorie. Dit alles zal u helpen de basisprincipes van het werken met data te begrijpen. De gemiddelde doorlooptijd bedraagt 6 maanden.
Inleiding tot datawetenschap
Je doorloopt alle stadia van het werken met data. Leer problemen identificeren, verzamel zakelijke vereisten. Je downloadt data uit verschillende bronnen, voert verkennende analyses uit en maakt de dataset gereed voor verder gebruik. Train en implementeer een kant-en-klaar ML-model, probeer jezelf uit als product- en marketinganalist. Leer hoe u hypothesen formuleert en test. Beheers de basishulpmiddelen voor werk: Python, SQL, Excel, Power Bi, Airflow.
Basiswiskunde voor datawetenschap
Verkrijg basiskennis van wiskunde om met machine learning te werken. Je begrijpt wat benadering, interpolatie, functies, regressies, matrices en vectoren zijn. Leer werken met wiskundige entiteiten in de SymPy Python-bibliotheek.
Grondbeginselen van statistiek en waarschijnlijkheidstheorie
Je begrijpt de principes van het werken met willekeurige variabelen en gebeurtenissen. Maak kennis met bepaalde soorten verdelingen en statistische tests die nuttig zijn bij het construeren van modellen en het testen van hypothesen.
Stage mogelijkheid
Basiskennis en vaardigheden zijn voldoende om een stage te krijgen - je kunt tegelijkertijd tijdens de cursus en in het bedrijf blijven studeren.
Tweede niveau: Data Engineer Junior
Leer complexe datasets verzamelen, showcases voorbereiden en pijplijnen bouwen voor werk, DS-projecten helemaal opnieuw implementeren en code testen. Je bent klaar om aan de slag te gaan als Junior Data Engineer. De gemiddelde doorlooptijd bedraagt 6 maanden.
Inleidend blok
Ontdek wat een Data Engineer doet, welke rol hij speelt in een Data Science-project en wat zijn carrièrepaden zijn. U begrijpt hoe de cursus is opgebouwd en welke onderwerpen u gaat bestuderen.
SQL
Leer gegevens in bestaande tabellen manipuleren, voer invoeg-, wis- en updatebewerkingen uit. U kunt gegevens uit de database in verschillende formaten opslaan. Leer meer over vensterfuncties en de basisprincipes van het voorbereiden van datamarts met behulp van SQL. Leer hoe u ervoor kunt zorgen dat informatie correct wordt ingevoerd in de transactiemodus. U kunt het transactielogboek lezen en begrijpen. Leer wat indexen zijn, indexarchitectuur en waar ze worden gebruikt. Leer technieken om zoekopdrachten te versnellen.
Python. LVL 2
Denk na over gegevenstypen, hoe ze kunnen worden geconverteerd en hoe Python en SQL samenwerken: gegevens uit een database halen, met de gegevens werken en query's uitvoeren. Leer de basisconcepten van JSON- en XML-gegevensschema's. U kunt foutopsporing in applicaties configureren, tests schrijven, gegevens anonimiseren en coderen.
Bibliotheken voor Python
Je leert wat bibliotheken voor het werken met grafieken zijn, begeleid leren, visualisatie van metrieken en bronnen van datasets. Leer Python en bibliotheken gebruiken om met gegevens te werken. Je kunt doorgaan met het leren van Panda's.
Luchtstroom
Bekijk de belangrijkste concepten en praktijken voor het werken met Airflow. Leer de basisprincipes van architectuur en interoperabiliteit, van UI tot CLI. Bouw uw eerste datapijplijn.
Spark-basisprincipes
Master Spark: leer op welke computerbronnen het werkt, hoe het gegevens opslaat en met geheugen en schijf werkt. Zet uw eerste lokale stand op. Leer de basis van RDD: basisconcepten, werken met bronnen, acties. Leer werken met de Dataframe API. Leer prestatie- en optimalisatieproblemen bij het gebruik van Dataframe, gegevensbronnen en -typen, werken met geldige/ongeldige gegevens, foutafhandeling, UDF, interactie met Python en SQL.
Basisprincipes van machine learning-algoritmen
U begrijpt de belangrijkste soorten machine learning-modellen, de belangrijkste termen en definities. Leer regressie-algoritmen en clusteralgoritmen.
Inzet
Leer de belangrijkste fasen van het voorbereiden van een model voor implementatie, de benaderingen voor het bouwen van een API en manieren om fouten af te handelen en applicaties te debuggen. Je kunt implementatieproblemen oplossen en de basishulpmiddelen onder de knie krijgen. Maak kennis met de belangrijkste processen van bash: scripts schrijven, werken met variabelen en de teksteditors sed en awk.
Laatste projecten
Nadat je het eerste niveau hebt behaald, bereid je een introductieproject voor. Aan het eind van de cursus presenteer je je eindwerk.
Inleiding tot datawetenschap
Consolideer uw nieuwe kennis voor een individueel project - u gaat van het laden van gegevens naar het implementeren van een model. Los de problemen van een data engineer, ML engineer en data analist op om te beslissen over jouw specialisatie.
Gegevensingenieur
Afstudeerproject op Junior niveau. Voer een cohortanalyse uit en download API-referenties. Bouw dashboards op basis van de ontvangen gegevens.
Bonuscursussen
Ontwikkelaarscarrière: werkgelegenheid en ontwikkeling
Je leert hoe je een passende vacature kiest, je voorbereidt op een sollicitatiegesprek en onderhandelt met een werkgever. U zult snel een functie kunnen vinden die voldoet aan uw verwachtingen en vaardigheden.
Git-versiebeheersysteem
Leer versiecodewijzigingen doorvoeren, repository's en vertakkingen maken en beheren en versieconflicten oplossen. Leer handige regels voor het werken met Git.
Engels voor IT-specialisten
Verkrijg taalvaardigheden die u zullen helpen slagen voor een sollicitatiegesprek bij een buitenlands bedrijf en comfortabel kunnen communiceren in gemengde teams.