MLOps - tarief 80.000 wrijven. van Otus, opleiding 5 maanden, datum 30 november 2023.
Gemengde Berichten / / November 30, 2023
Je beheerst alle noodzakelijke machine learning-vaardigheden voor het streamen van gegevens en gedistribueerde omgevingen. De opleiding omvat de benodigde kennis uit de vakgebieden Data Science en Data Engineering, waarmee je big data kunt verwerken en gedistribueerde algoritmen kunt schrijven in Spark.
Je oefent elke module door huiswerk te maken. Aan het einde van de training heb je een eindproject waarmee je alle opgedane kennis kunt samenvatten en toevoegen aan je portfolio. Het kan worden gedaan als onderdeel van werktaken op uw dataset of als een leerproject op basis van door OTUS verstrekte gegevens.
Voor wie is deze cursus bedoeld?
Voor Machine Learning specialisten of Software engineers die willen leren werken met big data. Dergelijke taken bestaan doorgaans bij grote IT-bedrijven met een grootschalig digitaal product.
Voor datawetenschappers die hun vaardigheden willen versterken met technische vaardigheden. Dankzij de cursus ben je in staat data te verwerken en zelfstandig de resultaten van ML-oplossingen in productie weer te geven.
Om te leren heb je basisvaardigheden op het gebied van datawetenschap nodig. We raden u aan de Map of Data Science-cursussen bij OTUS te bekijken om het vereiste trainingsniveau te achterhalen.
Je leert:
- Gebruik standaard ML-pijplijntools in een gedistribueerde omgeving;
- Ontwikkel uw eigen blokken voor ML-pijplijnen;
- ML-algoritmen aanpassen aan gedistribueerde omgevingen en big data-tools;
- Gebruik Spark, SparkML, Spark Streaming;
- Ontwikkel algoritmen voor het voorbereiden van streaminggegevens voor machine learning;
- Zorgen voor kwaliteitscontrole in alle stadia van de overgang van ML-oplossingen naar industriële exploitatie.
Vraag naar specialisten
De vaardigheden die je leert zijn zo toegepast en veelbelovend mogelijk. Er verschijnen steeds meer digitale producten op de markt, waarvan de ontwikkeling het werken met big data en streamprocessing vereist. Specialisten met zo'n pool van vaardigheden en enige werkervaring kunnen nu al in aanmerking komen voor een salaris van 270 duizend. roebel Een andere trend: automatisering van trainings- en validatieprocessen devalueert integendeel op de een of andere manier het werk van een klassieke datawetenschapper. Alles beweegt zich richting het punt waarop zelfs een niet-specialist een fit-voorspelling kan doen. Daarom hebben degenen die op zijn minst oppervlakkige technische vaardigheden hebben, al een premie.
Cursuskenmerken
Veel oefenen met het werken met data
Breed scala aan vaardigheden, van gedistribueerde ML en stroomgegevensverwerking tot productie-uitvoer
Huidige tools en technologieën: Scala, Spark, Python, Docker
Live communicatie met experts via webinars en Slack-chat
4
cursusBetrokken bij de ontwikkeling van een Data Science-team dat functionaliteit biedt op basis van machine learning voor de producten en diensten van het bedrijf. Als Data Scientist nam hij deel aan de ontwikkeling van Kaspersky MLAD en MDR AI Analyst. IN...
Betrokken bij de ontwikkeling van een Data Science-team dat functionaliteit biedt op basis van machine learning voor de producten en diensten van het bedrijf. Als Data Scientist nam hij deel aan de ontwikkeling van Kaspersky MLAD en MDR AI Analyst. Als C++-ontwikkelaar heeft hij meegewerkt aan de creatie van MaxPatrol SIEM en geeft hij al jaren computerles. wetenschappelijke disciplines bij MSTU GA Auteur van een reeks rapporten over ML, C++, DS projectmanagement en ontwikkeling ploegen. Lid van de PC-conferentie C++ Rusland. Programma manager
8
cursussen20+ jaar ervaring in maatwerk ontwikkelingsprojecten in de IT. Tientallen succesvolle projecten, ook onder overheidscontracten. Ervaring met de ontwikkeling en implementatie van ERP-systemen, open source-oplossingen, ondersteuning voor zwaarbelaste applicaties. Docent van cursussen over...
20+ jaar ervaring in maatwerk ontwikkelingsprojecten in de IT. Tientallen succesvolle projecten, ook onder overheidscontracten. Ervaring met de ontwikkeling en implementatie van ERP-systemen, open source-oplossingen, ondersteuning voor zwaarbelaste applicaties. Docent van cursussen over Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, evenals mentor van de cursus HighLoad
1
GoedSpecialist in het werken met big data en machine learning. Gedurende 8 jaar werkte hij bij Odnoklassniki.ru. Leiding gegeven aan het OK Data Lab team (een laboratorium voor onderzoekers op het gebied van big data en machine...
Specialist in het werken met big data en machine learning. Gedurende 8 jaar werkte hij bij Odnoklassniki.ru. Leiding gegeven aan het OK Data Lab team (een laboratorium voor onderzoekers op het gebied van big data en machine learning). Big data-analyse in Odnoklassniki is een unieke kans geworden om theoretische training en wetenschappelijke basis te combineren met de ontwikkeling van echte, veelgevraagde producten. Sinds 2019 werkt hij bij Sberbank als algemeen directeur. Treedt op als leider van het cluster voor het ontwikkelen van een platform voor aanbevelingssystemen in de divisie massapersonalisatie. Hij studeerde in 2004 af aan de St. Petersburg State University, waar hij in 2007 zijn doctoraat in formeel-logische methoden verdedigde. Ik heb bijna 9 jaar in de outsourcing gewerkt zonder het contact met de universitaire en wetenschappelijke omgeving te verliezen.
Basisinleiding tot het starten van de cursus
-Onderwerp 1.Gradientafdaling en lineaire modellen
-Onderwerp 2. Overzicht van basismethoden en -statistieken voor machinaal leren
-Onderwerp 3.Evolutie van benaderingen van het werken met data
-Onderwerp 4. Basisprincipes van programmeren in Scala
Technologische basis van gedistribueerde gegevensverwerking
-Onderwerp 5. Gedistribueerde bestandssystemen
-Onderwerp 6. Resourcemanagers in gedistribueerde systemen
-Onderwerp 7. Evolutie van massaal parallelle en gedistribueerde computerframeworks
-Onderwerp 8. Basisprincipes van Apache Spark 1
-Onderwerp 9. Basisprincipes van Apache Spark 2
Gedistribueerde ML-basisprincipes
-Onderwerp 10. Overdracht van ML-algoritmen naar een gedistribueerde omgeving
-Onderwerp 11.ML in Apache Spark
-Onderwerp 12.Je eigen blokken ontwikkelen voor SparkML
-Onderwerp 13.Optimalisatie van hyperparameters en AutoML
Stroomverwerking
-Onderwerp 14. Verwerking van streamgegevens
-Onderwerp 15. Bibliotheken van derden voor gebruik met Spark
-Thema 16. Spark-streaming
-Onderwerp 17. Gestructureerd en continu streamen in Spark
-Onderwerp 18. Alternatieve streamingframeworks
Doelen stellen en resultatenanalyse
-Onderwerp 19. Bepaling van het doel van het ML-project en voorlopige analyse
-Onderwerp 20. ML-doelen op lange termijn, waarbij gebruik wordt gemaakt van het voorbeeld van de taak om het klantverloop te verminderen
-Onderwerp 21.A/B-testen
-Onderwerp 22.Aanvullende onderwerpen
ML-resultaten uitvoeren naar productie
-Onderwerp 23. Benaderingen om ML-oplossingen in productie te brengen
-Topic 24. Versiebeheer, reproduceerbaarheid en monitoring
-Onderwerp 25.Online serveren van modellen
-Onderwerp 26. Patronen voor asynchrone streaming ML en ETL
-Onderwerp 27. Als je Python nodig hebt
ML in Python in productie
-Onderwerp 28. Productiecode in Python. Organisatie- en verpakkingscode
-Onderwerp 29.REST-architectuur: Flask API
-Onderwerp 30.Docker: structuur, toepassing, implementatie
-Onderwerp 31. Kubernetes, containerorkestratie
-Thema 32.MLOPS-tools voor Kubernetes: KubeFlow, Seldon Core. Kenmerken van de werking van heterogene systemen in de industrie.
-Thema 33. Amazon Sagemaker
-Onderwerp 34.AWS ML-service
Geavanceerde onderwerpen
-Onderwerp 35. Neurale netwerken
-Onderwerp 36. Gedistribueerd leren en gevolgtrekking van neurale netwerken
-Onderwerp 37. Verloopversterking op bomen
-Onderwerp 38. Versterkend leren
Project Werk
-Onderwerp 39. Keuze van het onderwerp en organisatie van projectwerk
-Thema 40. Overleg over projecten en huiswerk
-Onderwerp 41. Bescherming van ontwerpwerkzaamheden