Cursus “Data Science Specialist” - cursus 112.000 wrijven. van Yandex Workshop, training 8 maanden, datum 30 november 2023.
Gemengde Berichten / / November 28, 2023
Wat doen datawetenschappers?
Analyseer grote hoeveelheden gegevens, ontwikkel modellen en pas machine learning toe om voorspellingen te doen en patronen te identificeren. Ze zijn nodig op verschillende gebieden waar er behoefte is aan het opslaan en verwerken van gegevens.
Bij banken
Analyseer gegevens over klanten en bepaal welke indicatoren hun kredietwaardigheid beïnvloeden, voorspel de waarschijnlijkheid dat de klant de bank verlaat
In industrie
Met behulp van machinaal leren voorspellen ze wanneer apparatuur het zal begeven en in welke mijnbouw de grootste winst zal opleveren.
Op het gebied van marketing en commercie
Ze helpen groeipunten te vinden door seizoensinvloeden en piekverkoopdagen te analyseren en een aanbevelingssysteem te creëren
In de transportsector
Optimaliseer de werking van verkeerslichten, beoordeel de belasting op de wegen en help reparatieplannen aanpassen
Compleet cursusprogramma Data Science
We werken het regelmatig bij om ervoor te zorgen dat het voldoet aan de behoeften van de sector en werkgevers. Met andere woorden, je leert alleen wat zeker nuttig zal zijn in je werk.
Basisprincipes van Python en data-analyse: gratis introductiecursus:
Leer de basisconcepten van data-analyse en begrijp wat data-analisten en datawetenschappers doen. Los vijf voorbeelden op van het werken met gegevens uit verschillende gebieden:
- ontdek de reden voor de enorme ineenstorting van gadgets,
- controleer de terugverdientijd van advertenties voor mobiele applicaties,
- vind de beste locatie voor een nieuwe winkel,
- u helpen bij het kiezen van een ontwikkelingsstrategie voor een AI-startup,
- evalueer de effectiviteit van robots in de ondersteunende dienst.
Door cases op te lossen, leer je de basisprincipes van Python en de pandabibliotheek, leer je hoe je enkele grafieken bouwt en deze correct interpreteert.
Introductie tot het beroep “Data Science Specialist”
Wat is een Data Science-specialist?
Hoe wij lesgeven.
Basis Python:
Duik dieper in de programmeertaal Python en de pandabibliotheek.
+1 project in portefeuille
Vergelijk Yandex-gebruikersgegevens. Muziek per stad en dag van de week.
Gegevensvoorverwerking:
Leer hoe u gegevens kunt opschonen van uitschieters, weglatingen en duplicaten, en hoe u verschillende gegevensformaten kunt converteren.
+1 project in portefeuille
Analyseer gegevens over bankklanten en bepaal het aandeel kredietwaardige klanten.
Verkennende gegevensanalyse:
Leer de basisprincipes van waarschijnlijkheid en statistiek. Gebruik ze om de basiseigenschappen van gegevens te verkennen, op zoek naar patronen, verdelingen en afwijkingen. Maak kennis met de scipy- en matplotlib-bibliotheken. Teken diagrammen en oefen met het analyseren van grafieken.
+1 project in portefeuille
Ontdek het archief met advertenties voor de verkoop van onroerend goed in St. Petersburg en de regio Leningrad.
Waarschijnlijkheids theorie. Aanvullende cursus
Onthoud of herken de basistermen uit de waarschijnlijkheidstheorie: onafhankelijke, tegengestelde, onverenigbare gebeurtenissen, enz. Aan de hand van eenvoudige voorbeelden en leuke problemen oefen je met het werken met cijfers en het opbouwen van de logica van oplossingen.
Dit is een optionele sprint. Dit betekent dat elke student zelf één van de opties kiest:
- Volg een aanvullende cursus van tien korte lessen, fris de theorie op en los problemen op.
- Open alleen het blok met interviewtaken, onthoud de praktijk zonder theorie.
- Sla de cursus volledig over of hervat deze wanneer er tijd en behoefte is.
Afstudeerproject van de eerste module
Leer hoe u voorlopig gegevensonderzoek kunt uitvoeren en hypothesen kunt formuleren en testen.
+1 project in portefeuille
Vind patronen die het succes van het spel bepalen.
Inleiding tot machinaal leren:
Beheers de basisconcepten van machine learning. Maak kennis met de Scikit-Learn-bibliotheek en gebruik deze om uw eerste machine learning-project te creëren.
+1 project in portefeuille
Ontwikkel een tariefaanbevelingssysteem voor een mobiele operator.
Begeleide training:
Duik dieper in het populairste gebied van machine learning: begeleid leren. Leer hoe u om kunt gaan met onevenwichtige gegevens.
+1 project in portefeuille
Voorspel de waarschijnlijkheid dat een klant de bank verlaat.
Machine learning in het bedrijfsleven:
Ontdek hoe machine learning (afgekort. MO) helpt het bedrijf bij het verzamelen van gegevens en hoe productstatistieken zich verhouden tot MO-statistieken. Leer hoe u nieuwe servicefunctionaliteit kunt lanceren met behulp van ML. Ontdek wat bedrijfsstatistieken, KPI's en A/B-testen zijn.
+1 project in portefeuille
Train een model dat helpt bij het identificeren van een nieuwe locatie voor olieproductie met het minste risico op verlies.
Afstudeerproject van de tweede module:
Gegevens voorbereiden voor machinaal leren. Evalueer de kwaliteit ervan met behulp van het model.
+1 project in portefeuille
Simuleer het proces van het smelten van gouderts om de werking van de onderneming te verbeteren.
Lineaire algebra:
Neem een kijkje in enkele van de algoritmen die je tot nu toe hebt geleerd en krijg een beter inzicht in hoe je ze kunt gebruiken. Beheers in de praktijk de belangrijkste concepten van lineaire algebra helemaal opnieuw: lineaire ruimtes, lineaire operatoren, Euclidische ruimtes.
+1 project in portefeuille
Gebruik de gegevensconversiemethode om de persoonlijke gegevens van klanten van verzekeringsmaatschappijen te beschermen.
Numerieke methodes:
Je analyseert een aantal algoritmen en past deze aan om praktische problemen op te lossen met behulp van numerieke methoden. Beheers geschatte berekeningen, schattingen van de complexiteit van algoritmen en gradiëntafdaling. Leer hoe neurale netwerken worden getraind en wat gradiëntversterking is.
+1 project in portefeuille
Ontwikkel een model om de kosten van een gebruikte auto te bepalen.
Tijdreeksen:
Tijdreeksen beschrijven hoe parameters, zoals het elektriciteitsverbruik of het aantal taxibestellingen, in de loop van de tijd veranderen. Je leert series analyseren, trends zoeken en seizoensinvloeden identificeren. Leer hoe u tabelgegevens en een tijdreeksregressieprobleem maakt.
+1 project in portefeuille
Bouw een model en voorspel piekbelastingen in taxi's.
Machine learning voor teksten:
Leer numerieke vectoren uit teksten te maken en classificatie- en regressieproblemen daarvoor op te lossen. Leer hoe TF-IDF-functies worden berekend en maak kennis met word2vec- en BERT-taalrepresentaties.
+1 project in portefeuille
Versnel het modereren van reacties in uw community door toxiciteitsbeoordelingen te automatiseren.
Basis-SQL:
Leer de basisprincipes van de SQL-querytaal en relationele algebra voor het werken met databases. Maak kennis met de mogelijkheden van het werken in PostgreSQL, een populair databasebeheersysteem (afgekort. DBMS). Leer zoekopdrachten met verschillende niveaus van complexiteit te schrijven en bedrijfsproblemen naar SQL te vertalen.
Je gaat werken met een database van een online winkel die gespecialiseerd is in films en muziek.
+1 project in portefeuille
Schrijf een reeks zoekopdrachten van verschillende complexiteit naar een database waarin gegevens worden opgeslagen over durfinvesteerders, startups en investeringen daarin.
Computer visie:
Leer eenvoudige computervisieproblemen op te lossen met behulp van kant-en-klare neurale netwerken en de Keras-bibliotheek. Maak kennis met Deep Learning.
+1 project in portefeuille
Bouw een model om aan de hand van een foto de geschatte leeftijd van een persoon te bepalen.
Onbegeleid leren:
Unsupervised learning is een van de methoden van machinaal leren waarbij het systeem een probleem oplost zonder vooraf gelabelde gegevens op basis van de kenmerken en structuur ervan. Meer informatie over problemen met clustering en detectie van afwijkingen.
Afstudeerproject:
Bevestig in het laatste project dat je een nieuw beroep onder de knie hebt. Verduidelijk de taak van de klant en doorloop alle stadia van data-analyse en machine learning. Nu zijn er geen lessen of huiswerk meer - alles is net als bij een echte baan.
+1 project in portefeuille
Projecten om uit te kiezen:
- Bouw een model dat het klantverloop van een telecommunicatiebedrijf voorspelt.
- Bouw een model dat de parameters van het technologische proces in een metallurgische fabriek voorspelt.
D
daryamamannikova
01.10.2020 G.
Voorbeeld van ideale online cursussen
In Yandex. Tijdens de workshop bestudeer ik het beroep van DataScience, een redelijk modieuze richting nu, en het bleek nogal moeilijk, zoals ze zeggen, moeilijk te leren - gemakkelijk te bestrijden. (adsbygoogle = venster.adsbygoogle || []).push({}); Er waren veel moeilijkheden onderweg, ik had niet genoeg tijd (ik haalde mijn diploma en werkte), de kracht om statistieken te begrijpen verliet me periodiek, het coronavirus sloot ons allemaal thuis op...
S
sergen355
14.07.2021 G.
Geweldig educatief project
Voordelen: eigen simulator, projectbeoordelingen, overleg, community in Slack, hulp bij elk probleem. Nadelen: het enige negatieve is dat er bij sommige onderwerpen geen compleet materiaal in de simulator zit, er is extra tijd nodig om zelfstandig naar informatie te zoeken.Ik heb gestudeerd aan de faculteit Data Science. Goede trainingsvorm. Sommigen komen binnen, anderen niet. Maar voor mij is dit het maximale...