Specialisatie "Data-analist" - cursus 2900 wrijven. van Stepik, training 36 lessen, Datum: 29 oktober 2023.
Gemengde Berichten / / December 05, 2023
Data-analist, productanalist, klantenbestandanalist, CRM-analist, datawetenschapper - al deze beroepen hebben te maken met data-analyse.
🎯 TOP-vereisten voor deze beroepen:
- Kennis van SQL en ervaring met het werken met databases;
- Kennis van de basissyntaxis van Python en kennis van de Pandas-bibliotheek;
- Kennis van statistiek en het vermogen om deze toe te passen in data-analyse;
- Analytisch denken.
Dit is geen volledige lijst. Webanalisten moeten bijvoorbeeld Google Analytics en Yandex kennen. Metrieken, en voor datawetenschappers: machinaal leren. Maar ik gaf de basisvereisten die in 70-80% van de vacatures voorkomen.
De specialisatie Data Analist bestaat momenteel uit twee cursussen:
1️⃣ SQL voor iedereen
Tijdens de cursus beheerst u SQL tot het niveau van het schrijven van complexe SQL-query's en oefent u met het gebruik van gegevens van een handelsbedrijf in een van de meest populaire databasebeheersystemen.
De cursus is bedoeld voor beginners die SQL onder de knie willen krijgen, maar ook voor degenen die SQL op een basisniveau kennen, maar de hiaten willen opvullen en hun kennis in de praktijk willen consolideren.
2️⃣ Python: data-analyse met panda's
De cursus is gewijd aan praktisch werken met Panda's. Je krijgt de nodige theorie en versterkt deze met een groot aantal praktijkproblemen.
De cursus is geschikt voor degenen die al bekend zijn met de basissyntaxis van Python:
- Kent de basisgegevenstypen (inclusief lijsten en woordenboeken) en de bewerkingen daarop;
- Heeft inzicht in wat een functie en een methode zijn.
De cursus kan zelfs worden gevolgd door beginners die zelfstandig kunnen uitzoeken hoe ze Python en de Pandas-bibliotheek moeten installeren. Maar als je net begint met Python, zul je naarmate de cursus vordert een aantal basiszaken zelf moeten leren. Overigens kun je in deze cursus basiskennis van de Python-syntaxis opdoen. Dan wordt het leren van Panda's veel gemakkelijker.
Het concept van de cursussen is gebaseerd op drie principes:
Eenvoud
De presentatie van het materiaal is toegankelijk en consistent - hierdoor kunt u stap voor stap de benodigde kennisbasis vormen.
Oefening
Er wordt veel aandacht besteed aan de praktijk - zodat je niet alleen de cursusproblemen oplost, maar de kennis in de toekomst ook kunt toepassen op echte projecten.
Steun
Stel gerust vragen in de reacties, ik vind het belangrijk dat alle stof geleerd wordt. Ik reageer binnen een dag op reacties.
De volgorde waarin de cursussen worden gevolgd is niet belangrijk.
1. SQL voor iedereen
Bewerkingen op één tafel
1. Inleiding tot de database
2. WHERE-rijen filteren. Reguliere expressies LIKE. EN en OF
3. Tekenreeksen sorteren ORDER BY
4. Aggregatiefuncties: COUNT, SUM, MIN, MAX, AVG. Aliassen
5. Groepering van GROUP BY- en HAVING-lijnen. Rapporten genereren
6. Oefen op basis van de resultaten van de 1e module
Bewerkingen op meerdere tafels
1. Begrippen primaire sleutel en externe sleutel. Soorten relaties in de database
2. Query's genereren uit meerdere tabellen. INNER JOIN en aliassen
3. LEFT JOIN en andere typen JOIN's
4. Meerdere tabellen samenvoegen met UNION en UNION ALL
5. Subquery's
6. Oefen op basis van de resultaten van de 2e module
Aanvullende belangrijke onderwerpen
1. CASE-expressie
2. Populaire functies voor het werken met strings
Praktische taken ter versterking van de cursusstof
1. Eenvoudige vragen
2. Complexe zoekopdrachten
3. Conclusie
2. Python: data-analyse met panda's
Dataframes afzonderlijk analyseren
1. Gegevens uit bestanden lezen
2. Snelle introductie tot data
3. Kolomuitvoer
4. Gegevenstypen
5. Rijen filteren
6. Normale uitdrukkingen
7. Snaren sorteren
8. Aggregatiefuncties
9. Rijgroepering
Analyse van meerdere gerelateerde dataframes
1. Voeg een samen. k. een join
2. Aaneenschakeling
Extra benodigde module
1. Werken met datums en tijden
2. Draaitabellen
3. Nieuwe manieren om dataframes te maken
4. Categorisering van nominale kenmerken
5. Waarden vervangen in een dataframe
6. Visualisatie bij panda's
7. Snijden
8. Conclusie