Panda's Basis voor Beginners - cursus RUB 990. van Stepik, training 46 lessen, datum 5 november 2023.
Gemengde Berichten / / December 04, 2023
Het doel van de cursus is niet alleen om te vertellen, maar om u te leren werken met de Numpy- en Pandas-bibliotheken.
Achter de schermen zit geen saaie docent, maar een datawetenschapper die dagelijks met deze bibliotheken werkt. In het formaat van live communicatie (de auteur lijkt via een camera met je te communiceren), zullen we leren werken in Panda's.
Over de cursus
1. Informatie
Numpy-basisprincipes
1. Waarom heb je Numpy nodig als je Panda's leert?
2. Oefenen: vorm, dtype, ndim, nullen, enen, arange
3. Gegevenstypen en hun conversie, rekenkunde, elementtoegang
4. Oefenen: rekenen, typeconversie, toegang tot elementen
5. Tweedimensionale en driedimensionale arrays. Indexen leren gebruiken
6. Oefening: het versterken van het werk met indexen
7. Maskeren en in stukken snijden, mooie indexering en ook opnieuw vormgeven
8. Oefening: leren de vorm van een array te veranderen
9. Meer over hervormen, transponeren, unaire en binaire functies
10. Oefening: consolideren van kennis over unaire en binaire functies
11. Logische functies en functie binnen een functie, maar ook waar en statistieken
12. Oefenen: het beheersen van handige functies
13. Functies any, all, sort, unique, in1d. Overzicht lineaire algebra
14. Permutatie- en shuffle-functies. Een array opslaan in een bestand
Inleiding tot Panda's
1. Eerste kennismaking met Serie
2. Oefenen: je kennis over de serie testen
3. Meer informatie over reeksen: indexen, optelling, controle op NaN
4. Oefening: subtiliteiten bij het werken met reeksen
5. Eerste kennismaking met DataFrame
6. Meer informatie over DataFrame: indexen, geneste woordenboeken, del en .T
7. Oefening: functies indexeren
8. Functies herindexeren, neerzetten en indexeren in een dataframe
9. Oefen: haal eruit wat je nodig hebt, verwijder wat je niet nodig hebt
10. Operators loc, iloc, at, iat. Toevoeging van meerdere dataframes
11. Toevoeging van dataframes, sorteren, rekenen met gaten
12. Beschrijvende statistieken. Unieke waarden
13. Test
14. Testen (vervolg)
Panda’s: werken met databronnen
1. Wat is het CSV-formaat en hoe kun je het temmen?
2. Meer informatie over pasverwerking
3. Grote bestanden in stukjes leren lezen
4. Wie is JSON en hoe kun je er vrienden mee worden?
5. Kennismaken met de formaten HTML, XML, PICKLE, HDF5
6. Het goede oude Excel en een beetje over databases
Panda's: gegevens opschonen en voorbereiden voor analyse
1. Leren omgaan met passen
2. Wij controleren gegevens op duplicaten en verwijderen deze
3. Over het vervangen van waarden en discretisatie
4. We identificeren de uitstoot en elimineren deze op de juiste manier
5. Matrices van dummyvariabelen maken
6. Werken met snaren is eenvoudiger dan het lijkt!
Panda's: het samenvoegen van gegevens en vormtransformatie
1. Introductie van hiërarchische indexering
2. Acties met meerdere indexen in dataframes
3. Leren dataframes te verbinden met behulp van merge
4. Analoog om samen te voegen; aaneenschakeling van dataframes met behulp van concat
5. Combineer data- en formuliertransformatie