Verwerken en analyseren van big data - gratis cursus van Open Onderwijs, training 2 weken, ongeveer 36 uur per week, Datum 29 november 2023.
Gemengde Berichten / / November 30, 2023
Ph.D. Functie: Universitair hoofddocent, Faculteit Besturingssystemen en Robotica, Universitair hoofddocent, Hogere School voor Digitale Cultuur, ITMO Universiteit
Kandidaat in de fysische en wiskundige wetenschappen Functie: universitair hoofddocent, Hogere School voor Digitale Cultuur, ITMO Universiteit
Ph.D. Functie: Universitair hoofddocent, Hogere School voor Digitale Cultuur, ITMO Universiteit
Module 1 Onderwerp 1.1 Inleiding tot datawetenschap Bespreekt soorten en bronnen van gegevens, principes het scheiden en combineren van gegevens, soorten schalen, methoden voor het opschonen en opvullen van gegevens, controle bereiken. Onderwerp 1.2 Hulpmiddelen voor gegevensverwerking Bespreekt primaire hulpmiddelen voor gegevensverwerking, zoals spreadsheets (Google spreadsheets en Excel), behandelt de kwesties van het sorteren en filteren van gegevens, middelen voor aggregatie en analyse van gegevens in tabelvorm (draaitabellen) Onderwerp 1.3 Visualisatie data De taken en methoden van datavisualisatie in verschillende tools (Google spreadsheets en Excel), presentatievormen van kwantitatieve en kwalitatieve data. Cognitieve datavisualisatie wordt overwogen. Onderwerp 1.4 Analyse en transformatie van gegevens Methoden voor het gladmaken en normaliseren van gegevens, kwesties van gegevenstransformatie worden overwogen. De soorten beschrijvende statistieken en methoden voor hun berekening worden in detail beschreven. Onderwerp 1.5 Werken met tijdreeksen De principes van het werken met tijdreeksen en methoden voor de analyse ervan worden besproken. Bijzondere aandacht wordt besteed aan technieken voor het afvlakken van tijdreeksen, het bepalen van trends en seizoenscomponenten van tijdreeksen.
Module 2 Big Data-opslag Onderwerp 2.1. Databasebeheersystemen De architectuur van informatiesystemen en de belangrijkste functies van databasebeheersystemen worden besproken. Onderwerp 2.2. Gestructureerde data ontwerpen De basisconcepten van het relationele (tabel)model worden besproken gegevens, het ontwerpen van gegevens in een relationeel model, regels voor het maken van tabellen en het definiƫren van integriteitsbeperkingen. Onderwerp 2.3. SQL - query's naar gegevens en databaseobjecten De principes van het construeren van query's naar gegevens in de SQL-taal worden overwogen, inclusief projectie, sorteren, selectievoorwaarden instellen, meerdere tabellen samenvoegen, verzamelingstheoretische bewerkingen, genest verzoeken. De lezing bespreekt ook databaseobjecten - views, procedures/functies, triggers. Het concept van indexen wordt gegeven, wat de efficiƫntie van het uitvoeren van een aantal query's kan verbeteren. Onderwerp 2.4. NoSQL-opslag Er wordt gekeken naar de basisconcepten en kenmerken van NoSQL-systemen, verschillende typen en beoordelingen van NoSQL-systemen: sleutelwaarde, document, kolom en grafiek. Principes voor het bouwen van query's op gegevens in NoSQL-opslag. Onderwerp 2.5. MongoDB - werken met documentopslag Bespreekt het organiseren van gegevens en het bouwen van query's in MongoDB. Er worden voorbeelden gegeven van het bouwen van query's in de MongoDB-demodatabase.