Moderne benaderingen van gegevensbeheer - cursus RUB 27.900. van IBS Training Center, training 16 uur, Datum 26 november 2023.
Gemengde Berichten / / December 02, 2023
Bij het ontwerpen van applicaties is een van de belangrijke beslissingen de manier waarop gegevens worden opgeslagen. Decennia lang waren relationele DBMS'en de eerste en enige optie; projecten verschilden alleen in de mate van normalisatie, locatie van bedrijfslogica, enz. De laatsten Tien tot vijftien jaar lang zijn alternatieve systemen snel tot bloei gekomen - van objectgeoriënteerde en documentgeoriënteerde DBMS'en tot gedistribueerde bestandssystemen en stroomverwerkingssystemen gegevens. De cursus onderzoekt een reeks moderne oplossingen die langdurige veilige opslag van gegevens mogelijk maken, redenen voor de opkomst van oplossingen van verschillende klassen, hun voordelen, nadelen en voorkeursmethoden gebruik.
Behandelde onderwerpen:
1. Evolutie van benaderingen van dataopslag (theorie – 2 uur).
Databases, datawarehouses, database-engines, massaal parallelle architecturen, hyperconvergentie.
2. Relationeel model (theorie – 2 uur).
Welke problemen lost het op, en tegen welke prijs?
Replicatie, sharding, gedistribueerde transacties.
3. Minimaal Key-Value-model (theorie – 1 uur, praktijk – 1 uur).
Sleutelstructuuropties, waardestructuuropties, software-interfaces.
Efficiëntie van het gebruik van niet-relationele databases: noodzakelijke en voldoende voorwaarden [Cassandra, HBase].
4. Documentgericht model [MongoDB] (theorie – 0,5 uur, praktijk – 0,5 uur).
5. Gedistribueerde bestandssystemen in plaats van datamodellen: clusterarchitectuur [HDFS] (theorie - 1 uur, praktijk - 1 uur).
6. SQL over gedistribueerde bestandssystemen (theorie – 1 uur, praktijk – 2 uur).
Architectuuropties, bestandsformaten, beperkingen, transacties [Hive, Spark, Spark SQL, Parquet, ORC].
7. Gedistribueerde gegevensopslagsystemen in RAM [Hazelcast, Ignite, Tarantool] (theorie – 1 uur).
8. Gedistribueerde OLAP-systemen [Clickhouse, Druid] (theorie – 1 uur).
9. Verwerken van datastromen [Spark Streaming] (theorie – 1 uur).
10. Zelfconfigurerende en autonome databases (theorie – 1 uur).