Data Architecture and Warehouse Design Training

Data Architecture & Warehouse Design

Komplexní školení v návrhu a implementaci podnikových datových řešení s dimenzionálním modelováním

Staňte se expertem na datové sklady, ETL procesy a cloudové datové platformy

10 týdnů
Max 10 účastníků
Osvědčení o absolvování

O tomto kurzu

Data Architecture & Warehouse Design je komplexní kurz zaměřený na navrhování a implementaci podnikových datových řešení. Během deseti týdnů získáte hloubkové znalosti o principech datové architektury, které jsou klíčové pro vytváření škálovatelných a efektivních datových platforem.

Kurz začíná základy dimenzionálního modelování, kde se naučíte navrhovat star a snowflake schémata. Tato technika je fundamentální pro datové sklady, protože umožňuje efektivní ukládání a dotazování historických dat. Projdete si různé typy dimenzí včetně slowly changing dimensions, které zachycují změny v čase.

Velký důraz je kladen na ETL a ELT procesy, které jsou páteří každého datového skladu. Naučíte se pracovat s nástroji jako Apache Airflow a Talend pro orchestraci datových pipeline. Pochopíte rozdíly mezi tradičním ETL přístupem a moderním ELT, který využívá výpočetní sílu cloudových platforem.

Práce s cloudovými datovými platformami tvoří podstatnou část kurzu. Získáte praktické zkušenosti se Snowflake, Google BigQuery a Amazon Redshift. Každá z těchto platforem má své specifické možnosti a my vám ukážeme, kdy a jak je využít pro různé use cases.

Klíčové oblasti kurzu

  • Dimenzionální modelování (star schema, snowflake schema)
  • ETL/ELT pipeline development a orchestrace
  • Cloud datové platformy (Snowflake, BigQuery, Redshift)
  • Data lake architektura a implementace
  • Metadata management a data cataloging
  • Real-time data processing s Apache Kafka

Výsledky a přínosy kurzu

Po absolvování kurzu budete schopni navrhovat a implementovat komplexní datová řešení pro podnikové prostředí. Získáte dovednosti, které jsou vysoce ceněné na trhu a otevřou vám možnosti práce jako datový architekt, data engineer nebo vedoucí datového týmu.

Naši absolventi pracují v různých typech organizací – od startupů po velké korporace. Datová architektura je kritická pro každou společnost, která chce efektivně využívat svá data pro obchodní rozhodování a analytiku.

Komplexní projekty

Během kurzu vytvoříte několik komplexních datových řešení včetně datového skladu pro retail, finančního data lake a real-time analytické platformy.

Cloud expertise

Získáte praktické zkušenosti s vedoucími cloudovými platformami, což je klíčová dovednost pro moderní datové role.

Kariérní posun

Absolventi často postupují do seniorních pozic s odpovědností za navrhování a vedení implementace podnikových datových platforem.

Leadership dovednosti

Naučíte se komunikovat s různými stakeholdery a vést technické týmy při implementaci datových projektů.

Kurz vás připraví na role, kde budete navrhovat celkovou datovou strategii organizace. Pochopíte, jak vyvážit technické požadavky s obchodními cíli a rozpočtovými omezeními. Naučíte se také principy cost optimization pro cloudové platformy, což je kritická dovednost v dnešním prostředí.

Získáte také zkušenosti s dokumentací datových řešení a komunikací architektonických rozhodnutí. To zahrnuje vytváření diagramů, technických specifikací a prezentací pro různé úrovně managementu.

Nástroje a technologie

V kurzu pracujete s moderními nástroji a technologiemi, které definují současnou datovou architekturu. Zaměřujeme se na řešení, která jsou široce používána v podnikové praxi.

Snowflake

Cloudová datová platforma s automatickým škálováním a separací výpočetních a úložných zdrojů.

BigQuery

Serverless datový sklad od Google s podporou pro petabyte-scale analýzy.

Redshift

Amazon Web Services datový sklad optimalizovaný pro analytické dotazy.

Pro orchestraci datových pipeline pracujete s Apache Airflow, což je leading open-source nástroj pro workflow management. Naučíte se vytvářet DAG (Directed Acyclic Graphs), schedulovat úlohy a monitorovat jejich běh.

Talend se používá pro vizuální návrh ETL procesů. Tento nástroj umožňuje rychlý vývoj datových transformací a integraci různých datových zdrojů bez nutnosti psát kód od základu.

Další technologie v kurzu

Apache Kafka

Real-time data streaming platforma

Apache Spark

Distribuované zpracování velkých dat

Python & SQL

Programovací jazyky pro datovou práci

dbt (data build tool)

Transformace dat v moderním data stack

Technické požadavky

Pro kurz potřebujete vlastní notebook s následujícími parametry:

  • Windows, macOS nebo Linux
  • Minimálně 16 GB RAM (doporučeno 32 GB)
  • Alespoň 100 GB volného místa na disku
  • Stabilní internetové připojení pro práci s cloudem

Standardy a přístupy

V kurzu se zaměřujeme na osvědčené postupy a standardy, které zajistí, že vaše datová řešení budou robustní, škálovatelná a udržitelná. Datová architektura není jen o technologiích, ale také o procesech a metodách.

Data governance framework je kritický pro každé podnikové datové řešení. Naučíte se definovat datové standardy, role a odpovědnosti, procesy pro správu dat a compliance požadavky. Důraz je kladen na vytváření datových katalogů a dokumentaci data lineage.

Security & Compliance

Implementace bezpečnostních opatření a splnění regulatorních požadavků.

  • Šifrování dat at-rest a in-transit
  • Access control a audit logging
  • GDPR a další compliance standardy
  • Data masking a anonymizace

Performance & Scalability

Optimalizace pro vysoký výkon a možnost růstu.

  • Partitioning a clustering strategie
  • Query optimization techniky
  • Caching mechanismy
  • Horizontální škálování

Cost optimization je klíčové téma při práci s cloudovými platformami. Naučíte se strategie pro minimalizaci nákladů včetně správného nastavení compute resources, využití spot instances, optimalizace storage tiers a monitoring spotřeby.

Disaster recovery a business continuity planning jsou další důležité oblasti. Projdete si strategie pro backup, replikaci dat a recovery procedures, které zajistí, že vaše datová řešení jsou odolná vůči výpadkům.

Metodologie a frameworks

V kurzu používáme osvědčené přístupy:

  • Kimball methodology pro dimenzionální modelování
  • Data Vault 2.0 pro enterprise data warehousing
  • Lambda a Kappa architecture pro real-time processing
  • DataOps principy pro agilní datové projekty

Pro koho je kurz určen

Data Architecture & Warehouse Design je navržen pro profesionály, kteří chtějí posunout svou kariéru směrem k datové architektuře a návrhu podnikových datových řešení.

Data Engineers

Pokud implementujete ETL procesy a chcete porozumět širším architektonickým principům a navrhnout celkové datové strategie.

Database Administrators

Pro správce databází, kteří chtějí rozšířit své znalosti o cloudové platformy a moderní přístupy k datovému managementu.

BI Analytici

Analytici, kteří chtějí pochopit backend datových řešení a být schopni komunikovat s technickými týmy efektivněji.

Solution Architects

IT architekti, kteří chtějí specializovat na datovou doménu a navrhovat komplexní datová řešení pro podniky.

Kurz je vhodný pro profesionály s alespoň dvouletou praxí v oblasti práce s daty. Očekává se znalost SQL a základní porozumění databázovým systémům. Zkušenosti s programováním (Python, Java nebo podobný jazyk) jsou výhodou.

Předpoklady

  • Pokročilé znalosti SQL a databázových systémů
  • Základní programovací dovednosti (Python výhodou)
  • Porozumění obchodním procesům a požadavkům
  • Alespoň 2 roky praxe v datové oblasti
  • Vlastní notebook splňující technické požadavky

Měření výsledků a pokroku

Kurz je rozdělen do deseti týdenních modulů s důrazem na praktické projekty. Každý modul obsahuje teoretickou část následovanou hands-on cvičeními na reálných use cases.

Váš pokrok hodnotíme prostřednictvím projektových prací, které odevzdáváte každé dva týdny. Tyto projekty pokrývají různé aspekty datové architektury – od návrhu schémat po implementaci kompletních ETL pipeline.

Struktura kurzu

1

Základy datové architektury

Koncepční modelování, architektonické vzory, požadavky a omezení

2

Dimenzionální modelování

Star schema, snowflake schema, slowly changing dimensions

3

Cloud datové platformy I

Snowflake architektura, virtual warehouses, data sharing

4

Cloud datové platformy II

BigQuery a Redshift, srovnání a use cases

5

ETL/ELT pipeline development

Apache Airflow, orchestrace, monitoring a error handling

6

Data lake architektura

Bronze-silver-gold pattern, data lakehouse koncepty

7

Real-time data processing

Apache Kafka, stream processing, Lambda architecture

8

Data governance a metadata management

Data catalog, lineage, quality frameworks

9

Performance a cost optimization

Query tuning, resource management, cloud cost control

10

Finální projekt

Návrh a implementace komplexní datové platformy

Finální projekt představuje návrh a částečnou implementaci kompletní datové platformy pro fiktivní společnost. Zahrnuje architekturu, dimenzionální model, ETL pipeline a dokumentaci. Projekt prezentujete před ostatními účastníky a lektory.

Po úspěšném dokončení kurzu obdržíte osvědčení, které specifikuje získané kompetence v oblasti datové architektury. Toto osvědčení má hodnotu při hledání nových příležitostí nebo při postupu v současné organizaci.

Další kurzy

Prohlédněte si naše další specializované kurzy v oblasti datové implementace

Business Intelligence Analyst Essentials

Základní kurz business intelligence s praktickou implementací BI nástrojů jako Power BI, Tableau a Qlik Sense.

Advanced Analytics & Statistical Modeling

Hloubkové zkoumání statistických metod a pokročilých analytických technik pomocí R a Python pro prediktivní modelování.

Připraveni stát se datovým architektem?

Kurz začíná 3. listopadu 2025. Místa jsou omezená, zajistěte si své včas.

Cena kurzu: 39 500 Kč