Data Architecture & Warehouse Design
Komplexní školení v návrhu a implementaci podnikových datových řešení s dimenzionálním modelováním
Staňte se expertem na datové sklady, ETL procesy a cloudové datové platformy
O tomto kurzu
Data Architecture & Warehouse Design je komplexní kurz zaměřený na navrhování a implementaci podnikových datových řešení. Během deseti týdnů získáte hloubkové znalosti o principech datové architektury, které jsou klíčové pro vytváření škálovatelných a efektivních datových platforem.
Kurz začíná základy dimenzionálního modelování, kde se naučíte navrhovat star a snowflake schémata. Tato technika je fundamentální pro datové sklady, protože umožňuje efektivní ukládání a dotazování historických dat. Projdete si různé typy dimenzí včetně slowly changing dimensions, které zachycují změny v čase.
Velký důraz je kladen na ETL a ELT procesy, které jsou páteří každého datového skladu. Naučíte se pracovat s nástroji jako Apache Airflow a Talend pro orchestraci datových pipeline. Pochopíte rozdíly mezi tradičním ETL přístupem a moderním ELT, který využívá výpočetní sílu cloudových platforem.
Práce s cloudovými datovými platformami tvoří podstatnou část kurzu. Získáte praktické zkušenosti se Snowflake, Google BigQuery a Amazon Redshift. Každá z těchto platforem má své specifické možnosti a my vám ukážeme, kdy a jak je využít pro různé use cases.
Klíčové oblasti kurzu
- Dimenzionální modelování (star schema, snowflake schema)
- ETL/ELT pipeline development a orchestrace
- Cloud datové platformy (Snowflake, BigQuery, Redshift)
- Data lake architektura a implementace
- Metadata management a data cataloging
- Real-time data processing s Apache Kafka
Výsledky a přínosy kurzu
Po absolvování kurzu budete schopni navrhovat a implementovat komplexní datová řešení pro podnikové prostředí. Získáte dovednosti, které jsou vysoce ceněné na trhu a otevřou vám možnosti práce jako datový architekt, data engineer nebo vedoucí datového týmu.
Naši absolventi pracují v různých typech organizací – od startupů po velké korporace. Datová architektura je kritická pro každou společnost, která chce efektivně využívat svá data pro obchodní rozhodování a analytiku.
Komplexní projekty
Během kurzu vytvoříte několik komplexních datových řešení včetně datového skladu pro retail, finančního data lake a real-time analytické platformy.
Cloud expertise
Získáte praktické zkušenosti s vedoucími cloudovými platformami, což je klíčová dovednost pro moderní datové role.
Kariérní posun
Absolventi často postupují do seniorních pozic s odpovědností za navrhování a vedení implementace podnikových datových platforem.
Leadership dovednosti
Naučíte se komunikovat s různými stakeholdery a vést technické týmy při implementaci datových projektů.
Kurz vás připraví na role, kde budete navrhovat celkovou datovou strategii organizace. Pochopíte, jak vyvážit technické požadavky s obchodními cíli a rozpočtovými omezeními. Naučíte se také principy cost optimization pro cloudové platformy, což je kritická dovednost v dnešním prostředí.
Získáte také zkušenosti s dokumentací datových řešení a komunikací architektonických rozhodnutí. To zahrnuje vytváření diagramů, technických specifikací a prezentací pro různé úrovně managementu.
Nástroje a technologie
V kurzu pracujete s moderními nástroji a technologiemi, které definují současnou datovou architekturu. Zaměřujeme se na řešení, která jsou široce používána v podnikové praxi.
Snowflake
Cloudová datová platforma s automatickým škálováním a separací výpočetních a úložných zdrojů.
BigQuery
Serverless datový sklad od Google s podporou pro petabyte-scale analýzy.
Redshift
Amazon Web Services datový sklad optimalizovaný pro analytické dotazy.
Pro orchestraci datových pipeline pracujete s Apache Airflow, což je leading open-source nástroj pro workflow management. Naučíte se vytvářet DAG (Directed Acyclic Graphs), schedulovat úlohy a monitorovat jejich běh.
Talend se používá pro vizuální návrh ETL procesů. Tento nástroj umožňuje rychlý vývoj datových transformací a integraci různých datových zdrojů bez nutnosti psát kód od základu.
Další technologie v kurzu
Apache Kafka
Real-time data streaming platforma
Apache Spark
Distribuované zpracování velkých dat
Python & SQL
Programovací jazyky pro datovou práci
dbt (data build tool)
Transformace dat v moderním data stack
Technické požadavky
Pro kurz potřebujete vlastní notebook s následujícími parametry:
- Windows, macOS nebo Linux
- Minimálně 16 GB RAM (doporučeno 32 GB)
- Alespoň 100 GB volného místa na disku
- Stabilní internetové připojení pro práci s cloudem
Standardy a přístupy
V kurzu se zaměřujeme na osvědčené postupy a standardy, které zajistí, že vaše datová řešení budou robustní, škálovatelná a udržitelná. Datová architektura není jen o technologiích, ale také o procesech a metodách.
Data governance framework je kritický pro každé podnikové datové řešení. Naučíte se definovat datové standardy, role a odpovědnosti, procesy pro správu dat a compliance požadavky. Důraz je kladen na vytváření datových katalogů a dokumentaci data lineage.
Security & Compliance
Implementace bezpečnostních opatření a splnění regulatorních požadavků.
- Šifrování dat at-rest a in-transit
- Access control a audit logging
- GDPR a další compliance standardy
- Data masking a anonymizace
Performance & Scalability
Optimalizace pro vysoký výkon a možnost růstu.
- Partitioning a clustering strategie
- Query optimization techniky
- Caching mechanismy
- Horizontální škálování
Cost optimization je klíčové téma při práci s cloudovými platformami. Naučíte se strategie pro minimalizaci nákladů včetně správného nastavení compute resources, využití spot instances, optimalizace storage tiers a monitoring spotřeby.
Disaster recovery a business continuity planning jsou další důležité oblasti. Projdete si strategie pro backup, replikaci dat a recovery procedures, které zajistí, že vaše datová řešení jsou odolná vůči výpadkům.
Metodologie a frameworks
V kurzu používáme osvědčené přístupy:
- Kimball methodology pro dimenzionální modelování
- Data Vault 2.0 pro enterprise data warehousing
- Lambda a Kappa architecture pro real-time processing
- DataOps principy pro agilní datové projekty
Pro koho je kurz určen
Data Architecture & Warehouse Design je navržen pro profesionály, kteří chtějí posunout svou kariéru směrem k datové architektuře a návrhu podnikových datových řešení.
Data Engineers
Pokud implementujete ETL procesy a chcete porozumět širším architektonickým principům a navrhnout celkové datové strategie.
Database Administrators
Pro správce databází, kteří chtějí rozšířit své znalosti o cloudové platformy a moderní přístupy k datovému managementu.
BI Analytici
Analytici, kteří chtějí pochopit backend datových řešení a být schopni komunikovat s technickými týmy efektivněji.
Solution Architects
IT architekti, kteří chtějí specializovat na datovou doménu a navrhovat komplexní datová řešení pro podniky.
Kurz je vhodný pro profesionály s alespoň dvouletou praxí v oblasti práce s daty. Očekává se znalost SQL a základní porozumění databázovým systémům. Zkušenosti s programováním (Python, Java nebo podobný jazyk) jsou výhodou.
Předpoklady
- Pokročilé znalosti SQL a databázových systémů
- Základní programovací dovednosti (Python výhodou)
- Porozumění obchodním procesům a požadavkům
- Alespoň 2 roky praxe v datové oblasti
- Vlastní notebook splňující technické požadavky
Měření výsledků a pokroku
Kurz je rozdělen do deseti týdenních modulů s důrazem na praktické projekty. Každý modul obsahuje teoretickou část následovanou hands-on cvičeními na reálných use cases.
Váš pokrok hodnotíme prostřednictvím projektových prací, které odevzdáváte každé dva týdny. Tyto projekty pokrývají různé aspekty datové architektury – od návrhu schémat po implementaci kompletních ETL pipeline.
Struktura kurzu
Základy datové architektury
Koncepční modelování, architektonické vzory, požadavky a omezení
Dimenzionální modelování
Star schema, snowflake schema, slowly changing dimensions
Cloud datové platformy I
Snowflake architektura, virtual warehouses, data sharing
Cloud datové platformy II
BigQuery a Redshift, srovnání a use cases
ETL/ELT pipeline development
Apache Airflow, orchestrace, monitoring a error handling
Data lake architektura
Bronze-silver-gold pattern, data lakehouse koncepty
Real-time data processing
Apache Kafka, stream processing, Lambda architecture
Data governance a metadata management
Data catalog, lineage, quality frameworks
Performance a cost optimization
Query tuning, resource management, cloud cost control
Finální projekt
Návrh a implementace komplexní datové platformy
Finální projekt představuje návrh a částečnou implementaci kompletní datové platformy pro fiktivní společnost. Zahrnuje architekturu, dimenzionální model, ETL pipeline a dokumentaci. Projekt prezentujete před ostatními účastníky a lektory.
Po úspěšném dokončení kurzu obdržíte osvědčení, které specifikuje získané kompetence v oblasti datové architektury. Toto osvědčení má hodnotu při hledání nových příležitostí nebo při postupu v současné organizaci.
Další kurzy
Prohlédněte si naše další specializované kurzy v oblasti datové implementace
Business Intelligence Analyst Essentials
Základní kurz business intelligence s praktickou implementací BI nástrojů jako Power BI, Tableau a Qlik Sense.
Advanced Analytics & Statistical Modeling
Hloubkové zkoumání statistických metod a pokročilých analytických technik pomocí R a Python pro prediktivní modelování.
Připraveni stát se datovým architektem?
Kurz začíná 3. listopadu 2025. Místa jsou omezená, zajistěte si své včas.
Cena kurzu: 39 500 Kč