반응형
다음의 영상을 제가 필요한 내용 위주로 요약한 글입니다.
What is Data Pipeline | How to design Data Pipeline ? - ETL vs Data pipeline (2023)
- ETL : extract, transform, load 데이터의 추출, 가공, 적재
기본작동 방식 과 아키텍처
What is Data Pipeline
Data pipeline automates data supply(including data processing) to data consumers
(point A) (point C, D , E, ... ) (point B)
Data Producers Data Pipeline Data Comsumers
Data Consumers' needs
- Data Science
- Machine Learning
- Business Analytics
- Reporting
Diff between traditional ETL and Data Pipeline
Data pipeline 이 더 넓은 개념이며, ETL은 Data pipeline mechanism 세부 개념이다.
2 types of data pipeline
- Real Time Data Pipeline
- Batch Data Pipeline
- Lambda Architecture (Real Time + Batch)
Lambda Architecture

Data Pipeline Architecture Example

반응형
'개발자가 되는 방법' 카테고리의 다른 글
| "API의 컨트롤 자원", Control Resource (0) | 2024.02.10 |
|---|---|
| [Django] 함수 기반 뷰 + 데코레이터 vs 클래스 기반 뷰 + 믹스인 (0) | 2024.01.30 |
| 데이터 아키텍처(Data Architecture) (1) (1) | 2024.01.05 |
| [자습서] Django Debug Toolbar 설치하기 (0) | 2023.07.14 |
| 데브옵스(또는 Dev Ops) 란 ? (0) | 2023.07.12 |