GA4 데이터를 BigQuery, Airflow, dbt, Superset으로 운영하기 위한 데이터 플랫폼 monorepo입니다.
GA4
-> BigQuery raw_ga4
-> Airflow + dbt on Docker Compose
-> BigQuery bronze/silver/gold
-> Superset dashboards
BigQuery가 대량 데이터 저장과 처리를 담당합니다. VM은 Airflow, dbt, Superset, metadata DB를 실행하고 관리하는 서버입니다.
KOIN_DATA/
AGENTS.md
README.md
.env.example
docker-compose.yml
docker/
airflow/
superset/
airflow/
dags/
plugins/
logs/
dbt/
koin/ # 초기에는 빈 폴더, 모델은 단계적으로 추가
scripts/
docs/
secrets/
data/
- 환경변수 템플릿을 복사합니다.
cp .env.example .env-
.env값을 채웁니다. -
서비스를 빌드하고 실행합니다.
docker compose up -d --build- 필요하면 Airflow를 초기화합니다.
./scripts/init_airflow.sh- GitHub repo:
KOIN_DATA - Docker project:
koin-data - dbt project:
koin - Python, dbt, SQL 식별자:
underscore_case - 환경변수 prefix:
KOIN_DATA_