📅 Objetivo: Cargar los datos, crear las tablas y responder las preguntas.
# BigQuery NYC Taxi Homework 🚖
## 🔹 Descripción
Este repositorio contiene las consultas SQL y configuraciones para el Homework del Módulo 3.
## 📊 Preguntas y Respuestas
1️⃣ **Total registros:** **20,332,093**
2️⃣ **Bytes estimados:** 0 MB (External) vs. **155.12** MB (Materialized)
3️⃣ **Columnar Storage en BigQuery**
4️⃣ **Registros con fare_amount = 0:** 20,188,016
5️⃣ **Mejor estrategia:** Partition by `tpep_dropoff_datetime`, Cluster on `VendorID`
6️⃣ **Bytes escaneados en query con `VendorID`:** 310.24 MB vs. 26.84 MB
7️⃣ **Datos externos almacenados en:** GCP Bucket
8️⃣ **¿Siempre clusterizar?** ❌ No siempre
## 📜 SQL Queries
Consulta todas las queries en [`queries.sql`](queries.sql)
1️⃣ Crear un Proyecto en GCP
2️⃣ Configurar Autenticación con Google Cloud SDK
Instala el SDK si no lo tienes:
bash
CopiarEditar
curl <https://sdk.cloud.google.com> | bash
Inicia sesión y configura el proyecto:
bash
CopiarEditar
gcloud auth login
gcloud config set project [TU_PROJECT_ID]
3️⃣ Crear un Bucket en Google Cloud Storage (GCS)
nyc-taxi-data-2024
).1️⃣ Abre la consola de BigQuery en tu navegador:
👉 BigQuery Console
2️⃣ Selecciona tu Proyecto en la parte superior izquierda.