diff --git a/.devcontainer/devcontainer.json b/.devcontainer/devcontainer.json
new file mode 100644
index 0000000..0cc57cf
--- /dev/null
+++ b/.devcontainer/devcontainer.json
@@ -0,0 +1,33 @@
+{
+  "name": "Python 3",
+  // Or use a Dockerfile or Docker Compose file. More info: https://containers.dev/guide/dockerfile
+  "image": "mcr.microsoft.com/devcontainers/python:1-3.11-bookworm",
+  "customizations": {
+    "codespaces": {
+      "openFiles": [
+        "README.md",
+        "streamlit_app.py"
+      ]
+    },
+    "vscode": {
+      "settings": {},
+      "extensions": [
+        "ms-python.python",
+        "ms-python.vscode-pylance"
+      ]
+    }
+  },
+  "updateContentCommand": "[ -f packages.txt ] && sudo apt update && sudo apt upgrade -y && sudo xargs apt install -y <packages.txt; [ -f requirements.txt ] && pip3 install --user -r requirements.txt; pip3 install --user streamlit; echo '✅ Packages installed and Requirements met'",
+  "postAttachCommand": {
+    "server": "streamlit run streamlit_app.py --server.enableCORS false --server.enableXsrfProtection false"
+  },
+  "portsAttributes": {
+    "8501": {
+      "label": "Application",
+      "onAutoForward": "openPreview"
+    }
+  },
+  "forwardPorts": [
+    8501
+  ]
+}
\ No newline at end of file
diff --git a/.gitignore b/.gitignore
index cff8e75..bb93d83 100644
--- a/.gitignore
+++ b/.gitignore
@@ -6,4 +6,7 @@ __pycache__/
 .pytest_cache/
 
 # Streamlit secrets
-.streamlit/secrets.toml
\ No newline at end of file
+.streamlit/secrets.toml
+
+# Local Google Cloud service account keys
+sipa-adv-c-bouncing-penguin-*.json
diff --git a/load_data_to_bq.py b/load_data_to_bq.py
index 20d5902..6b93b93 100644
--- a/load_data_to_bq.py
+++ b/load_data_to_bq.py
@@ -14,6 +14,7 @@
 
 PROJECT_ID = "sipa-adv-c-bouncing-penguin"
 DATASET_ID = "mta_data"
+API_ROW_LIMIT = 50000
 
 SCOPES = [
     "https://www.googleapis.com/auth/bigquery",
@@ -28,6 +29,9 @@ class DataSource:
     order_column: str
     date_columns: tuple[str, ...]
     numeric_columns: tuple[str, ...]
+    required_columns: tuple[str, ...]
+    minimum_rows: int
+    minimum_date: str
 
 
 DATA_SOURCES = {
@@ -53,6 +57,15 @@ class DataSource:
             "staten_island_railway_total_estimated_ridership",
             "staten_island_railway_pct_of_comparable_pre_pandemic_day",
         ),
+        required_columns=(
+            "date",
+            "subways_total_estimated_ridership",
+            "subways_pct_of_comparable_pre_pandemic_day",
+            "buses_total_estimated_ridership",
+            "buses_pct_of_comparable_pre_pandemic_day",
+        ),
+        minimum_rows=1000,
+        minimum_date="2020-03-01",
     ),
     "covid": DataSource(
         name="NYC COVID cases",
@@ -72,6 +85,9 @@ class DataSource:
             "qn_case_count",
             "si_case_count",
         ),
+        required_columns=("date_of_interest", "case_count"),
+        minimum_rows=1000,
+        minimum_date="2020-03-01",
     ),
 }
 
@@ -129,13 +145,58 @@ def ensure_dataset_exists(credentials) -> None:
     client.create_dataset(dataset, exists_ok=True)
 
 
+def validate_source_frame(df: pd.DataFrame, source: DataSource) -> None:
+    """Fail before replacing BigQuery when a source pull looks incomplete."""
+    missing = [column for column in source.required_columns if column not in df.columns]
+    if missing:
+        raise RuntimeError(f"{source.name} is missing required columns: {missing}")
+
+    if len(df) < source.minimum_rows:
+        raise RuntimeError(
+            f"{source.name} returned only {len(df)} rows; "
+            f"expected at least {source.minimum_rows}."
+        )
+
+    if len(df) >= API_ROW_LIMIT:
+        raise RuntimeError(
+            f"{source.name} hit the {API_ROW_LIMIT:,}-row API limit. "
+            "Add pagination before replacing the BigQuery table."
+        )
+
+    date_column = source.date_columns[0]
+    if df[date_column].isna().any():
+        raise RuntimeError(f"{source.name} has null values in {date_column}.")
+
+    expected_min = pd.Timestamp(source.minimum_date)
+    actual_min = df[date_column].min()
+    if actual_min > expected_min:
+        raise RuntimeError(
+            f"{source.name} starts at {actual_min.date()}, "
+            f"but should include data from {expected_min.date()}."
+        )
+
+    actual_max = df[date_column].max()
+    if actual_max <= actual_min:
+        raise RuntimeError(f"{source.name} does not cover a usable date range.")
+
+    bad_numeric_columns = [
+        column
+        for column in source.required_columns
+        if column in source.numeric_columns and df[column].isna().all()
+    ]
+    if bad_numeric_columns:
+        raise RuntimeError(
+            f"{source.name} has all-null required numeric columns: {bad_numeric_columns}"
+        )
+
+
 def fetch_source(source: DataSource) -> pd.DataFrame:
     """Pull a dataset from an NYC Open Data endpoint."""
     print(f"Fetching {source.name} from {source.api_url} ...")
     sys.stdout.flush()
     response = requests.get(
         source.api_url,
-        params={"$limit": 50000, "$order": source.order_column},
+        params={"$limit": API_ROW_LIMIT, "$order": source.order_column},
         timeout=60,
     )
     response.raise_for_status()
@@ -155,6 +216,8 @@ def fetch_source(source: DataSource) -> pd.DataFrame:
         if column in df.columns:
             df[column] = pd.to_numeric(df[column], errors="coerce")
 
+    validate_source_frame(df, source)
+
     date_column = source.date_columns[0]
     print(
         "Fetched "
diff --git a/pages/1_MTA_Ridership.py b/pages/1_MTA_Ridership.py
index 294e755..91f0c62 100644
--- a/pages/1_MTA_Ridership.py
+++ b/pages/1_MTA_Ridership.py
@@ -17,6 +17,7 @@ def get_mta_page_columns(selected_services: list[str]) -> tuple[str, ...]:
 
 def main() -> None:
     st.title("MTA Daily Ridership Analysis")
+    st.caption("Default view loads only the latest 180 days for a faster deployed app.")
 
     selected_services = st.multiselect(
         "Select services",
@@ -35,35 +36,37 @@ def main() -> None:
         key="mta_page_time_window_v1",
     )
 
-    try:
-        if time_window == "Recent 180 days":
-            df = load_mta_data(columns=get_mta_page_columns(selected_services), lookback_days=180)
-        elif time_window == "Recent 365 days":
-            df = load_mta_data(columns=get_mta_page_columns(selected_services), lookback_days=365)
-        elif time_window == "Full history":
-            df = load_mta_data(columns=get_mta_page_columns(selected_services))
-        else:
-            today = date.today()
-            default_start = today - timedelta(days=180)
-            selected_dates = st.date_input(
-                "Date range",
-                value=(default_start, today),
-                min_value=MTA_MIN_DATE,
-                max_value=today,
-                key="mta_page_date_range_v3",
-            )
-            start_date = default_start
-            end_date = today
-            if len(selected_dates) == 2:
-                start_date, end_date = selected_dates
-            df = load_mta_data(
-                columns=get_mta_page_columns(selected_services),
-                start_date=str(start_date),
-                end_date=str(end_date),
-            )
-    except Exception as exc:
-        st.error(f"Failed to load MTA data from BigQuery: {exc}")
-        return
+    requested_columns = get_mta_page_columns(selected_services)
+    with st.spinner("Loading MTA data from BigQuery..."):
+        try:
+            if time_window == "Recent 180 days":
+                df = load_mta_data(columns=requested_columns, lookback_days=180)
+            elif time_window == "Recent 365 days":
+                df = load_mta_data(columns=requested_columns, lookback_days=365)
+            elif time_window == "Full history":
+                df = load_mta_data(columns=requested_columns)
+            else:
+                today = date.today()
+                default_start = today - timedelta(days=180)
+                selected_dates = st.date_input(
+                    "Date range",
+                    value=(default_start, today),
+                    min_value=MTA_MIN_DATE,
+                    max_value=today,
+                    key="mta_page_date_range_v3",
+                )
+                start_date = default_start
+                end_date = today
+                if isinstance(selected_dates, tuple) and len(selected_dates) == 2:
+                    start_date, end_date = selected_dates
+                df = load_mta_data(
+                    columns=requested_columns,
+                    start_date=str(start_date),
+                    end_date=str(end_date),
+                )
+        except Exception as exc:
+            st.error(f"Failed to load MTA data from BigQuery: {exc}")
+            return
 
     st.caption(
         "Source: BigQuery table `mta_data.daily_ridership` refreshed with `load_data_to_bq.py`."
diff --git a/pages/2_Second_Dataset.py b/pages/2_Second_Dataset.py
index 7cdc281..6d74619 100644
--- a/pages/2_Second_Dataset.py
+++ b/pages/2_Second_Dataset.py
@@ -12,6 +12,7 @@ def main() -> None:
     st.markdown(
         "This page uses BigQuery-hosted COVID case data to contextualize changes in MTA ridership."
     )
+    st.caption("Default view loads only the latest 180 days for a faster deployed app.")
 
     time_window = st.radio(
         "Time window",
@@ -20,31 +21,32 @@ def main() -> None:
         key="covid_page_time_window_v1",
     )
 
-    try:
-        if time_window == "Recent 180 days":
-            df = load_covid_data(lookback_days=180)
-        elif time_window == "Recent 365 days":
-            df = load_covid_data(lookback_days=365)
-        elif time_window == "Full history":
-            df = load_covid_data()
-        else:
-            today = date.today()
-            default_start = today - timedelta(days=180)
-            selected_dates = st.date_input(
-                "Date range",
-                value=(default_start, today),
-                min_value=COVID_MIN_DATE,
-                max_value=today,
-                key="covid_page_date_range_v3",
-            )
-            start_date = default_start
-            end_date = today
-            if len(selected_dates) == 2:
-                start_date, end_date = selected_dates
-            df = load_covid_data(start_date=str(start_date), end_date=str(end_date))
-    except Exception as exc:
-        st.error(f"Failed to load COVID data from BigQuery: {exc}")
-        return
+    with st.spinner("Loading COVID data from BigQuery..."):
+        try:
+            if time_window == "Recent 180 days":
+                df = load_covid_data(lookback_days=180)
+            elif time_window == "Recent 365 days":
+                df = load_covid_data(lookback_days=365)
+            elif time_window == "Full history":
+                df = load_covid_data()
+            else:
+                today = date.today()
+                default_start = today - timedelta(days=180)
+                selected_dates = st.date_input(
+                    "Date range",
+                    value=(default_start, today),
+                    min_value=COVID_MIN_DATE,
+                    max_value=today,
+                    key="covid_page_date_range_v3",
+                )
+                start_date = default_start
+                end_date = today
+                if isinstance(selected_dates, tuple) and len(selected_dates) == 2:
+                    start_date, end_date = selected_dates
+                df = load_covid_data(start_date=str(start_date), end_date=str(end_date))
+        except Exception as exc:
+            st.error(f"Failed to load COVID data from BigQuery: {exc}")
+            return
 
     st.caption("Source: BigQuery table `mta_data.nyc_covid_cases`.")
     st.write(
diff --git a/streamlit_app.py b/streamlit_app.py
index a496f2f..9771971 100644
--- a/streamlit_app.py
+++ b/streamlit_app.py
@@ -2,7 +2,9 @@
 
 import pandas as pd
 import plotly.express as px
+import plotly.graph_objects as go
 import streamlit as st
+from plotly.subplots import make_subplots
 
 from utils import (
     MTA_MIN_DATE,
@@ -11,34 +13,100 @@
     get_holiday_df,
     get_latest_recovery,
     get_weekday_weekend_comparison,
+    load_covid_data,
     load_mta_data,
 )
 
 st.set_page_config(page_title="MTA Ridership Dashboard", layout="wide")
 
+MODE_COLORS = {
+    "Subway": "#2563eb",
+    "Bus": "#f97316",
+    "LIRR": "#16a34a",
+    "Metro-North": "#9333ea",
+    "Bridges & Tunnels": "#dc2626",
+}
 
-def get_dashboard_columns(view: str, selected_modes: list[str]) -> tuple[str, ...]:
-    columns = {"date"}
-
-    if view == "Overview":
-        columns.add(TRANSIT_MODES["Subway"]["ridership"])
-        for mode in selected_modes:
-            mode_columns = TRANSIT_MODES.get(mode, {})
-            columns.update(mode_columns.values())
-        for mode_columns in TRANSIT_MODES.values():
-            columns.add(mode_columns["recovery"])
-    elif view == "Comparison":
-        for mode_columns in TRANSIT_MODES.values():
-            columns.add(mode_columns["recovery"])
-    elif view == "Calendar":
-        for mode_columns in TRANSIT_MODES.values():
-            columns.add(mode_columns["recovery"])
-    else:
-        columns.add(TRANSIT_MODES["Subway"]["recovery"])
+
+def get_dashboard_columns(selected_modes: list[str]) -> tuple[str, ...]:
+    columns = {"date", TRANSIT_MODES["Subway"]["ridership"]}
+
+    for mode_columns in TRANSIT_MODES.values():
+        columns.add(mode_columns["recovery"])
+
+    for mode in selected_modes:
+        mode_columns = TRANSIT_MODES.get(mode, {})
+        columns.update(mode_columns.values())
 
     return tuple(columns)
 
 
+def get_date_bounds(time_window: str) -> tuple[str | None, str | None, int | None]:
+    if time_window == "Recent 180 days":
+        return None, None, 180
+    if time_window == "Recent 365 days":
+        return None, None, 365
+    if time_window == "Full history":
+        return None, None, None
+
+    today = date.today()
+    default_start = today - timedelta(days=180)
+    selected_dates = st.sidebar.date_input(
+        "Date range",
+        value=(default_start, today),
+        min_value=MTA_MIN_DATE,
+        max_value=today,
+        key="dashboard_date_range_v4",
+    )
+    start_date = default_start
+    end_date = today
+    if isinstance(selected_dates, tuple) and len(selected_dates) == 2:
+        start_date, end_date = selected_dates
+    return str(start_date), str(end_date), None
+
+
+def render_data_status(mta_df: pd.DataFrame, covid_df: pd.DataFrame) -> None:
+    if mta_df.empty:
+        return
+
+    latest_mta = mta_df["date"].max().date()
+    mta_range = f"{mta_df['date'].min().date()} to {latest_mta}"
+
+    status_columns = st.columns(4)
+    status_columns[0].metric("Latest MTA Date", str(latest_mta))
+    status_columns[1].metric("MTA Rows Loaded", f"{len(mta_df):,}")
+    status_columns[2].metric("Selected Range", mta_range)
+
+    if covid_df.empty:
+        status_columns[3].metric("Latest COVID Date", "Unavailable")
+    else:
+        latest_covid = covid_df["date_of_interest"].max().date()
+        status_columns[3].metric("Latest COVID Date", str(latest_covid))
+
+
+def tidy_time_series(
+    df: pd.DataFrame,
+    selected_modes: list[str],
+    value_type: str,
+    rolling_window: int,
+) -> pd.DataFrame:
+    rows = []
+    for mode in selected_modes:
+        column = TRANSIT_MODES[mode][value_type]
+        if column not in df.columns:
+            continue
+
+        series = df[["date", column]].copy()
+        series["Transit Mode"] = mode
+        series["Value"] = series[column].rolling(rolling_window).mean()
+        rows.append(series[["date", "Transit Mode", "Value"]])
+
+    if not rows:
+        return pd.DataFrame(columns=["date", "Transit Mode", "Value"])
+
+    return pd.concat(rows, ignore_index=True).dropna(subset=["Value"])
+
+
 def render_kpis(filtered: pd.DataFrame) -> None:
     st.subheader("Current Recovery Snapshot")
     st.caption("Average recovery rate over the most recent 30 days in the filtered view")
@@ -61,19 +129,35 @@ def render_recovery_chart(
 ) -> None:
     st.subheader("Recovery Trend Over Time")
 
-    chart_df = filtered[["date"]].copy()
-    for mode in selected_modes:
-        column = TRANSIT_MODES[mode]["recovery"]
-        if column not in filtered.columns:
-            continue
-        chart_df[mode] = filtered[column].rolling(rolling_window).mean()
-
-    chart_df = chart_df.set_index("date").dropna(how="all")
+    chart_df = tidy_time_series(filtered, selected_modes, "recovery", rolling_window)
     if chart_df.empty:
         st.info("No recovery series are available for the selected transit modes.")
         return
 
-    st.line_chart(chart_df, height=320)
+    chart_df["Recovery Percent"] = chart_df["Value"] * 100
+    fig = px.line(
+        chart_df,
+        x="date",
+        y="Recovery Percent",
+        color="Transit Mode",
+        color_discrete_map=MODE_COLORS,
+        markers=False,
+    )
+    fig.add_hline(
+        y=100,
+        line_dash="dash",
+        line_color="#64748b",
+        annotation_text="Pre-pandemic baseline",
+    )
+    fig.update_layout(
+        height=340,
+        margin=dict(l=0, r=0, t=10, b=0),
+        xaxis_title="Date",
+        yaxis_title="Recovery Rate",
+        legend_title_text="",
+    )
+    fig.update_yaxes(ticksuffix="%", rangemode="tozero")
+    st.plotly_chart(fig, width="stretch", config={"displayModeBar": False})
     st.caption("The pre-pandemic baseline is 100% recovery.")
 
 
@@ -84,19 +168,27 @@ def render_total_chart(
 ) -> None:
     st.subheader("Total Daily Ridership")
 
-    chart_df = filtered[["date"]].copy()
-    for mode in selected_modes:
-        column = TRANSIT_MODES[mode]["ridership"]
-        if column not in filtered.columns:
-            continue
-        chart_df[mode] = filtered[column].rolling(rolling_window).mean()
-
-    chart_df = chart_df.set_index("date").dropna(how="all")
+    chart_df = tidy_time_series(filtered, selected_modes, "ridership", rolling_window)
     if chart_df.empty:
         st.info("No ridership series are available for the selected transit modes.")
         return
 
-    st.line_chart(chart_df, height=320)
+    fig = px.line(
+        chart_df,
+        x="date",
+        y="Value",
+        color="Transit Mode",
+        color_discrete_map=MODE_COLORS,
+        markers=False,
+    )
+    fig.update_layout(
+        height=340,
+        margin=dict(l=0, r=0, t=10, b=0),
+        xaxis_title="Date",
+        yaxis_title="Daily Ridership / Traffic",
+        legend_title_text="",
+    )
+    st.plotly_chart(fig, width="stretch", config={"displayModeBar": False})
 
 
 def render_subway_day_type_summary(filtered: pd.DataFrame) -> None:
@@ -113,9 +205,22 @@ def render_subway_day_type_summary(filtered: pd.DataFrame) -> None:
         summary.groupby("Day Type")[subway_column]
         .mean()
         .reset_index()
-        .set_index("Day Type")
     )
-    st.bar_chart(averages, height=240)
+    fig = px.bar(
+        averages,
+        x="Day Type",
+        y=subway_column,
+        color="Day Type",
+        color_discrete_map={"Weekday": "#2563eb", "Weekend": "#f97316"},
+    )
+    fig.update_layout(
+        height=260,
+        margin=dict(l=0, r=0, t=10, b=0),
+        xaxis_title="",
+        yaxis_title="Average Subway Ridership",
+        showlegend=False,
+    )
+    st.plotly_chart(fig, width="stretch", config={"displayModeBar": False})
 
 
 def render_mode_recovery_summary(filtered: pd.DataFrame) -> None:
@@ -132,8 +237,24 @@ def render_mode_recovery_summary(filtered: pd.DataFrame) -> None:
         st.info("No recovery summary is available for the current dataset.")
         return
 
-    summary_df = pd.DataFrame(rows).set_index("Mode")
-    st.bar_chart(summary_df, height=240)
+    summary_df = pd.DataFrame(rows)
+    summary_df["Recovery Percent"] = summary_df["Recovery"] * 100
+    fig = px.bar(
+        summary_df,
+        x="Mode",
+        y="Recovery Percent",
+        color="Mode",
+        color_discrete_map=MODE_COLORS,
+    )
+    fig.update_layout(
+        height=260,
+        margin=dict(l=0, r=0, t=10, b=0),
+        xaxis_title="",
+        yaxis_title="Average Recovery",
+        showlegend=False,
+    )
+    fig.update_yaxes(ticksuffix="%", rangemode="tozero")
+    st.plotly_chart(fig, width="stretch", config={"displayModeBar": False})
 
 
 def render_weekday_weekend(filtered: pd.DataFrame) -> None:
@@ -144,6 +265,7 @@ def render_weekday_weekend(filtered: pd.DataFrame) -> None:
         "Select year for comparison",
         options=["All Years", *available_years],
         index=0,
+        key="weekday_weekend_year_v2",
     )
 
     year_value = None if selected_year == "All Years" else int(selected_year)
@@ -179,7 +301,7 @@ def render_weekday_weekend(filtered: pd.DataFrame) -> None:
         legend_title_text="",
     )
     comparison_fig.update_yaxes(ticksuffix="%", rangemode="tozero")
-    st.plotly_chart(comparison_fig, use_container_width=True, config={"displayModeBar": False})
+    st.plotly_chart(comparison_fig, width="stretch", config={"displayModeBar": False})
 
     st.markdown("**Monthly Weekend Minus Weekday Gap (Subway)**")
     subway_column = TRANSIT_MODES["Subway"]["recovery"]
@@ -212,7 +334,7 @@ def render_weekday_weekend(filtered: pd.DataFrame) -> None:
         coloraxis_showscale=False,
     )
     gap_fig.update_yaxes(ticksuffix="%", zeroline=True, zerolinewidth=1)
-    st.plotly_chart(gap_fig, use_container_width=True, config={"displayModeBar": False})
+    st.plotly_chart(gap_fig, width="stretch", config={"displayModeBar": False})
 
 
 def render_holiday_impact(filtered: pd.DataFrame) -> None:
@@ -224,6 +346,7 @@ def render_holiday_impact(filtered: pd.DataFrame) -> None:
         "Select holidays or events to highlight",
         options=holiday_names,
         default=["Thanksgiving", "Christmas", "Congestion Pricing Launch"],
+        key="event_holidays_v2",
     )
     if not selected_holidays:
         st.info("Choose at least one holiday or event to draw comparison lines.")
@@ -234,17 +357,44 @@ def render_holiday_impact(filtered: pd.DataFrame) -> None:
         st.info("Subway recovery data is not available in the current dataset.")
         return
 
-    series = filtered.set_index("date")[subway_column].rolling(7).mean().rename("Subway")
-    st.line_chart(series, height=320)
-
     selected_rows = holidays_df[holidays_df["holiday"].isin(selected_holidays)]
     visible_events = selected_rows[
         (selected_rows["date"] >= filtered["date"].min())
         & (selected_rows["date"] <= filtered["date"].max())
     ][["holiday", "date"]].copy()
+
+    series = filtered[["date", subway_column]].copy()
+    series["Subway Recovery Percent"] = series[subway_column].rolling(7).mean() * 100
+    fig = px.line(
+        series.dropna(subset=["Subway Recovery Percent"]),
+        x="date",
+        y="Subway Recovery Percent",
+        color_discrete_sequence=[MODE_COLORS["Subway"]],
+    )
+    for _, event in visible_events.iterrows():
+        fig.add_vline(x=event["date"], line_width=1, line_dash="dot", line_color="#475569")
+        fig.add_annotation(
+            x=event["date"],
+            y=1.03,
+            yref="paper",
+            text=event["holiday"],
+            showarrow=False,
+            textangle=-90,
+            font=dict(size=10),
+        )
+    fig.update_layout(
+        height=340,
+        margin=dict(l=0, r=0, t=35, b=0),
+        xaxis_title="Date",
+        yaxis_title="Subway Recovery",
+        showlegend=False,
+    )
+    fig.update_yaxes(ticksuffix="%", rangemode="tozero")
+    st.plotly_chart(fig, width="stretch", config={"displayModeBar": False})
+
     if not visible_events.empty:
         visible_events["date"] = visible_events["date"].dt.strftime("%Y-%m-%d")
-        st.dataframe(visible_events, use_container_width=True, hide_index=True)
+        st.dataframe(visible_events, width="stretch", hide_index=True)
 
     impact_rows = []
     for _, row in selected_rows.iterrows():
@@ -272,7 +422,7 @@ def render_holiday_impact(filtered: pd.DataFrame) -> None:
         )
 
     if impact_rows:
-        st.dataframe(pd.DataFrame(impact_rows), use_container_width=True, hide_index=True)
+        st.dataframe(pd.DataFrame(impact_rows), width="stretch", hide_index=True)
 
 
 def render_yearly_recovery(filtered: pd.DataFrame) -> None:
@@ -314,7 +464,7 @@ def render_yearly_recovery(filtered: pd.DataFrame) -> None:
         legend_title_text="",
     )
     yearly_fig.update_yaxes(ticksuffix="%", rangemode="tozero")
-    st.plotly_chart(yearly_fig, use_container_width=True, config={"displayModeBar": False})
+    st.plotly_chart(yearly_fig, width="stretch", config={"displayModeBar": False})
 
 
 def render_heatmap(filtered: pd.DataFrame) -> None:
@@ -324,6 +474,7 @@ def render_heatmap(filtered: pd.DataFrame) -> None:
         "Select transit mode for heatmap",
         options=list(TRANSIT_MODES.keys()),
         index=0,
+        key="calendar_mode_v2",
     )
     recovery_column = TRANSIT_MODES[selected_mode]["recovery"]
     if recovery_column not in filtered.columns:
@@ -346,44 +497,168 @@ def render_heatmap(filtered: pd.DataFrame) -> None:
 
     st.dataframe(
         pivot_wide.style.format("{:.0%}").background_gradient(cmap="RdYlGn"),
-        use_container_width=True,
+        width="stretch",
+    )
+
+
+def build_covid_context_frame(
+    mta_df: pd.DataFrame,
+    covid_df: pd.DataFrame,
+    rolling_window: int,
+) -> pd.DataFrame:
+    subway_column = TRANSIT_MODES["Subway"]["recovery"]
+    mta_daily = mta_df[["date", subway_column]].copy()
+    mta_daily["Subway Recovery Percent"] = (
+        mta_daily[subway_column].rolling(rolling_window).mean() * 100
+    )
+    covid_daily = covid_df[["date_of_interest", "case_count"]].copy().rename(
+        columns={"date_of_interest": "date"}
+    )
+    covid_daily["COVID Cases"] = covid_daily["case_count"].rolling(rolling_window).mean()
+
+    return pd.merge(
+        mta_daily[["date", "Subway Recovery Percent"]],
+        covid_daily[["date", "COVID Cases"]],
+        on="date",
+        how="inner",
+    ).dropna()
+
+
+def render_covid_context(
+    mta_df: pd.DataFrame,
+    covid_df: pd.DataFrame,
+    rolling_window: int,
+) -> None:
+    st.subheader("COVID Cases and Subway Recovery")
+
+    subway_column = TRANSIT_MODES["Subway"]["recovery"]
+    if subway_column not in mta_df.columns:
+        st.info("Subway recovery data is not available for the current filter.")
+        return
+    if covid_df.empty or "case_count" not in covid_df.columns:
+        st.info("COVID case data is not available for the current filter.")
+        return
+
+    combined = build_covid_context_frame(mta_df, covid_df, rolling_window)
+    using_full_overlap = False
+    if combined.empty:
+        full_mta = load_mta_data(columns=("date", subway_column))
+        full_covid = load_covid_data()
+        combined = build_covid_context_frame(full_mta, full_covid, rolling_window)
+        using_full_overlap = True
+        if combined.empty:
+            st.info("No overlapping MTA and COVID dates are available.")
+            return
+
+    if using_full_overlap:
+        st.info(
+            "The selected range has no overlapping MTA and COVID dates, "
+            "so this tab shows the full historical overlap instead."
+        )
+
+    metric_cols = st.columns(3)
+    recent = combined.tail(30)
+    metric_cols[0].metric(
+        "Recent Subway Recovery",
+        f"{recent['Subway Recovery Percent'].mean():.0f}%",
+    )
+    metric_cols[1].metric(
+        "Recent COVID Cases",
+        f"{recent['COVID Cases'].mean():,.0f}",
+    )
+    correlation = combined["Subway Recovery Percent"].corr(combined["COVID Cases"])
+    metric_cols[2].metric("Series Correlation", f"{correlation:.2f}")
+
+    fig = make_subplots(specs=[[{"secondary_y": True}]])
+    fig.add_trace(
+        go.Scatter(
+            x=combined["date"],
+            y=combined["Subway Recovery Percent"],
+            name="Subway recovery",
+            mode="lines",
+            line=dict(color=MODE_COLORS["Subway"], width=2),
+        ),
+        secondary_y=False,
+    )
+    fig.add_trace(
+        go.Scatter(
+            x=combined["date"],
+            y=combined["COVID Cases"],
+            name="COVID cases",
+            mode="lines",
+            line=dict(color="#dc2626", width=2),
+        ),
+        secondary_y=True,
+    )
+    fig.update_layout(
+        height=380,
+        margin=dict(l=0, r=0, t=10, b=0),
+        legend=dict(orientation="h", yanchor="bottom", y=1.02, x=0),
+    )
+    fig.update_xaxes(title_text="Date")
+    fig.update_yaxes(title_text="Subway Recovery", ticksuffix="%", secondary_y=False)
+    fig.update_yaxes(title_text="COVID Cases", secondary_y=True)
+    st.plotly_chart(fig, width="stretch", config={"displayModeBar": False})
+
+    st.caption(
+        "This view directly connects the second dataset to the main research question "
+        "by putting COVID case trends and subway recovery on the same timeline."
     )
 
 
 def render_dashboard(
-    df: pd.DataFrame,
-    view: str,
+    mta_df: pd.DataFrame,
+    covid_df: pd.DataFrame,
     selected_modes: list[str],
     rolling_window: int,
 ) -> None:
     st.sidebar.header("Filters")
     st.sidebar.caption("Fast default: recent 180 days. Expand the range only when needed.")
 
-    if df.empty:
+    if mta_df.empty:
         st.warning("No data is available for the current filters.")
         return
 
-    st.caption("Sections are split to keep each page load fast while preserving the full analysis.")
+    section = st.radio(
+        "Dashboard section",
+        ["Overview", "Comparison", "Calendar", "Events", "COVID Context"],
+        horizontal=True,
+        label_visibility="collapsed",
+        key="dashboard_section_fast_v1",
+    )
+
+    st.caption(
+        "Only the selected section is rendered, which keeps the deployed app responsive."
+    )
 
-    if view == "Overview":
-        render_kpis(df)
+    if section == "Overview":
+        render_kpis(mta_df)
         st.markdown("---")
-        render_recovery_chart(df, selected_modes, rolling_window)
-        render_total_chart(df, selected_modes, rolling_window)
-        render_subway_day_type_summary(df)
-        render_mode_recovery_summary(df)
-    elif view == "Comparison":
-        render_weekday_weekend(df)
-        render_yearly_recovery(df)
-    elif view == "Calendar":
-        render_heatmap(df)
+        chart_left, chart_right = st.columns(2)
+        with chart_left:
+            render_recovery_chart(mta_df, selected_modes, rolling_window)
+        with chart_right:
+            render_total_chart(mta_df, selected_modes, rolling_window)
+        summary_left, summary_right = st.columns(2)
+        with summary_left:
+            render_subway_day_type_summary(mta_df)
+        with summary_right:
+            render_mode_recovery_summary(mta_df)
+    elif section == "Comparison":
+        render_weekday_weekend(mta_df)
+        render_yearly_recovery(mta_df)
+    elif section == "Calendar":
+        render_heatmap(mta_df)
+    elif section == "Events":
+        render_holiday_impact(mta_df)
     else:
-        render_holiday_impact(df)
+        render_covid_context(mta_df, covid_df, rolling_window)
 
     st.markdown("---")
     st.caption(
         "Data source: BigQuery tables "
-        "`mta_data.daily_ridership` and supporting holiday metadata in the app."
+        "`mta_data.daily_ridership`, `mta_data.nyc_covid_cases`, "
+        "and supporting holiday metadata in the app."
     )
 
 
@@ -439,12 +714,6 @@ def main() -> None:
 
     page = st.radio("View", ["Dashboard", "Proposal"], horizontal=True)
     if page == "Dashboard":
-        view = st.radio(
-            "Dashboard section",
-            options=["Overview", "Comparison", "Calendar", "Events"],
-            horizontal=True,
-            key="dashboard_section_v2",
-        )
         selected_modes = st.sidebar.multiselect(
             "Transit modes",
             options=list(TRANSIT_MODES.keys()),
@@ -465,38 +734,31 @@ def main() -> None:
             key="dashboard_time_window_v1",
         )
 
-        requested_columns = get_dashboard_columns(view, selected_modes)
+        requested_columns = get_dashboard_columns(selected_modes)
         try:
-            if time_window == "Recent 180 days":
-                df = load_mta_data(columns=requested_columns, lookback_days=180)
-            elif time_window == "Recent 365 days":
-                df = load_mta_data(columns=requested_columns, lookback_days=365)
-            elif time_window == "Full history":
-                df = load_mta_data(columns=requested_columns)
-            else:
-                today = date.today()
-                default_start = today - timedelta(days=180)
-                selected_dates = st.sidebar.date_input(
-                    "Date range",
-                    value=(default_start, today),
-                    min_value=MTA_MIN_DATE,
-                    max_value=today,
-                    key="dashboard_date_range_v3",
+            start_date, end_date, lookback_days = get_date_bounds(time_window)
+            if lookback_days is not None:
+                mta_df = load_mta_data(
+                    columns=requested_columns,
+                    lookback_days=lookback_days,
                 )
-                start_date = default_start
-                end_date = today
-                if len(selected_dates) == 2:
-                    start_date, end_date = selected_dates
-                df = load_mta_data(
+                covid_df = load_covid_data(lookback_days=lookback_days)
+            elif start_date and end_date:
+                mta_df = load_mta_data(
                     columns=requested_columns,
-                    start_date=str(start_date),
-                    end_date=str(end_date),
+                    start_date=start_date,
+                    end_date=end_date,
                 )
+                covid_df = load_covid_data(start_date=start_date, end_date=end_date)
+            else:
+                mta_df = load_mta_data(columns=requested_columns)
+                covid_df = load_covid_data()
         except Exception as exc:
             st.error(f"Failed to load data from BigQuery: {exc}")
             return
 
-        render_dashboard(df, view, selected_modes, rolling_window)
+        render_data_status(mta_df, covid_df)
+        render_dashboard(mta_df, covid_df, selected_modes, rolling_window)
     else:
         render_proposal()
 
diff --git a/tests/test_load_data_to_bq.py b/tests/test_load_data_to_bq.py
new file mode 100644
index 0000000..6b536d5
--- /dev/null
+++ b/tests/test_load_data_to_bq.py
@@ -0,0 +1,43 @@
+import pandas as pd
+import pytest
+
+from load_data_to_bq import DATA_SOURCES, validate_source_frame
+
+
+def _valid_mta_frame(row_count: int = 1001) -> pd.DataFrame:
+    dates = pd.date_range("2020-03-01", periods=row_count, freq="D")
+    return pd.DataFrame(
+        {
+            "date": dates,
+            "subways_total_estimated_ridership": [1000000.0] * row_count,
+            "subways_pct_of_comparable_pre_pandemic_day": [0.6] * row_count,
+            "buses_total_estimated_ridership": [500000.0] * row_count,
+            "buses_pct_of_comparable_pre_pandemic_day": [0.7] * row_count,
+        }
+    )
+
+
+def test_validate_source_frame_accepts_complete_data():
+    validate_source_frame(_valid_mta_frame(), DATA_SOURCES["mta"])
+
+
+def test_validate_source_frame_rejects_missing_required_columns():
+    df = _valid_mta_frame().drop(columns=["buses_pct_of_comparable_pre_pandemic_day"])
+
+    with pytest.raises(RuntimeError, match="missing required columns"):
+        validate_source_frame(df, DATA_SOURCES["mta"])
+
+
+def test_validate_source_frame_rejects_too_few_rows():
+    df = _valid_mta_frame(row_count=10)
+
+    with pytest.raises(RuntimeError, match="expected at least"):
+        validate_source_frame(df, DATA_SOURCES["mta"])
+
+
+def test_validate_source_frame_rejects_late_start_date():
+    df = _valid_mta_frame()
+    df["date"] = pd.date_range("2021-01-01", periods=len(df), freq="D")
+
+    with pytest.raises(RuntimeError, match="should include data"):
+        validate_source_frame(df, DATA_SOURCES["mta"])
diff --git a/tests/test_validation.py b/tests/test_validation.py
index 1dba220..b2cc90e 100644
--- a/tests/test_validation.py
+++ b/tests/test_validation.py
@@ -26,6 +26,27 @@ def test_valid_data():
     assert len(result) == 2
 
 
+def test_valid_current_column_names():
+    """Test that current _pct_ recovery column names pass validation."""
+    df = pd.DataFrame(
+        {
+            "date": ["2020-03-01"],
+            "subways_total_estimated_ridership": [1000000.0],
+            "subways_pct_of_comparable_pre_pandemic_day": [0.5],
+            "buses_total_estimated_ridership": [500000.0],
+            "buses_pct_of_comparable_pre_pandemic_day": [0.6],
+            "lirr_total_estimated_ridership": [100000.0],
+            "lirr_pct_of_comparable_pre_pandemic_day": [0.4],
+            "metro_north_total_estimated_ridership": [80000.0],
+            "metro_north_pct_of_comparable_pre_pandemic_day": [0.35],
+            "bridges_and_tunnels_total_traffic": [700000.0],
+            "bridges_and_tunnels_pct_of_comparable_pre_pandemic_day": [0.9],
+        }
+    )
+    result = validate_mta_data(df)
+    assert len(result) == 1
+
+
 def test_negative_ridership_fails():
     """Test that negative ridership values fail validation."""
     df = pd.DataFrame(
diff --git a/utils.py b/utils.py
index 4db9f6a..9d92ca4 100644
--- a/utils.py
+++ b/utils.py
@@ -61,6 +61,7 @@ def _render_select_clause(columns: Iterable[str]) -> str:
     return ", ".join(f"`{column}`" for column in columns)
 
 
+@st.cache_data(show_spinner=False, persist="disk", ttl=60 * 60 * 12)
 def _get_table_columns(table_name: str) -> set[str]:
     client = get_bigquery_client()
     table = client.get_table(f"{PROJECT_ID}.{table_name}")
@@ -138,16 +139,11 @@ def _load_table(
         raise KeyError(f"No requested columns were found in BigQuery table {table_name}.")
 
     where_clause = ""
+    order_clause = f"ORDER BY `{order_by}`"
+    limit_clause = ""
     if lookback_days is not None:
-        where_clause = f"""
-        WHERE `{date_column}` BETWEEN (
-            SELECT DATE_SUB(MAX(`{date_column}`), INTERVAL {lookback_days} DAY)
-            FROM normalized
-        ) AND (
-            SELECT MAX(`{date_column}`)
-            FROM normalized
-        )
-        """
+        order_clause = f"ORDER BY `{date_column}` DESC"
+        limit_clause = f"LIMIT {lookback_days + 1}"
     elif start_date and end_date:
         where_clause = (
             f"\n        WHERE `{date_column}` BETWEEN '{start_date}' AND '{end_date}'"
@@ -162,10 +158,12 @@ def _load_table(
         SELECT *
         FROM normalized
         {where_clause}
-        ORDER BY `{order_by}`
+        {order_clause}
+        {limit_clause}
     """
     client = get_bigquery_client()
-    query_job = client.query(query)
+    job_config = bigquery.QueryJobConfig(use_query_cache=True)
+    query_job = client.query(query, job_config=job_config)
     return query_job.to_dataframe(create_bqstorage_client=False)
 
 
diff --git a/validation.py b/validation.py
index 90cb567..4ca4dbc 100644
--- a/validation.py
+++ b/validation.py
@@ -1,5 +1,13 @@
 import pandera as pa
 
+MTA_RENAME_MAP = {
+    "subways_of_comparable_pre_pandemic_day": "subways_pct_of_comparable_pre_pandemic_day",
+    "buses_of_comparable_pre_pandemic_day": "buses_pct_of_comparable_pre_pandemic_day",
+    "lirr_of_comparable_pre_pandemic_day": "lirr_pct_of_comparable_pre_pandemic_day",
+    "metro_north_of_comparable_pre_pandemic_day": "metro_north_pct_of_comparable_pre_pandemic_day",
+    "bridges_and_tunnels_of_comparable_pre_pandemic_day": "bridges_and_tunnels_pct_of_comparable_pre_pandemic_day",
+}
+
 # Schema for MTA Daily Ridership Data
 mta_schema = pa.DataFrameSchema(
     {
@@ -15,7 +23,7 @@
             checks=pa.Check.greater_than_or_equal_to(0),
             description="Total estimated subway ridership",
         ),
-        "subways_of_comparable_pre_pandemic_day": pa.Column(
+        "subways_pct_of_comparable_pre_pandemic_day": pa.Column(
             float,
             nullable=True,
             checks=[
@@ -30,7 +38,7 @@
             checks=pa.Check.greater_than_or_equal_to(0),
             description="Total estimated bus ridership",
         ),
-        "buses_of_comparable_pre_pandemic_day": pa.Column(
+        "buses_pct_of_comparable_pre_pandemic_day": pa.Column(
             float,
             nullable=True,
             checks=[
@@ -45,7 +53,7 @@
             checks=pa.Check.greater_than_or_equal_to(0),
             description="Total estimated LIRR ridership",
         ),
-        "lirr_of_comparable_pre_pandemic_day": pa.Column(
+        "lirr_pct_of_comparable_pre_pandemic_day": pa.Column(
             float,
             nullable=True,
             checks=[
@@ -60,7 +68,7 @@
             checks=pa.Check.greater_than_or_equal_to(0),
             description="Total estimated Metro-North ridership",
         ),
-        "metro_north_of_comparable_pre_pandemic_day": pa.Column(
+        "metro_north_pct_of_comparable_pre_pandemic_day": pa.Column(
             float,
             nullable=True,
             checks=[
@@ -75,7 +83,7 @@
             checks=pa.Check.greater_than_or_equal_to(0),
             description="Total bridges and tunnels traffic",
         ),
-        "bridges_and_tunnels_of_comparable_pre_pandemic_day": pa.Column(
+        "bridges_and_tunnels_pct_of_comparable_pre_pandemic_day": pa.Column(
             float,
             nullable=True,
             checks=[
@@ -91,4 +99,5 @@
 
 def validate_mta_data(df):
     """Validate MTA ridership dataframe against schema."""
-    return mta_schema.validate(df)
+    normalized = df.rename(columns=MTA_RENAME_MAP)
+    return mta_schema.validate(normalized)