Files

Moe Charm (CI) 4a070d8a14 Phase 5 E4-1: Free Wrapper ENV Snapshot (+3.51% GO, ADOPTED)

Target: Consolidate free wrapper TLS reads (2→1)
- free() is 25.26% self% (top hot spot)
- Strategy: Apply E1 success pattern (ENV snapshot) to free path

Implementation:
- ENV gate: HAKMEM_FREE_WRAPPER_ENV_SNAPSHOT=0/1 (default 0)
- core/box/free_wrapper_env_snapshot_box.{h,c}: New box
  - Consolidates 2 TLS reads → 1 TLS read (50% reduction)
  - Reduces 4 branches → 3 branches (25% reduction)
  - Lazy init with probe window (bench_profile putenv sync)
- core/box/hak_wrappers.inc.h: Integration in free() wrapper
- Makefile: Add free_wrapper_env_snapshot_box.o to all targets

A/B Test Results (Mixed, 10-run, 20M iters):
- Baseline (SNAPSHOT=0): 45.35M ops/s (mean), 45.31M ops/s (median)
- Optimized (SNAPSHOT=1): 46.94M ops/s (mean), 47.15M ops/s (median)
- Improvement: +3.51% mean, +4.07% median

Decision: GO (+3.51% >= +1.0% threshold)
- Exceeded conservative estimate (+1.5% → +3.51%)
- Similar efficiency to E1 (+3.92%)
- Health check: PASS (all profiles)
- Action: PROMOTED to MIXED_TINYV3_C7_SAFE preset

Phase 5 Cumulative:
- E1 (ENV Snapshot): +3.92%
- E4-1 (Free Wrapper Snapshot): +3.51%
- Total Phase 4-5: ~+7.5%

E3-4 Correction:
- Phase 4 E3-4 (ENV Constructor Init): NO-GO / FROZEN
- Initial A/B showed +4.75%, but investigation revealed:
  - Branch prediction hint mismatch (UNLIKELY with always-true)
  - Retest confirmed -1.78% regression
  - Root cause: __builtin_expect(..., 0) with ctor_mode==1
- Decision: Freeze as research box (default OFF)
- Learning: Branch hints need careful tuning, TLS consolidation safer

Deliverables:
- docs/analysis/PHASE5_E4_FREE_GATE_OPTIMIZATION_1_DESIGN.md
- docs/analysis/PHASE5_E4_1_FREE_WRAPPER_ENV_SNAPSHOT_NEXT_INSTRUCTIONS.md
- docs/analysis/PHASE5_E4_2_MALLOC_WRAPPER_ENV_SNAPSHOT_NEXT_INSTRUCTIONS.md (next)
- docs/analysis/PHASE5_POST_E1_NEXT_INSTRUCTIONS.md
- docs/analysis/ENV_PROFILE_PRESETS.md (E4-1 added, E3-4 corrected)
- CURRENT_TASK.md (E4-1 complete, E3-4 frozen)
- core/bench_profile.h (E4-1 promoted to default)

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>

2025-12-14 04:24:34 +09:00

2.3 KiB

Raw Blame History

Phase 4 E3-4: ENV Constructor Init（次の指示書）

Status（2025-12-14）

❌ NO-GO / FROZEN（default OFF）
再検証 A/B（Mixed, 10-run, iter=20M, ws=400, E1=1）: -1.44% mean / -1.03% median
ENV:
- E1: HAKMEM_ENV_SNAPSHOT=0/1（default 0）
- E3-4: HAKMEM_ENV_SNAPSHOT_CTOR=0/1（default 0、E1=1 前提）

ゴール

E3-4 は freeze したので、実行指示は “再現検証” ではなく “凍結維持/rollback”。

Step 0: 前提（E1 を ON にして測る）

E3-4 は hakmem_env_snapshot_enabled() の gate 判定を短絡する最適化なので、E1 が ON であることが前提。

Step 1: Build & 健康診断（先に通す）

make bench_random_mixed_hakmem -j
scripts/verify_health_profiles.sh

Step 2: 再現検証（必要な場合のみ）

Mixed 10-run（iter=20M, ws=400）:

# Baseline: ctor=0
HAKMEM_PROFILE=MIXED_TINYV3_C7_SAFE \
HAKMEM_ENV_SNAPSHOT=1 \
HAKMEM_ENV_SNAPSHOT_CTOR=0 \
./bench_random_mixed_hakmem 20000000 400 1

# Optimized: ctor=1
HAKMEM_PROFILE=MIXED_TINYV3_C7_SAFE \
HAKMEM_ENV_SNAPSHOT=1 \
HAKMEM_ENV_SNAPSHOT_CTOR=1 \
./bench_random_mixed_hakmem 20000000 400 1

判定（10-run mean）:

-1% 以下 → freeze 維持（現状）

注意:

“constructor の pre-main init” を効かせたい場合は、起動前に ENV を設定する（bench_profile putenv だけでは遅い）。

Step 3: perf で “消えたか” を確認（E3-4=1）

HAKMEM_PROFILE=MIXED_TINYV3_C7_SAFE \
HAKMEM_ENV_SNAPSHOT=1 \
HAKMEM_ENV_SNAPSHOT_CTOR=1 \
perf record -F 99 -- ./bench_random_mixed_hakmem 20000000 400 1

perf report --stdio --no-children

確認ポイント:

hakmem_env_snapshot_enabled の self% が有意に下がる／Top から落ちる
代わりに “snapshot 参照” が 1 箇所に集約されている

Step 4: 本線化（E1 のみ）

HAKMEM_ENV_SNAPSHOT_CTOR=1 は本線化しない（freeze）
E1（HAKMEM_ENV_SNAPSHOT=1）は勝ち箱なのでプリセット昇格を優先

Step 5: Rollback（いつでも戻せる）

HAKMEM_ENV_SNAPSHOT=0
HAKMEM_ENV_SNAPSHOT_CTOR=0

Next（Phase 4 Close）

Phase 4 は “勝ち箱=E1” を固めて CLOSE。次は perf で次の芯を選ぶ。

2.3 KiB Raw Blame History Unescape Escape