Phase ALLOC-GATE-OPT-1: tiny_alloc_gate_fast 統計計測
- AllocGateStats 構造体追加(size2class/route/env/class分布) - malloc_tiny_fast にカウンタ埋め込み - ENV: HAKMEM_ALLOC_GATE_STATS (default 0) - 挙動変更なし(計測のみ) 計測結果: - Mixed: total=542k, size2class=0, route_calls=0, env_checks=275k, C4-C7=95.2% - size_to_class/route_for_class は完全削減済み(LUT 効果) - C4-C7 が 95% → ULTRA fast path が有効 - env_checks ≈ c7_calls → C7 ULTRA の ENV gate が毎回呼ばれる - C6-heavy: total=11 → malloc_tiny_fast はほぼ通らない(mid/pool 主体) 結論: - alloc gate は既に十分最適化済み(LUT + ULTRA で削減済み) - さらなる最適化余地は小さい(env_checks は軽量化済み、数%以下の効果) - 次フェーズでは free dispatcher (29%) や C7 ULTRA refill (7%) など、他のボトルネックを狙う 詳細: docs/analysis/ALLOC_GATE_ANALYSIS.md 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Haiku 4.5 <noreply@anthropic.com>
This commit is contained in:
@ -829,3 +829,37 @@ C7 ULTRA alloc は tiny_c7_ultra.c 内最適化で self%/throughput ともほぼ
|
||||
- route_for_class は alloc 側での呼び出しが主で、free 側は snapshot で O(1)
|
||||
- 次フェーズ(OPT-2)では別のアプローチを検討(domain 判定の早期化など)
|
||||
|
||||
**発見**: FREE_DISPATCH_STATS より ENV/route は初期化時にしか呼ばれていない。route_calls=267,967 はほぼ alloc 側から。
|
||||
|
||||
---
|
||||
|
||||
## Phase ALLOC-GATE-OPT-1: tiny_alloc_gate_fast 統計計測 (2025-12-11)
|
||||
|
||||
**目的**: alloc gate(18%)の内訳を細分化
|
||||
- size→class 変換の回数
|
||||
- route_for_class 呼び出し回数
|
||||
- alloc-side ENV check 回数
|
||||
- クラス別分布(C0〜C7)
|
||||
|
||||
**方針**: 統計カウンタを追加し、挙動は変えない。次フェーズ(OPT-1B)で最適化実装を判断。
|
||||
|
||||
**実装内容**:
|
||||
- AllocGateStats 構造体追加(size2class/route/env/class分布)
|
||||
- malloc_tiny_fast 内にカウンタ埋め込み
|
||||
- ENV: HAKMEM_ALLOC_GATE_STATS (default 0)
|
||||
- 挙動変更なし(計測のみ)
|
||||
|
||||
**計測結果**:
|
||||
- Mixed: total=542,033, size2class=0, route_calls=0, env_checks=275,089, C4-C7=95.2%
|
||||
- ✅ size_to_class / route_for_class は **完全削減済み**(LUT 効果)
|
||||
- ✅ C4-C7 が 95% → ULTRA fast path が有効
|
||||
- env_checks ≈ c7_calls → C7 ULTRA の ENV gate が毎回呼ばれる(構造的コスト)
|
||||
- C6-heavy: total=11 → malloc_tiny_fast はほぼ通らない(mid/pool 主体)
|
||||
|
||||
**結論**:
|
||||
- ✅ alloc gate は **既に十分最適化済み**(LUT + ULTRA で削減済み)
|
||||
- ❌ さらなる最適化余地は小さい(env_checks は軽量化済み、数%以下の効果)
|
||||
- 次フェーズでは **free dispatcher (29%)** や **C7 ULTRA refill (7%)** など、他のボトルネックを狙う
|
||||
|
||||
**詳細**: `docs/analysis/ALLOC_GATE_ANALYSIS.md` 参照
|
||||
|
||||
|
||||
Reference in New Issue
Block a user