docs: clarify Phase 75 vs FAST PGO SSOT

This commit is contained in:
Moe Charm (CI)
2025-12-18 09:11:56 +09:00
parent 4f99054fd5
commit e9fad41154
6 changed files with 443 additions and 30 deletions

View File

@ -2,13 +2,18 @@
## 0) 今の「正」SSOT
- **性能比較の正**: FAST PGO build`make pgo-fast-full``bench_random_mixed_hakmem_minimal_pgo` **WarmPool=16** + **C5+C6 inline slots**Phase 75 強GOで昇格済み
- **性能比較の正**: FAST PGO build`make pgo-fast-full``bench_random_mixed_hakmem_minimal_pgo` **WarmPool=16**
- Phase 75C5/C6 inline slotsは presets に昇格済みだが、**FAST PGO での再計測rebaseは未実施**Standard での A/B は +5.41%)。
- **安全・互換の正**: Standard build`make bench_random_mixed_hakmem`
- **観測の正**: OBSERVE build`make perf_observe`
- **スコアカード(目標/現在値)**: `docs/analysis/PERFORMANCE_TARGETS_SCORECARD.md`
- Current baselineFAST v3 + PGO + Phase 75: **44.65M ops/s = 36.75% of mimalloc** (Phase 75-3 4-point matrix)
- 次の目標: **M2 = 55%**(残り **+18.25pp**
- **Mixed 10-run SSOT**: `scripts/run_mixed_10_cleanenv.sh``ITERS=20000000 WS=400``HAKMEM_WARM_POOL_SIZE=16` + `C5_INLINE_SLOTS=1` + `C6_INLINE_SLOTS=1` デフォルト
- **FAST baselineSSOT**: `docs/analysis/PERFORMANCE_TARGETS_SCORECARD.md` を正とするPhase 69: 62.63M ops/s = 51.77% of mimalloc
- **Phase 75 の計測**: `bench_random_mixed_hakmem`非PGO/別ターゲット)で **A/B +5.41%** を確認Phase 75-3 4-point matrix。FAST PGO への反映rebaseは別途。
- 次の目標: **M2 = 55%**gap は FAST baseline を基準に判断する
- **Mixed 10-run SSOTハーネス**: `scripts/run_mixed_10_cleanenv.sh`
- デフォルト `BENCH_BIN=./bench_random_mixed_hakmem`Standard
- FAST PGO は `BENCH_BIN=./bench_random_mixed_hakmem_minimal_pgo` を明示する
- 既定: `ITERS=20000000 WS=400``HAKMEM_WARM_POOL_SIZE=16``HAKMEM_TINY_C5_INLINE_SLOTS=1``HAKMEM_TINY_C6_INLINE_SLOTS=1`
## 1) 迷子防止(経路/観測)
@ -84,7 +89,7 @@
---
## Phase 75構造: Hot-class Inline Slots (P2) 🟡 **準備中**
## Phase 75構造: Hot-class Inline Slots (P2) **完了Standard A/B**
**Goal**: C4-C7 の統計分析 → targeted optimization 戦略決定
@ -198,7 +203,8 @@ Per-class Unified-STATS (Mixed SSOT, WS=400, HAKMEM_MEASURE_UNIFIED_CACHE=1):
2. `scripts/run_mixed_10_cleanenv.sh`: Added C5+C6 ENV defaults
3. C5+C6 inline slots now **promoted to preset defaults** for MIXED_TINYV3_C7_SAFE
**Phase 75 Complete**: C5+C6 inline slots (129-256B) deliver +5.41% proven gain. Baseline updated to 44.65 M ops/s.
**Phase 75 Complete**: C5+C6 inline slots (129-256B) deliver +5.41% proven gain **on Standard binary**`bench_random_mixed_hakmem`)。
- FAST PGO baselineスコアカードを更新する前に`BENCH_BIN=./bench_random_mixed_hakmem_minimal_pgo` **同条件の A/BC5/C6 OFF/ON** を再計測すること
**参考**:
- 4-point matrix 結果: `docs/analysis/PHASE75_3_C5_C6_INTERACTION_RESULTS.md`