# CURRENT_TASK(Rolling, SSOT) ## 0) 今の「正」 - **性能比較の正**: FAST PGO build(`make pgo-fast-full` → `bench_random_mixed_hakmem_minimal_pgo`)✓ **Phase 68 昇格済み** (seed/WS diversified) - **安全・互換の正**: Standard build(`make bench_random_mixed_hakmem`) - **観測の正**: OBSERVE build(`make perf_observe`) - **スコアカード**: `docs/analysis/PERFORMANCE_TARGETS_SCORECARD.md`(M1 達成・超過: 50.93% vs 50% target) - **計測の正(Mixed 10-run)**: `scripts/run_mixed_10_cleanenv.sh`(`ITERS=20000000 WS=400`) ## 1) 現状(要点) - Phase 64(backend prune / DCE): **NO-GO**(-4.05%) → layout tax 由来 - Phase 63(FAST_PROFILE_FIXED): **研究用ビルド**として保持(FAST の gate を compile-time 固定) - Phase 65(Hot Symbol Ordering): **BLOCKED**(GCC+LTO の制約で不公平/不可能)→ `docs/analysis/PHASE65_HOT_SYMBOL_ORDERING_1_RESULTS.md` - Phase 66(PGO, GCC+LTO): **GO** ✓ - 検証: 3回独立実行で +3.0% mean, all >+2.89%, 分散 <±1% - Baseline: `bench_random_mixed_hakmem_minimal_pgo` = 60.89M ops/s = 50.32% (initial PGO) - Phase 68(PGO training set 最適化): **GO & 昇格完了** ✓ - 検証: 10-run で +1.19% vs Phase 66 (GO: +1.0% threshold超過) - 新 baseline: `bench_random_mixed_hakmem_minimal_pgo` (upgraded) = 61.614M ops/s = **50.93%** (50% target 超過、+0.93pp) ## 2) 次の指示書(Active) **Phase 68: PGO training set 最適化** ✅ **完了** - ✓ seed/WS diversification: WS (3→5パターン), seed (1→3パターン) - ✓ 10-run 検証: +1.19% vs Phase 66 (GO threshold +1.0% 超過) - ✓ Baseline 昇格: 61.614M ops/s = 50.93% (M1 target 50% を +0.93pp 超過) - ✓ スコアカード・CURRENT_TASK 更新完了 --- **Phase 67a(推奨): layout tax 法医学調査** - **狙い**: Phase 64 NO-GO (-4.05%) の根本原因を「再現可能な手順」に固定 - **やること**: perf stat (cycles/IPC/branch-miss/cache-miss/iTLB) を差分テンプレ化 → docs に添付 - Binary diff: Phase 66 baseline vs Phase 64 attempt - perf drill-down: Hot function の IPC drop / branch miss rate 増加を定量化 - 実装変更なし(法医学ドキュメント化のみ) - **成果物**: `docs/analysis/PHASE67A_LAYOUT_TAX_FORENSICS_RESULTS.md` **Phase 67b(後続): 境界inline/unrollチューニング** - **注意**: layout tax リスク高い(Phase 64 reference) - **前提**: Top 50 実行確認が必須 - 触るなら最小限・高確度だけ(例: C0 allocator inline candidates のみ) **注記**: 研究箱の削除は今やらない(link-out/削除が layout tax を起こす前例が強いので、compile-out維持が正解) **M2 への道 (55% target)**: - PGO はもう +1% 程度の改善上限に達した可能性(profile training set 枯渇) - 次のレバーは: (1) layout tax 排除 / (2) structural changes(box design) / (3) compiler flags tuning ## 3) アーカイブ - 詳細ログ: `CURRENT_TASK_ARCHIVE_20251210.md` - 直近整理前スナップショット: `docs/analysis/CURRENT_TASK_ARCHIVE.md`