feat(phase21.5): MirBuilder optimization prep + crate EXE infrastructure

Phase 21.5 optimization readiness - C-level performance target: - MirBuilder: JsonFrag purify toggle (HAKO_MIR_BUILDER_JSONFRAG_PURIFY=1) - Normalizer: extended f64 canonicalization + dedupe improvements - loop_opts_adapter: JsonFrag path refinement for crate EXE compatibility Infrastructure improvements: - provider_registry: add diagnostics + ring-1 providers (array/console/map/path) - mir_interpreter: add normalization/purify feature gates - tools/selfhost_exe_stageb.sh: new end-to-end Stage-B→crate EXE pipeline - tools/perf/microbench.sh: performance measurement tooling Smoke tests (phase2100): - Extend timeout 15s→120s for heavy crate EXE builds - Add stageb_loop_jsonfrag_crate_exe_canary_vm.sh (target test) - Add s3_backend_selector_crate_exe_vm_parity_return42_canary_vm.sh Documentation: - ENV_VARS.md: add Phase 21.5 optimization toggles - README updates: clarify crate backend strategy - phase215-optimization.md: new optimization roadmap This commit sets the stage for Phase 21.5 critical optimization: achieving C-level performance to decide hakorune's future viability.
2025-11-11 02:07:12 +09:00
parent ece91306b7
commit 07a254fc0d
49 changed files with 905 additions and 167 deletions
--- a/docs/development/phase215-optimization.md
+++ b/docs/development/phase215-optimization.md
@ -0,0 +1,43 @@
+# Phase 21.5 — Optimization Readiness (MirBuilder + Runtime)
+
+Goal
+- Target: ≥ 80% of equivalent C for core micro‑benches（同一アルゴリズム、最適化ON）。
+- Scope: Nyash AOT/LLVM ライン（ハーネス or EXE）、ホットパスの構造最適化（挙動不変）。
+- Guard: 既定挙動/ABI不変、devトグルでの可視化と段階導入、ロールバック容易。
+
+Readiness (done)
+- Normalizer を MirBuilder 本線/Min に既定OFFで配線、ON時のみタグ（静音トグル付）。
+- f64 正規化の共通化（JsonNumberCanonical）・phi整列・ret値明示・const重複排除。
+- Canary: 冪等 / cross‑block no‑dedupe / rcパリティ（if/loop/binop）/ f64（指数/−0.0/末尾0）/ phi（many/nested）。
+
+Plan
+1) Baseline & Harness
+   - 代表ベンチ（LoopSum / StrLen / BoxAlloc）で C baseline と Nyash(LLVM) を比較。
+   - 計測を tools/perf/microbench.sh に集約。`--runs N` で中央値/平均を算出。
+2) Hotspot Discovery
+   - Builder 出力の冗長箇所（const/compare連打、不要な一時値）、Runtime の alloc/型分岐を観測。
+   - 代表ケースで alloc 回数/branch 回数をロギング（devトグル下、既定OFF）。
+3) Small-step Optimization（構造優先・挙動不変）
+   - Builder 側: テキスト結合の抑制（集約バッファ）、重複constの先頭集約（既に導入済）。
+   - Runtime 側: 軽量 fast‑path（整数演算/比較の直通）、Box 生存期間短縮（スコープ明確化）。
+4) Acceptance
+   - 代表ベンチ3種で C の ≥80%（中央値）を達成。変動が大きい環境では ±10%を許容しつつCIはスキップ扱い。
+
+How to run (examples)
+- Quick with Normalizer ON（重いEXEありのため timeout 120 推奨）:
+  - `HAKO_MIR_BUILDER_JSONFRAG_NORMALIZE=1 ./tools/smokes/v2/run.sh --profile quick --timeout 120`
+- Microbench（C vs Nyash/LLVM ハーネス）:
+  - `tools/perf/microbench.sh --case loop --n 5000000 --runs 5`
+  - `tools/perf/microbench.sh --case strlen --n 2000000 --runs 5`
+  - `tools/perf/microbench.sh --case box --n 100000 --runs 5`
+ - VM runtime counters（dev 診断、既定OFF）:
+   - `NYASH_VM_STATS=1 ./target/release/hakorune --backend vm apps/tests/CASE.hako` → `[vm/stats] inst=… compare=… branch=…` を出力
+
+Toggles
+- `HAKO_MIR_BUILDER_JSONFRAG_NORMALIZE=1` — 正規化ON（既定OFF）
+- `HAKO_MIR_BUILDER_NORMALIZE_TAG=1` — タグ出力（既定静音）
+- `SMOKES_DEV_NORMALIZE=1` — devヘルパから正規化ON注入（quick限定ON例は test_runner にコメント記載）
+
+Notes
+- ベンチは OS/CPU/周辺負荷に依存するため、CIでの厳格判定は避け、ローカル/任意ジョブで傾向を確認。
+- 構造最適化優先（条件分岐/インライン化での挙動差を避ける）。