Phase 25.1a: selfhost builder hotfix (fn rename, docs)

This commit is contained in:
nyash-codex
2025-11-15 05:42:32 +09:00
parent 8d9bbc40bd
commit 6856922374
40 changed files with 2013 additions and 72 deletions

View File

@ -0,0 +1,188 @@
# Phase 25.1 — Stage0/Stage1 Bootstrap & Binary Layout
Status: design+partial implementationStage1 ビルド導線の初期版まで)
## ゴール
- Rust 製 `hakorune` を **Stage0 ブートストラップ**と位置付け、Hakorune コード(.hakoで構成された **Stage1 バイナリ**を明確に分離する。
- Rust 側の責務を「プロセス起動+最小 FFIVM/LLVM コア」に縮退し、それ以外の機能パーサ高レイヤ、StageB、MirBuilder、AotPrep、numeric core 等)は Stage1 に寄せる。
- 将来的に「Stage1 hakoruneHakorune 実装の EXE」を日常利用の標準とし、Rust Stage0 は非常用ランチャ/ブートシードとして保持する。
## レイヤ構成Stage0 / Stage1 / Runtime
### Stage0 — Rust Bootstrap Binary
**想定バイナリ:**
- 将来: `target/release/hakorune-bootstrap`
- 現在: `target/release/nyash`Rust 製 CLI。Stage0 ブートストラップとして扱う)
**責務:**
- OS エントリポイント(`main()`)とプロセス起動。
- 標準入出力・環境変数・argv の取得と最低限の整形。
- LLVM / OS FFI への極小ラッパ(`rt_mem_*` などの intrinsic の土台)。
- Rust VM/LLVM のコアMIR インタプリタ/コード生成)の提供。
- Stage1 で AOT されたコア関数(後述)を呼び出すランチャ。
**禁止/抑制:**
- パーサ高レイヤStageBMirBuilderAotPrepnumeric core のロジックを Rust 側に新規追加しない。
- 新しい Box 実装やランタイム機能を Rust に持ち込まないPhase 25 Rust Freeze を継続)。
### Stage1 — Hakorune Selfhost Binary
**想定バイナリ:**
- `target/selfhost/hakorune`Stage0 が AOT して生成する EXE; ファイル名で Stage1 を表し、配置ディレクトリで Stage0 と分離)
**構成要素(.hako 側で実装/AOT:**
- StageB コンパイラ(`lang/src/compiler/entry/compiler_stageb.hako` など)。
- MirBuilder / MIR v1→v0 アダプタ。
- AotPrep`selfhost.llvm.ir.aot_prep.*`、numeric core パスを含む)。
- Ring1 VMruntime の一部System Hakorune subset で書かれたコアロジック)。
**責務:**
- Source(.hako) → Program(JSON) → MIR → 実行LLVM AOT の全パイプラインを Hakorune コードで担う。
- Stage1 自身を再ビルドできる最小セット(自己ホストコア)を提供する。
**起動イメージ:**
- Stage0 `main()`:
- 環境・argv を集約。
- AOT 済み `hakorune_main(argc, argv_ptr)`Stage1 側関数)を呼び出すだけの薄い導線。
### Runtime Lines共通
- VM 実行エンジンと LLVM バックエンドは Stage0/Rust に残すRing0
- Ny 側からは `env.mirbuilder.emit` / `env.codegen.emit_object` / `env.codegen.link_object` といった extern 経由で利用する。
- Stage1 は Rust CLI`nyash`)を「バックエンド CLI」として前提にせず、C-ABI/extern 経由で Ring0 機能にアクセスする。
- その上で Stage1/Hakorune コードを AOT したものをリンクして「言語本体」を構成する。
- 長期的には、Stage1 からさらに Stage1' を再ビルドして差分が収束する自己ホストサイクルを目指す。
- 具体的には「Stage0→Stage1本バイナリ」に加えて「Stage1→Stage1'」を実行し、両者の挙動/インターフェース一致を確認するチェックを設ける。
## ディレクトリ/バイナリ配置案
### Rust Stage0Bootstrap
- ソース配置案:
- `src/bootstrap/` … Stage0 専用のエントリポイントFFIVM/LLVM コアの窓口。
- 既存の Rust コードは徐々にここへ整理(広域リファクタは別フェーズで慎重に)。
- バイナリ:
- 現在: `target/release/nyash` … Stage0 実行ファイルRust 製 hakorune 相当)。
- 将来: `target/release/hakorune-bootstrap` … Stage0 専用バイナリ(名称を分離予定)。
### Hakorune Stage1Selfhost
- ソース:
- 既存どおり `lang/src/**` に配置StageB / MirBuilder / AotPrep / VM など)。
- Stage1 としてビルドすべきモジュールセットを `tools/selfhost/` 以下のスクリプトで管理する。
- バイナリ:
- 現在Phase 25.1 初期実装):
- Dev line:
- `tools/selfhost/build_stage1.sh``apps/selfhost-runtime/runner.hako` を AOT し、`target/selfhost/hakorune` を生成する。
- 「Ny ExecutorMIR v0 ランタイムCLI 実験」の開発用 EXE最新版
- Stable line:
- `lang/build/build_runner.sh``lang/bin/hakorune` を生成pure-lang launcher / legacy bring-up
- 安定した `target/selfhost/hakorune``lang/bin/hakorune` に昇格させて配布基準とする運用を想定。
- 将来:
- `lang/bin/hakorune` を「標準 hakorune」として日常利用のメインバイナリに昇格させるdev line は常に先行する実験用バイナリ)。
- Stage0 は `hakorune-bootstrap` として非常用ランチャ/自己ホストの起点として残す。
## ビルド導線Phase 25.1 初期版)
このフェーズでは「Rust Stage0 バイナリ」と「Hakorune Stage1 バイナリ」を、ビルド導線レベルで分離するところまでを行う。
### Makefile ターゲット(開発用)
- `make stage0-release`
- 役割: Rust Stage0`target/release/nyash`)をビルドする。
- 実体: `cargo build --release`既定機能のみ、Rust CLI のみを対象)。
- `make stage1-selfhost`
- 役割: Stage0 を利用して Stage1 selfhost バイナリをビルドする。
- 実体:
- `make stage0-release`Stage0 準備)
- `tools/selfhost/build_stage1.sh`
- 出力: `target/selfhost/hakorune-selfhost`Ny Executor 最小 EXE
### Stage1 ビルドスクリプト
- `tools/selfhost/build_stage1.sh`
- 入力: `apps/selfhost-runtime/runner.hako`Ny Executor エントリ)。
- 経路:
1. `tools/hakorune_emit_mir.sh` で StageBMirBuilder を通し、MIR(JSON v1) を生成。
2. `tools/ny_mir_builder.sh --emit exe` で ny-llvmc 経由の EXE を生成。
- 出力: `target/selfhost/hakorune-selfhost`
- 備考:
- EXE のインターフェースは開発用MIR v0 ファイルを引数に取る Ny Executor。フル CLI 化は後続フェーズで行う。
- `NYASH_LLVM_SKIP_BUILD=1` を指定すると、既存の ny-llvmc / nyash_kernel ビルド成果物を再利用して高速化できる。
## フェーズ内タスク25.1 設計 TODO
### A. Stage0/Stage1 境界のドキュメント固定
- [x] 本ファイルphase-25.1/README.mdに Stage0/Stage1 の責務と禁止事項を明文化する。
- [x] Phase 25 README に Stage0/Stage1 の関係をリンクRing0/Ring1 の上位概念として扱う)。
- [x] CURRENT_TASK.md に「Stage0=Rust bootstrap / Stage1=Hakorune selfhost」の方針を追記。
### B. Stage1 コアセットの定義
- [ ] Stage1 で AOT すべきモジュール一覧をドラフトする(例: StageB / MirBuilder / AotPrep / numeric core
- [ ] それらのエントリポイント関数(例: `hakorune_main/argc,argv` 相当)を .hako 側で定義する設計メモを追加。
### C. ビルド/配置戦略(設計のみ)
### C. ビルド/配置戦略(設計 → 初期実装)
- [x] `tools/selfhost/` 以下に Stage1 ビルド用スクリプト名と役割を決める(`build_stage1.sh`)。
- [x] `target/selfhost/` ディレクトリに Stage1 バイナリを配置する方針を Cargo/Makefile コメントに記載。
- [x] Makefile に `stage0-release` / `stage1-selfhost` ターゲットを追加し、Stage0/Stage1 のビルド導線を分離。
### D. 将来の自己ホストサイクルの入口を定義
- [ ] Stage0→Stage1→Stage1' のビルドシーケンスを文章で定義(どの組み合わせで自己一致チェックを行うか)。
- [ ] 「普段使うのは Stage1」「問題発生時に Stage0 から再生成」という運用パターンを docs に記載。
## 実装チェックリスト25.1 実行順案)
### 1. バイナリ命名と役割の明確化
- [x] Cargo.toml に Stage0/Stage1 の bin ターゲット方針を書き出す(ドキュメントコメントレベル)。
- 現状: `[[bin]] name = "nyash"` を Stage0Rust bootstrapとして扱い、Stage1 は `tools/selfhost/build_stage1.sh` で生成される `target/selfhost/hakorune` として外部管理。
- [ ] CURRENT_TASK.md に「ユーザーが使うのは `hakorune` / Stage0 は `hakorune-rust`」という運用ポリシーを追記。
### 2. Stage1 ランチャーHako側 Mainの骨組み
- [ ] `lang/src/runner/launcher.hako` を Stage1 の論理エントリポイントとして固定し、コメントに責務(モード切り替え)を書く。
- [ ] ランチャーから呼ぶパイプラインインターフェースを設計する:
- [ ] `.hako → Program(JSON)` を呼ぶ関数StageB
- [ ] `Program(JSON) → MIR(JSON)` を呼ぶ関数MirBuilder
- [ ] `MIR(JSON) → PREP(MIR)` を呼ぶ関数AotPrep + numeric_core
- [ ] `MIR(JSON) → 実行/EXE` を呼ぶ関数VM/LLVM
- [ ] `launcher.hako``Main.main(args)` から、上記インターフェースを呼び分ける最小のモード分岐を定義する設計メモを追加(実装は後続フェーズでもよい)。
### 3. selfhost 用ビルドスクリプトの足場
- [ ] `tools/selfhost/` ディレクトリを作成(存在しない場合)。
- [ ] `tools/selfhost/build_stage1.sh`(仮称)の skeleton を追加:
- [ ] 必要な Hako モジュールセットStageB / MirBuilder / AotPrep / runtimeをコメントで列挙。
- [ ] 現時点では no-op または「未実装」のメッセージだけにして、呼び出し位置を固定。
- [ ] README本ファイルに build_stage1.sh の役割と将来の AOT 手順(.hako→MIR→ny-llvmc→EXEを文章で書いておく。
### 4. Stage0 ↔ Stage1 の切り替えポリシー
- [ ] docs に「普段は Stage1 の `hakorune` を使い、壊れたときだけ Stage0 の `hakorune-rust` を直接叩く」という運用例を追記。
- [ ] `tools/selfhost/` に便利ラッパの案をメモしておく:
- 例: `hako-vm.sh`Stage1 + `--backend vm`)、`hako-exe.sh`Stage1 + `--backend llvm --exe`)。
### 5. 将来の自己ホストルートへの接続
- [ ] Stage1 の `Main.main(args)` から「自分自身を再ビルドする」エントリポイント名だけ決めておく(例: `selfhost_build_main`)。
- [ ] Phase 26 以降で、このエントリポイントを `tools/selfhost/build_stage1.sh` から呼ぶ形にする想定を書き残す。
このチェックリストは「コードを書く前に何を決めておくか」と「どこから小さく実装を始めるか」の順序を示すだけで、実装自体は後続フェーズで少しずつ進める前提だよ。
## このフェーズでやらないこと
- Rust コードの削除や広域リファクタ(責務の再ラベリングとロードマップ策定に留める)。
- Stage1 バイナリを CI で標準に昇格させる変更(ローカル開発用の設計段階に留める)。
- Stage1 ランチャー(フル CLI モード切り替え)の実装本体(このフェーズでは Ny Executor 最小 EXE まで)。
Related docs:
- `docs/development/roadmap/phases/phase-25/README.md` … Stage0/Ring0-Ring1 再編と numeric_core BoxCall→Call パスのまとめ。
- `docs/development/runtime/cli-hakorune-stage1.md` … Stage1 hakorune CLI のサブコマンド設計と Stage0 との役割分離。
- `docs/development/roadmap/phases/phase-25.1a/README.md` … Stage1 build パイプラインProgram→MIR/selfhost AOTのホットフィックス計画。***

View File

@ -0,0 +1,91 @@
# Phase 25.1a — Stage1 Build Pipeline Hotfix (Program→MIR)
Status: hotfix-in-progress緊急タスク配線修正フェーズ
## ゴール
- Phase 25.1 で導入した Stage1 ランチャー(`lang/src/runner/launcher.hako`)と selfhost AOT パイプライン(`build_stage1.sh` 経由)を「実際に動く状態」に戻す。
- `.hako → Program(JSON v0) → MIR(JSON) → EXE` のうち、**Program(JSON v0) → MIR(JSON)** の導線を再構成し、`tools/hakorune_emit_mir.sh` / `tools/selfhost_exe_stageb.sh` / `tools/selfhost/build_stage1.sh` が代表ケースで成功するようにする。
- selfhost builder / provider / legacy CLI の 3 経路が混在した現状を見直し、**信頼できる1本の Program→MIR 経路**を中心に据える。
## 現状の問題点2025-11-15 時点)
- `tools/selfhost/build_stage1.sh`:
- 現在の entry: `lang/src/runner/launcher.hako`Stage1 CLI ランチャー)。
- 内部で `tools/selfhost_exe_stageb.sh``tools/hakorune_emit_mir.sh` を呼び出しているが、MIR 生成フェーズで失敗。
- ログ: `[FAIL] Program→MIR delegate failed (provider+legacy)`
- `tools/hakorune_emit_mir.sh` — Program→MIR 部分:
1. StageB`compiler_stageb.hako`:
- `Stage-B: SUCCESS - Generated Program(JSON)` まで成功(`"version":0,"kind":"Program"` を含む JSON が得られている)。
2. selfhost builder 経路(`try_selfhost_builder`:
- `builder_box=hako.mir.builder` で Runner を生成し、VM 経由で実行。
- 当初は tmp ハコファイルに対して `Parse error: Unexpected token FN``Unexpected token ASSIGN` が発生し rc=1 で失敗していたが、`lang/src/mir/builder/func_lowering.hako``local fn = func_jsons.length()``local func_len = ...` にリネームすることで `Unexpected token FN` 自体は解消済み。
- 現在は text-merge 後の巨大一時ファイルに対して `Parse error: Invalid expression at line <N>` が出ており、prelude 連結のどこかで Stage3 構文と合わない断片が残っている状態selfhost builder は引き続き要調査)。
3. provider 経路(`try_provider_emit``env.mirbuilder.emit`:
- 当初は `env.mirbuilder.emit` 実行時に `[mirbuilder/parse/error] undefined variable: args` により失敗していたが、Rust 側の Program→MIR ルート修正によりこのエラーは解消済み。現在は provider 経路経由で `launcher.hako` から MIR(JSON) を安定して生成できている。
4. legacy CLI 経路(`--program-json-to-mir`:
- Program(JSON) を一時ファイルに書いて `nyash --program-json-to-mir` を叩くフォールバックも rc!=0 で終了していたが、Phase 25.1a では provider 経路の安定化を優先するため、現在は原則退避路とし、日常の導線では利用しない。
- Stage1 CLI (`launcher.hako`) の VM 実行:
- `nyash --backend vm lang/src/runner/launcher.hako -- emit ...` で、
- `using` の解決(`lang.compiler.build.build_box`)は nyash.toml に追加済みだが、
- まだパーサが Stage3 構文/関数宣言の一部を受理できていない箇所があり、`Unexpected token ...` 系のエラーが残っている。
## フェーズ内タスク25.1a TODO
### A. Stage1 CLI ソースの VM 実行復旧
- [ ] `lang/src/runner/launcher.hako` を Stage3 パーサが素直に通る形に調整する。
- [ ] 関数/ブロック構造・ローカル宣言のスタイルを既存の selfhost コードに合わせる(`function` 定義や `local` の位置など)。
- [ ] `using lang.compiler.build.build_box as BuildBox` 経路を nyash.toml / hako_module.toml に統一し、「ファイルパス using」を完全に排除する。
- [ ] VM 実行スモーク:
- [ ] `NYASH_ALLOW_NYASH=1 ./target/release/nyash --backend vm lang/src/runner/launcher.hako -- emit program-json apps/selfhost-minimal/main.hako` が parse error なく通ること。
- [ ] 同様に `emit mir-json` / `build exe` も、少なくともエラーメッセージ付きで Fail-Fast するところまで確認するVM 側での構文エラーがないこと)。
### B. Program→MIR selfhost builder 経路の安定化
- [ ] `try_selfhost_builder` 内で生成される tmp ハコファイル(`__BUILDER_BOX__` 版)を最小ケースで切り出し、単体で parse/実行できるように修正。
- [ ] `args` 未定義エラーや `Invalid expression` の原因となっている記述を特定し、Runner 側の `Main.main(args)` などを正しく宣言する。
- [ ] Stage3 構文の使用を必要最小限に抑え、selfhost builder 用 Runner のコードをシンプルに保つ。
- [x] Stage3 パーサで予約語となった `fn` をローカル変数名として使っている箇所(例: `lang/src/mir/builder/func_lowering.hako``local fn = func_jsons.length()`)をリネームし、`Unexpected token FN, expected identifier` を根本的に解消する。
- [ ] `try_selfhost_builder`**第一候補** とし、代表ケースlauncher.hako 等)で常にここが成功することを確認。
- [ ] `HAKO_SELFHOST_BUILDER_FIRST=1``tools/hakorune_emit_mir.sh` を叩いたときに `[OK] MIR JSON written (selfhost-first)` まで到達することをスモークで確認。
### C. Provider / legacy delegate の整理
- [x] provider 経路(`env.mirbuilder.emit`)での `undefined variable: args` 原因を修正し、StageB が出力する Program(JSON v0) を正しく受理できるようにする。
- [ ] `HAKO_V1_EXTERN_PROVIDER` / `HAKO_V1_EXTERN_PROVIDER_C_ABI` トグルのデフォルトを見直し、「selfhost builder が成功するなら provider には落ちない」構造に寄せる。
- [ ] legacy CLI 経路(`--program-json-to-mir`は、「selfhost builder が失敗したときだけ最後に試す」退避路として残しつつ、代表ケースでは通さない方針にする。
- [ ] 必要であれば Phase 25.1a 中は `HAKO_SELFHOST_NO_DELEGATE=1` を既定 ON に近い扱いにし、「selfhost builder が通る範囲」に問題を絞る。
### D. build_stage1.sh / selfhost_exe_stageb.sh 復旧
- [x] `NYASH_LLVM_SKIP_BUILD=1 tools/selfhost/build_stage1.sh --out /tmp/hakorune-dev` が 0 exit すること(現状は selfhost builder を既定OFFにし、provider ルートで MIR を生成)。
- [ ] 生成された `/tmp/hakorune-dev` について:
- [ ] `./hakorune-dev emit program-json apps/selfhost-minimal/main.hako` が Program(JSON v0) を出力すること。
- [ ] `./hakorune-dev emit mir-json apps/selfhost-minimal/main.hako` が MIR(JSON) を出力すること。
- [ ] `./hakorune-dev build exe -o /tmp/hako_min apps/selfhost-minimal/main.hako` で簡単な EXE が生成され、実行して 0 exit を返すこと。
- [ ] `tools/selfhost_exe_stageb.sh` についても同様に `.hako → EXE` のスモークを通しておく(少なくとも launcher.hako / apps/selfhost-minimal/main.hako の2ケース
## 25.1 / 25.1a / 25.2 の関係
- Phase 25.1:
- Stage0/Stage1 の責務とバイナリレイアウトを設計し、Stage1 CLIlauncher.hakoの顔と構文を固めるフェーズ。
- Phase 25.1a(本ファイル):
- 「設計した Stage1 CLI / selfhost パイプラインが実際に動くようにする」緊急ホットフィックスフェーズ。
- Scope はあくまで **Program→MIR と selfhost AOT の復旧** に限定し、numeric_core などの最適化には踏み込まない。
- Phase 25.2:
- numeric_core AOT / microbench 統合・性能チューニングにフォーカス(`matmul_core` など)。
- 25.1a で安定化した selfhost パイプラインの上に乗せる形で進める。
## Related docs
- `docs/development/roadmap/phases/phase-25.1/README.md` … Stage0/Stage1 Bootstrap & Binary Layout設計初期実装
- `docs/development/roadmap/phases/phase-25/README.md` … Ring0/Ring1 再編と numeric_core BoxCall→Call パス。
- `docs/development/runtime/cli-hakorune-stage1.md` … Stage1 hakorune CLI のサブコマンド設計と実装範囲。
- `tools/hakorune_emit_mir.sh` … StageB → Program(JSON v0) → MIR(JSON) の selfhostdelegate パイプライン。
- `tools/selfhost_exe_stageb.sh` / `tools/selfhost/build_stage1.sh``.hako → MIR(JSON) → EXE` selfhost AOT パス。***
- Notes:
- selfhost builder (`HAKO_SELFHOST_BUILDER_FIRST=1`) は依然として parse error で落ちるため、Phase 25.1a では **既定を 0無効** に切り替え、provider ルートを安定化させた。
- builder-first 経路の再有効化は Phase 25.1a 中の後続タスクとして扱う。

View File

@ -0,0 +1,47 @@
# Phase 25.2 — Numeric Microbench & EXE Tuning
Status: proposalPhase 25 / 25.1 の後続フェーズ)
## ゴール
- Phase 25 で整備した numeric core / AotPrep / `NYASH_AOT_NUMERIC_CORE` の仕組みを前提に、
- `matmul_core` を含む numeric 系 microbenchLLVM/EXEを安定して実行できる状態にする。
- EXE/LLVM ラインでの性能を観測しやすくし、「VM 側の自己ホスト部分の重さ」と「生成された EXE の速さ」を分離して評価できるようにする。
- Phase 25.1 の Stage0/Stage1 設計に沿って、将来的に Stage1(EXE) から microbench を叩く土台を作る。
## スコープPhase 25.2
### 1) matmul_core microbench EXE ラインの安定化
- 対象:
- `tools/perf/microbench.sh --case matmul_core --backend llvm --exe ...`
- 目標:
- `NYASH_AOT_NUMERIC_CORE=1` ON の状態で、`matmul_core` microbench が LLVM/EXE 経路で安定して実行できること。
- STRICT`NYASH_AOT_NUMERIC_CORE_STRICT=1`)は AotPrep 後の MIR(JSON) に対してのみ適用し、pre-AotPrep の MIR emit/VM 起動を阻害しないこと。
- タスク(例):
- provider 経路(`env.mirbuilder.emit`の安定化と診断強化VM ハングや長時間化の原因切り分け)。
- `NYASH_LLVM_DUMP_MIR_IN` を使った実際の `matmul_core` MIR 形状の観察と numeric_core パスの適用確認。
### 2) コンパイル経路とベンチ経路の分離
- 問題意識:
- 現状 microbench は「`.hako → Program(JSON) → MIR(JSON) → AotPrep → ny-llvmc → EXE → 実行」を 1 コマンドで行うため、selfhost VM 部分の重さと EXE 実行の重さが混ざりやすい。
- 方針:
- `matmul_core` 用に:
- 一度だけ MIR(JSON) を生成し、その JSON を複数回再利用するモードを用意する(例: `tools/dev_numeric_core_prep.sh` + `ny-llvmc` 直呼び)。
- microbench は「既に生成済みの EXE を何度も実行する」モードと、「.hako からフルコンパイルする」モードを分ける。
### 3) numeric_core STRICT モードの本番運用ルール
- Phase 25 では:
- STRICT は AotPrep 後の MIR(JSON) に対してのみチェックするように整理済み。
- pre-AotPrep 生 MIR へのチェックは Rust 側から削除済み。
- Phase 25.2 での追加整理:
- microbench / CI で `NYASH_AOT_NUMERIC_CORE_STRICT=1` を使う場合のガイドラインを docs に追記。
- STRICT 違反時の代表的な原因numeric_core がマッチできないパターン)を例示し、デバッグ手順を `DEBUG_NUMERIC_CORE.md` に統合。
## スコープ外
- Stage0/Stage1 の設計・導線整理自体は Phase 25.1 の責務(本フェーズでは利用側の調整に留める)。
- 新しい numeric ABI の機能追加や IntArrayCore/MatI64 の API 拡張(根幹設計は Phase 25 側で担当)。

View File

@ -0,0 +1,118 @@
# Phase 25 — numeric_core / AotPrep デバッグ指針
Status: memoClaude Code / Codex 向け運用ガイド)
Phase 25 で導入した `numeric_core.hako`BoxCall→Call 変換パス)が動かない・怪しいときに辿るルートをまとめる。
Rust 側の修正に入る前に、ここに沿って Hako 側の構造・設定を確認する。
## 1. まず「パスが本当に動いているか」を確認する
### 1-1. using / nyash.toml マッピング
- `nyash.toml` に次のマッピングが存在するか確認する:
- `selfhost.llvm.ir.aot_prep.passes.numeric_core = "lang/src/llvm_ir/boxes/aot_prep/passes/numeric_core.hako"`
- `numeric_core` が見つからない場合でも致命的エラーにならず、単にパスがロードされないだけ、という挙動になりがちなので注意する。
### 1-2. AotPrep.run_json 経由での実行確認
- `tools/hakorune_emit_mir.sh` を使って、AotPrep が numeric_core を呼んでいるかを確認する:
- `HAKO_APPLY_AOT_PREP=1`
- `NYASH_AOT_NUMERIC_CORE=1`
- `NYASH_AOT_NUMERIC_CORE_TRACE=1`
- 期待するログ:
- `[aot/numeric_core] PASS RUNNING`
- MatI64 検出や変換結果に関するメッセージ。
- これらが 1 行も出ない場合:
- `using selfhost.llvm.ir.aot_prep.passes.numeric_core as AotPrepNumericCoreBox` が解決できていない
- もしくは `NYASH_AOT_NUMERIC_CORE` が子プロセスに渡っていない
可能性が高い。
## 2. standalone で numeric_core を動かしてみる
### 2-1. 最小 MIR(JSON) 入力を用意する
- `MatI64.mul_naive` を 1 回だけ呼ぶような小さな .hako を用意し、MIR(JSON v0) を吐き出す:
- 例: `tmp/matmul_core_mir2.json`
- 重要なのは、JSON 内に次の 2 種類の命令が含まれていること:
- `"op":"const_string", "value":"MatI64"` 相当の文字列定数。
- `"op":"boxcall", "box":..., "method":"mul_naive", ...` の BoxCall。
### 2-2. numeric_core.hako を直接呼ぶ
- selfhost 側で `AotPrepNumericCoreBox.run(json_text)` を直接呼び出す小さなハーネスを作るか、既存のテストスクリプト(例: `/tmp/run_numeric_core_test.sh`)を流用する。
- 期待する振る舞い:
- 型テーブルに MatI64 関連のエントリが 2〜3 件登録される。
- BoxCall が `Call("NyNumericMatI64.mul_naive", args=[receiver, ...])` に 1 件だけ変換される。
- 元の BoxCall 行は JSON から削除されている。
## 3. JSON スキャンの典型的な落とし穴
### 3-1. JSON 全体を 1 オブジェクトとして扱ってしまうバグ
- 過去のバグ:
- `text.indexOf("{", pos)` でオブジェクト開始を探した結果、JSON 全体のルート `{` を拾ってしまい、
- `instructions` 配列の全要素を 1 つの巨大な「inst」として扱ってしまった。
- 結果:
- 最初の命令の `dst:0` と、どこかにある `"MatI64"` 文字列が同じオブジェクトに含まれてしまい、型推論が完全に壊れる。
### 3-2. 修正パターンop-marker-first
- オブジェクト境界は次の手順で決める:
1. `pos` 以降で `"op":"` を検索する。
2. 見つかった位置から後方へ `lastIndexOf("{", op_pos)` して、その命令オブジェクトの開始位置を求める。
3. その開始位置から `_seek_object_end(text, obj_start)` を呼んで終了位置を決める。
- ポイント:
- `_seek_object_end` 自体は「開始位置を与えればそのオブジェクトの終端を返す」役割に限定し、
- 「どの `{` を開始とみなすか」という責務は外側のスキャンロジックに持たせる。
## 4. BoxCall→Call 変換結果の確認ポイント
### 4-1. 変換前後の JSON 断片
- 変換前(例):
- `{"args":[3],"box":2,"dst":4,"method":"mul_naive","op":"boxcall"}`
- 変換後(期待):
- `{"dst":4,"op":"call","name":"NyNumericMatI64.mul_naive","args":[2,3]}`
チェックリスト:
- [ ] `op:"boxcall"``"op":"call"` に変わっている。
- [ ] `name` フィールドに `NyNumericMatI64.mul_naive` が入っている。
- [ ] `args` の先頭が receiver元の `box` のレジスタ)になっている。
- [ ] 元の BoxCall 行が JSON から消えている。
### 4-2. MatI64 型検出ログ
- TRACE=1 のとき、次のようなログが出ているか確認する:
- `[aot/numeric_core] MatI64.new() result at r2`
- `[aot/numeric_core] MatI64.new() result at r3`
- `[aot/numeric_core] type table size: 3`
- これらが出ていない場合:
- `"MatI64"` 文字列定数の検出に失敗しているか、
- `MatI64.new` のパターンが期待とずれている(関数名・引数数など)のどちらか。
## 5. VM/LLVM ラインでの最終確認
### 5-1. VM ライン
- `NYASH_AOT_NUMERIC_CORE=0`:
- 既存挙動が変わっていないか確認するBoxCall のままでも OK
- `NYASH_AOT_NUMERIC_CORE=1`:
- VM 実行結果が OFF のときと一致することを確認する。
- 可能であれば、AotPrep 適用後の MIR(JSON) を一度ダンプし、`boxcall` が消えて `call` になっていることを目視確認する。
### 5-2. LLVM ライン
- `NYASH_AOT_NUMERIC_CORE=1 NYASH_SKIP_TOML_ENV=1 NYASH_DISABLE_PLUGINS=1` など、最小構成で `--backend llvm --exe` による実行を行う。
- 期待すること:
- LLVM コンパイルがエラーなく通る。
- VM ラインと同じ数値結果が得られる。
- IR ダンプを取った場合、`NyNumericMatI64.mul_naive` が通常の `call` として現れ、BoxCall 特有のノードは存在しない。
## 6. それでも原因が分からないとき
- ここまでの手順を踏んでも原因が特定できない場合は、次の情報を CURRENT_TASK.md に貼ってから LLM にバトンタッチする:
- AotPrep 適用前後の MIR(JSON) の短い抜粋(変換対象の関数のみ)。
- `NYASH_AOT_NUMERIC_CORE_TRACE=1` 時点の `[aot/numeric_core]` ログ。
- 使用した .hako ファイル名とベンチ名(例: `matmul_core`)。
- そのうえで、「numeric_core のどこまで動いていて、どの段階で期待と違うか」を一言で書いておくと、後続の LLMClaude Code など)がすぐに再現・解析しやすくなる。

View File

@ -1,6 +1,66 @@
# Phase 25 — 脱Rustランタイム / Ring0-Ring1 再編
Status: proposal設計フェーズ・実装は後続ホスト想定
**Status: ✅ MVP COMPLETED** (2025-11-15)
## 🎉 Phase 25 MVP 完全成功!
**numeric_core BoxCall→Call 変換** が完全動作確認済み!
### 主要成果 (2025-11-14 → 2025-11-15)
1. **✅ 型伝播システム完全動作**:
- 4回反復型伝播で copy → phi → copy チェーン完全対応
- MatI64 型を15レジスタまで正しく追跡
- PHI 検出バグ修正8d9bbc40: `indexOf("{")``indexOf("\"op\":\"")`
2. **✅ 両SSAパターン対応確認**:
- 冗長版13 PHI nodes: test_direct.json, test_matmul_debug.json
- 最適化版1 PHI node: test_matmul_with_wrapper.json, microbench_matmul_core.json
- すべてのパターンで BoxCall → Call 変換成功 ✅
3. **✅ 環境変数伝播修正** (3d082ca1):
- microbench.sh に `NYASH_AOT_NUMERIC_CORE``NYASH_AOT_NUMERIC_CORE_TRACE` 伝播追加
- `tools/perf/microbench.sh --case matmul_core --backend llvm --exe` で完全動作
4. **✅ ログ転送問題根治**:
- hakorune_emit_mir.sh の provider 経路にログ転送追加(ユーザー実装)
- `[aot/numeric_core]` ログが NYASH_AOT_NUMERIC_CORE_TRACE=1 で正しく表示
5. **✅ 開発ワークフロー確立**:
- `tools/dev_numeric_core_prep.sh` で環境変数自動設定
- 推奨開発フロー確立・ドキュメント化完了
### 変換例
**Before** (BoxCall):
```json
{"args":[15],"box":7,"dst":53,"method":"mul_naive","op":"boxcall"}
```
**After** (Call):
```json
{"dst":53,"op":"call","name":"NyNumericMatI64.mul_naive","args":[7,15]}
```
### 既知の制限・次フェーズ
- `NYASH_AOT_NUMERIC_CORE_STRICT=1`: 検証関数実装済みだが未使用(タイミング問題)
- microbench 性能チューニング: **Phase 25.2** に移管
- 他の numeric メソッドadd, sub, etc.: 将来対応
---
## Phase status (2025-11-14 - 初期バージョン):
- このフェーズでは「Ring0/Ring1 の設計」と「numeric_core (MatI64.mul_naive) の BoxCall→Call 降ろし用 AotPrep パス」の MVP 実装までをカバーする。
- `NYASH_AOT_NUMERIC_CORE=1` + AotPrep.run_json による MatI64.mul_naive 降ろしは、代表的な MIR パターン13 PHI / 1 PHI 両方)で動作確認済み。
- `NYASH_AOT_NUMERIC_CORE_STRICT=1` は AotPrep 後の MIR(JSON) に対してのみ BoxCall(mul_naive) 残存をチェックするように整理済みpre-AotPrep の MirBuilder には干渉しない)。
- microbench`tools/perf/microbench.sh --case matmul_core --backend llvm --exe`)による EXE/LLVM ベンチ統合と性能チューニングは **Phase 25.2** に移管する。
Related docs:
- `docs/development/roadmap/phases/phase-25.1/README.md` … Stage0Rust bootstrap/Stage1Hakorune selfhostによるバイナリ二段構えの設計。
- `docs/development/runtime/NUMERIC_ABI.md` … IntArrayCore/MatI64 など numeric ABI の関数契約。
- `docs/development/runtime/system-hakorune-subset.md` … Ring1/System Hakorune サブセットの範囲と責務。
- `docs/development/runtime/ENV_VARS.md``NYASH_AOT_NUMERIC_CORE` など Phase 25 関連の環境変数。
## ゴール