Files
hakorune/docs/development/roadmap/phases/phase-25.1c/README.md

88 lines
8.1 KiB
Markdown
Raw Normal View History

# Phase 25.1c — Env / Extern / BoxIntrospect Structural Cleanup
Status: planning構造整理フェーズ・挙動は変えない
## ゴール
- `env.*` / `hostbridge.*` / `env.box_introspect.*` の責務と経路を整理し、型システムまわりの「正しい入口」を 1 箇所に揃える。
- Box 型情報 API`env.box_introspect.kind` + `BoxTypeInspectorBox`)を **コア型システム**として扱えるようにするplugins の有無に依存しない)。
- i64 / MapBox / ArrayBox の unwrap ロジックを SSOT に寄せ、MirBuilder / JsonEmit / LoopOpts / BoxHelpers が同じ前提で動くようにする。
## スコープ(何をここで扱うか)
- 対象:
- Rust 側: `extern_registry.rs` / `handlers/externals.rs` / `handlers/extern_provider.rs` / `runtime/plugin_loader_v2/*`
- Hako 側: `BoxTypeInspectorBox` / `BoxHelpers` / `JsonEmitBox` / `MirSchemaBox` / `LoopOptsBox`
- ドキュメント: `docs/specs`env externs / box_introspect / numeric view の設計メモ)
- 非対象:
- 新しい言語機能や VM 命令の追加Phase 25 ポリシーに従い、仕様拡張はしない)。
- MirBuilder の意味論変更multicarrier や LoopForm の設計は Phase 25.1b の範囲に留める)。
## やりたい整理(タスクリスト)
1. **env.* extern の SSOT を決める**
- `env.get` / `env.mirbuilder.emit` / `env.codegen.emit_object` / `env.codegen.link_object` / `env.box_introspect.kind` を一覧化し、仕様引数・戻り値・MIR 形)を `docs/specs/env_externs.md`(仮)に明文化する。
- JSON v0 → MIR ブリッジ(`MapVars::resolve` / loweringで、上記が必ず `ExternCall("env.*", ..)` に落ちることを確認・修正する。
2. **hostbridge.extern_invoke を「互換レイヤ」に押し込める**
- 方針: 「`env.*` で表現できるものは ExternCall を正義とし、`hostbridge.extern_invoke` は互換用ラッパに限定する」。
- Hako 側: `hostbridge.extern_invoke("env.*", ..)` は内部で `env.*` を呼ぶだけにする(新規コードは直接 `env.*` を使う)。
- Rust 側: `"hostbridge.extern_invoke"` の実装は、`extern_provider_dispatch("env.*", ..)` に委譲する薄いブリッジに整理する。
3. **BoxIntrospect をコア型システムに昇格させる**
- `env.box_introspect.kind` の実装を plugin loader v2 直下ではなく、コア runtime例: `runtime/box_introspect.rs`)に寄せる。
- コア型MapBox / ArrayBox / StringBox / IntegerBox / BoolBox / NullBoxは runtime 側で `build_box_info` を定義し、plugin loader は「ユーザー Box の拡張」だけを担当する。
- `BoxTypeInspectorBox``env.box_introspect.kind(value)` を唯一の情報源として扱い、repr ベースの fallback は「plugins も env.* も使えないデバッグ環境のみ」で使うことをコメントで明示する。
4. **Numeric viewi64 unwrapの SSOT 化**
- Hako 側: `string_helpers` / `BoxHelpers` / `MirSchemaBox` / `JsonEmitBox` / `LoopOptsBox` に散っている i64 unwrap ロジックを、小さなユーティリティ(仮: `box_numeric_view.hako`)に寄せる。
- Rust 側: `NyashBox` から i64 を取り出す `as_i64` 的な関数を 1 箇所に置き、extern / BoxIntrospect 経路からはそれを使う。
5. **StageB Main を箱に分割して SSA/デバッグを軽くする**
- 現状の `compiler_stageb.hako: Main.main` は:
- CLI 引数パース (`--source` / `--bundle-*` / `--require-mod`)
- bundle/require 解決 (`BundleResolver`)
- body 抽出 (`body_src` の抽出ロジック)
- ParserBox 呼び出し (`parse_program2` → emit JSON)
- defs スキャン (`FuncScannerBox.scan_all_boxes`)
が 1 関数に詰め込まれており、MIR 上でも巨大な `Main.main` になっている。
feat(mir/phi): improve LoopForm parameter detection - track param names **Problem**: is_parameter() was too simple, checking only ValueId which changes through copies/PHIs. This caused parameters like 'data' to be misclassified as carriers, leading to incorrect PHI construction. **Solution**: Track original parameter names at function entry. **Changes**: 1. **Added function_param_names field** (builder.rs): - HashSet<String> to track original parameter names - Populated in lower_static_method_as_function() - Cleared and repopulated for each new function 2. **Improved is_parameter()** (loop_builder.rs): - Check name against function_param_names instead of ValueId - More reliable than checking func.params (ValueIds change) - __pin$*$@* variables correctly classified as carriers - Added debug logging with NYASH_LOOPFORM_DEBUG 3. **Enhanced debug output** (loopform_builder.rs): - Show carrier/pinned classification during prepare_structure() - Show variable_map state after emit_header_phis() **Test Results**: - ✅ 'args' correctly identified as parameter (was working) - ✅ 'data' now correctly identified as parameter (was broken) - ✅ __pin variables correctly classified as carriers - ✅ PHI values allocated and variable_map updated correctly - ⚠️ ValueId undefined errors persist (separate issue) **Remaining Issue**: ValueId(10) undefined error suggests PHI visibility problem or VM verification issue. Needs further investigation of emit_phi_at_block_start() or VM executor. **Backward Compatibility**: - Flag OFF: 100% existing behavior preserved (legacy path unchanged) - Feature-flagged with NYASH_LOOPFORM_PHI_V2=1 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-17 05:24:07 +09:00
- 25.1c ではこれを「箱理論」に沿って分割する方針を立てており、Phase 25.1c 冒頭でまず StageB 側を 4 箱構造にリファクタした:
- `Main`(エントリ薄箱): `main(args){ return StageBDriverBox.main(args) }` のみを担当。
- `StageBDriverBox`(オーケストレーション): `StageBArgsBox.resolve_src``StageBBodyExtractorBox.build_body_src``ParserBox.parse_program2` → defs 挿入 → `print(ast_json)` だけを見る。
- `StageBArgsBox`CLI 引数と bundle/require の扱いだけを担当): もともとの「args/src/src_file/HAKO_SOURCE_FILE_CONTENT/return 0」ロジックを完全移動。
- `StageBBodyExtractorBox``body_src` 抽出ロジックbundle/using/trim を担当): もともとの `body_src` 抽出〜コメント削除〜BundleResolver/Stage1UsingResolverBox〜前後 trim までを丸ごとカプセル化。
- いずれもロジックはそのまま移動であり、コメント・using・ログを含めて挙動は完全に不変同じ Program(JSON v0)、同じログ、同じ `VM error: Invalid value`)であることを selfhost CLI サンプルで確認済み。エラーの発生箇所は `Main.main` から `StageBArgsBox.resolve_src/1` に関数名だけ変わっており、SSA/Loop 側の根本修正はこの後のタスクLoopBuilder / LocalSSA 整理)で扱う。
6. **LoopBuilder / pin スロットの型付け・箱化**
- いまの LoopBuilder は `__pin$*$@recv` のような文字列ベースの「内部変数名」を `variable_map` に直接突っ込んで、SSA/phi/pin を管理している。
- 25.1c では、Loop 状態を「箱」として切り出して型付けする:
- 例: `LoopStateBox`Rust 側構造体)に
- `recv_slots`Method receiver 用)
- `index_slots`(ループカウンタ用)
- `limit_slots`limit/上限 expr 用)
を明示的に持たせる。
- `LoopBuilder::emit_phi_at_block_start` / `update_variable` は、この LoopStateBox を通じてのみ pin/phi を操作し、「recv に Null/未定義が混ざらない」ことを構造レベルで保証する。
7. **ビルダー観測用の専用レイヤ(デバッグ箱)**
- すでに `NYASH_BUILDER_TRACE_RECV` / `NYASH_BUILDER_DEBUG` などで ad-hoc に eprintln を入れているが、出力箇所が複数ファイルに散っていて再利用しにくい。
- 25.1c ではこれを `builder.observe` 的なモジュール(箱)に集約する:
- 例: `observe::recv::log(fn, bb, name, src, dst)``observe::phi::log(fn, bb, dst, inputs)` など。
- ポリシー:
- すべて dev トグルNYASH_BUILDER_TRACE_*)越しに呼ぶ。
- 本番挙動は変えず、「どこをどうトレースできるか」を構造として明示する。
8. **StageB 向けの極小 MIR 再現ハーネス**
- `docs/private/roadmap/phases/phase-20.33/DEBUG.md` にあるような StageB 向けメモを踏まえ、StageB/MirBuilder 用の「極小 Hako → MIR テスト」を 1 つ用意する。
- 例:
- 100〜200 行程度の `.hako``lang/src/compiler/tests/stageb_min_sample.hako` のようなファイルに固定。
- Rust 側で MirBuilder に直接その AST を食わせて MIR を生成し、`NYASH_VM_VERIFY_MIR=1` で「Undefined value」が出ないことを確認するユニットスモークを足す構造バグ検知用
- これにより、StageB/LoopBuilder に関する修正が `.hako` 本番コード全体に依存せず、小さな再現ケースで検証できるようにする。
## 進め方メモ
- 先にドキュメントを書くenv extern / BoxIntrospect / numeric view の仕様を `docs/specs` 配下に整理)→ そのあとで Bridge / VM / Hako を小さく揃える。
- 既存フェーズとの関係:
- Phase 25.1b: selfhost builder / multicarrier / BoxTypeInspector 実装フェーズ(機能側)。
- Phase 25.1c: そのうち「env.* / hostbridge.* / BoxIntrospect」に加えて、StageB Main / LoopBuilder / builder 観測レイヤの構造と責務も整理するメタフェーズ(構造側)。
- 挙動を変えないことFailFast / default path は現状維持)を前提に、小さな差分で進める。