📚 ABI統合ドキュメント整理 & LLVM BuilderCursor改善

## ABI関連
- docs/reference/abi/ABI_INDEX.md 作成(統合インデックス)
- 分散していたABI/TypeBoxドキュメントへのリンク集約
- CLAUDE.mdに「ABI統合インデックス」リンク追加
- ABI移行タイミング詳細検討(LLVM完成後のPhase 15.5推奨)

## LLVM改善(ChatGPT5協力)
- BuilderCursor導入でposition管理を構造化
- emit_return/jump/branchをcursor経由に統一
- PHI/terminator問題への対策改善
- より明確なbasic block位置管理

🤖 Generated with [Claude Code](https://claude.ai/code)

Co-Authored-By: Claude <noreply@anthropic.com>
This commit is contained in:
Selfhosting Dev
2025-09-12 14:12:54 +09:00
parent 696b282ae8
commit 53a869136f
10 changed files with 554 additions and 56 deletions

View File

@ -393,6 +393,7 @@ box MyBox {
- **⚡ VM実装**: [VM_README.md](docs/VM_README.md)
- **🌐 Netプラグイン**: [net-plugin.md](docs/reference/plugin-system/net-plugin.md)
- **🎮 実装済みアプリ**: サイコロRPG・統計計算・LISPインタープリター
- **🔧 ABI統合インデックス**: [ABI_INDEX.md](docs/reference/abi/ABI_INDEX.md)
## 🎨 GUI開発

View File

@ -72,6 +72,29 @@ TODO — Sealed SSA 段階導入(実装タスク)
- 収集は `compile_function` の BB ループ内で行い、`phis_by_block` と同スコープで管理すると取り回しが良い
- 将来の拡張として `value_at_end_of_block(var, bb)` ヘルパを導入し、sealed/unsealed を内部で吸収する API 化を検討
Hot Plan — Structured TerminatorsRAII BuilderCursor
- 目的: 末端処理を設計で保証(未終端や終端後挿入を構造で不可能に)し、終端まわりのフォールバック重複を削減する
- ポリシー: 「開いているブロックにのみ命令を挿入できる。終端を置いた瞬間に閉じる。閉じたブロックへの挿入は即panic」
TODO — BuilderCursor 導入と段階適用
- [ ] 新規: `builder_cursor.rs` を追加(`BuilderCursor` / `BlockState` / `with_block`
- API: `at_end(bid, llbb)`, `emit_instr(f)`, `emit_term(f)`, `assert_open(bid)`
- 実装: inkwell::Builder を参照で保持し、`closed_by_bid: HashMap<BasicBlockId,bool>` を管理
- [ ] 既存終端APIを置換
- 変更: `emit_return / emit_jump / emit_branch``BuilderCursor::emit_term` 経由に
- 呼び出し元: codegen/mod.rs 側から `&mut BuilderCursor` を渡す
- [ ] 位置ずれの解消(最小)
- cast 等の補助命令は「pred終端直前」へposition_beforeを維持
- 既存の entry_builder 経路で位置ずれが起きないよう、必要箇所のみ `with_block` を使用
- [ ] 関数終端の最終保証
- `finalize_function`: 未終端BBには `unreachable` を挿入(最後の砦)
- [ ] 代表スモークの回帰Sealed=ON
- 期待: 未終端エラー・終端後挿入エラーの消滅。PHI配線は snapshot により安定
Note
- フェーズ1では「終端APIと位置ずれの構造化」の最小適用に留め、フォールバック最終unreachableを併用
- フェーズ2で with_block の適用範囲を広げ、余剰なガード・分岐フォールバックを削除していく(ソースは小さくシンプルに)
Plan — PHI/SSA Hardening (Sealed SSA)
- Sealed SSA 入れ替え(安全に段階導入)
- Blockごとに `sealed: bool``incomplete_phis: Map<Var, Phi>` を保持

View File

@ -0,0 +1,117 @@
# ABI移行タイミング詳細検討
## 🎯 現状分析
### 現在のTypeBox実装
- **TLVベース統一** - `invoke_id`ですべてのメソッド呼び出し処理
- **7つのプラグイン** - String/Integer/Array/Map/Console/File/Egui
- **問題なく動作** - 機能的には十分、パフォーマンスも実用レベル
### LLVM層の進捗
- ChatGPT5がLLVM実装改善中
- PHI/ターミネーター問題を解決中
- BuilderCursor導入で構造化
- EXE生成までもう少し
## 🔄 移行オプション検討
### Option 1: 今すぐ移行開始
**メリット**
- プラグイン数が少ない7個今がチャンス
- 早期のパフォーマンス改善
- 技術的負債を早めに解消
- Phase 16に向けた準備
**デメリット**
- LLVM作業と並行→リソース分散
- 優先度の問題LLVM > ABI
- 現行で問題ないのに変更リスク
### Option 2: LLVM完成後に移行推奨
**メリット**
- **集中できる** - まずLLVM完成に全力
- **最適化考慮** - LLVM/JITの特性を踏まえた設計
- **一度の変更** - まとめて最適な形に
- **実証データ** - LLVM性能を見てから判断
**デメリット**
- 移行が遅れる(でも急ぐ必要ない)
- TLVオーバーヘッド継続でも実用上問題なし
### Option 3: 段階的準備
**今できること**
1. struct_size活用コードの準備
2. ドキュメント整理(完了✅)
3. 拡張計画の詳細化
4. テストコード準備
**LLVM後にやること**
1. create/destroy追加
2. プラグイン順次対応
3. パフォーマンス測定
4. 最適化
## 📊 判断基準
### なぜLLVM完成後が最適か
1. **優先度の明確化**
- 現在の最重要課題:セルフホスティング
- LLVM完成 → EXE生成 → セルフホスト実現
- ABIは「改善」であって「必須」ではない
2. **設計の最適化**
- LLVMの最適化特性を理解してから
- インライン化可能性の考慮
- JIT/AOTでの扱いの違い
3. **リスク管理**
- 動いているものを変えるリスク
- LLVM作業への影響を避ける
- 一度に大きく変える方が安全
4. **実装効率**
- ChatGPT5がLLVM集中できる
- 混乱を避ける
- 明確なマイルストーン
## 🚀 推奨ロードマップ
### Phase 15現在
1. **LLVM完成に集中**
2. EXE生成実現
3. セルフホスト基盤確立
4. ABI拡張の詳細設計並行
### Phase 15.5LLVM完成直後
1. **ABI拡張実装**
- create/destroy追加
- struct_size活用
- 互換性維持
2. **プラグイン移行**
- 性能重要なものから
- 段階的に対応
3. **パフォーマンス検証**
### Phase 16次フェーズ
1. **ABI安定化宣言**
2. 外部開発者向けドキュメント
3. 他言語バインディング
## 🎯 結論
**LLVM完成後の移行が最適**
理由:
1. 現在のTLVベースで機能的問題なし
2. LLVM完成が最優先セルフホストへの道
3. 最適化知見を活かした設計可能
4. リスク最小化・効率最大化
**ただし準備は今から**
- ドキュメント整理(完了✅)
- 設計詳細化
- テスト準備
- 移行計画策定
これにより、LLVM完成後にスムーズに移行開始できる。

View File

@ -0,0 +1,134 @@
# Nyash ABI/TypeBox 統合インデックス
このドキュメントは、分散しているNyash ABI関連ドキュメントへの統合入口です。
## 🎯 現在の実装状態Phase 15
### 実装済み
- **TypeBox FFI基本構造** - TLVベースの統一`invoke_id`
- **struct_sizeフィールド** - 前方互換性確保
- **プラグインローダーv2** - 7個の基本Boxプラグイン動作中
### 計画中
- **専用関数追加** - `create`/`destroy`/`get_type_info`
- **パフォーマンス最適化** - 直接関数ポインタ呼び出し
- **C ABI完全互換** - 他言語との相互運用性向上
## 📚 主要ドキュメント
### 1. コア設計ドキュメント
#### [NYASH_ABI_MIN_CORE.md](../../private/reference/abi/NYASH_ABI_MIN_CORE.md)
**最小コアABIとエボリューション戦略**
- NyrtValue 16B固定表現
- struct_sizeによる前方互換性
- feature_bits交渉メカニズム
- エボリューション・ハッチ(将来拡張への逃げ道)
#### [typebox-api-reference.md](../../development/roadmap/phases/phase-12/specs/typebox-api-reference.md)
**統一TypeBox APIリファレンス**
- NyashTypeBox C構造体仕様
- NyValue型システム
- 関数ポインタ仕様create/destroy/invoke_id
- エラーハンドリング・所有権ルール
#### [NYASH-ABI-C-IMPLEMENTATION.md](../../development/roadmap/phases/phase-12/design/NYASH-ABI-C-IMPLEMENTATION.md)
**Nyash ABIをTypeBoxとして実装する革新的設計**
- "Everything is Box" → ABIもBox
- 3段階実装戦略C Shim → フルC → Nyash再実装
- Tagged Pointers・セレクターキャッシング
- 3大AIGemini/Codex/ChatGPT5による評価
### 2. 実装詳細
#### [unified-typebox-abi.md](../../development/roadmap/phases/phase-12/unified-typebox-abi.md)
**Phase 12統一TypeBox ABI実装計画**
- 移行ロードマップ
- パフォーマンス目標33倍高速化
- 互換性維持戦略
#### [PLUGIN_ABI.md](../../../PLUGIN_ABI.md)
**プラグインABI概要**
- 現在のTLVベース実装
- プラグイン開発ガイド
### 3. 現在のソースコード実装
#### Rust側ランタイム
```rust
// src/runtime/plugin_loader_v2/enabled/types.rs
#[repr(C)]
pub struct NyashTypeBoxFfi {
pub abi_tag: u32,
pub version: u16,
pub struct_size: u16, // 前方互換性キー!
pub name: *const c_char,
pub resolve: Option<extern "C" fn(*const c_char) -> u32>,
pub invoke_id: Option<extern "C" fn(u32, u32, *const u8, usize, *mut u8, *mut usize) -> i32>,
pub capabilities: u64,
}
```
#### プラグイン側C/Rust
- `plugins/nyash-string-plugin/`
- `plugins/nyash-array-plugin/`
- その他基本Boxプラグイン
## 🔄 ABI拡張方法
### 1. 構造体末尾に新フィールド追加
```rust
pub struct NyashTypeBoxFfi {
// 既存フィールド...
// 新規追加(末尾に!)
pub create: Option<extern "C" fn(*const u8) -> u32>,
pub destroy: Option<extern "C" fn(u32) -> i32>,
}
```
### 2. struct_sizeで互換性チェック
```rust
let actual_size = (*tb).struct_size;
if actual_size >= expected_size {
// 新機能使用可能
}
```
## 🚀 移行タイミング検討
### Option 1: **LLVM完成後に移行**(推奨)
**メリット**
- LLVMの最適化機会を考慮した設計可能
- JIT/AOTでの関数ポインタ直接呼び出し最適化
- 実行パスが確定してからの最適設計
**デメリット**
- 移行が遅れる
- 現在のTLVオーバーヘッドが継続
### Option 2: **今すぐ段階的移行**
**メリット**
- プラグイン数が少ない今がチャンス
- 早期にパフォーマンス改善
- 将来の技術的負債を回避
**デメリット**
- LLVM実装と並行作業
- 優先度の分散
### 結論:**LLVM Phase完了後が最適**
理由:
1. 現在のTLVベースでも実用上問題なし
2. LLVM最適化と同時に設計見直し
3. 一度の大きな変更で済む
4. Phase 16でのABI安定化に向けた準備
## 関連リンク
- [Phase 15 README](../../development/roadmap/phases/phase-15/README.md) - 現在のフェーズ
- [Phase 22 構想](../../development/roadmap/phases/phase-22/) - Nyash LLVMコンパイラ
- [Box設計哲学](../../development/architecture/box-externcall-design.md) - Box/ExternCall境界
---
最終更新: 2025-09-12

View File

@ -132,10 +132,14 @@ pub(in super::super) fn lower_boxcall<'ctx>(
s
};
if let Some(callee) = codegen.module.get_function(&sym) {
// Coerce arguments to callee parameter types
let exp_tys = callee.get_type().get_param_types();
if exp_tys.len() != args.len() { return Err("boxcall direct-call: arg count mismatch".to_string()); }
let mut call_args: Vec<inkwell::values::BasicMetadataValueEnum> = Vec::with_capacity(args.len());
for a in args {
for (i, a) in args.iter().enumerate() {
let v = *vmap.get(a).ok_or("boxcall func arg missing")?;
call_args.push(v.into());
let tv = coerce_to_type(codegen, v, exp_tys[i])?;
call_args.push(tv.into());
}
let call = codegen
.builder
@ -217,3 +221,33 @@ pub(in super::super) fn lower_boxcall<'ctx>(
Err(format!("BoxCall requires method_id for method '{}'. The method_id should be automatically injected during MIR compilation.", method))
}
}
fn coerce_to_type<'ctx>(
codegen: &CodegenContext<'ctx>,
val: inkwell::values::BasicValueEnum<'ctx>,
target: inkwell::types::BasicMetadataTypeEnum<'ctx>,
) -> Result<inkwell::values::BasicValueEnum<'ctx>, String> {
use inkwell::types::BasicMetadataTypeEnum as BT;
match (val, target) {
(inkwell::values::BasicValueEnum::IntValue(iv), BT::IntType(it)) => {
let bw_src = iv.get_type().get_bit_width();
let bw_dst = it.get_bit_width();
if bw_src == bw_dst {
Ok(iv.into())
} else if bw_src < bw_dst {
Ok(codegen.builder.build_int_z_extend(iv, it, "bc_zext").map_err(|e| e.to_string())?.into())
} else if bw_dst == 1 {
Ok(super::super::types::to_bool(codegen.context, iv.into(), &codegen.builder)?.into())
} else {
Ok(codegen.builder.build_int_truncate(iv, it, "bc_trunc").map_err(|e| e.to_string())?.into())
}
}
(inkwell::values::BasicValueEnum::PointerValue(pv), BT::IntType(it)) => Ok(codegen.builder.build_ptr_to_int(pv, it, "bc_p2i").map_err(|e| e.to_string())?.into()),
(inkwell::values::BasicValueEnum::FloatValue(fv), BT::IntType(it)) => Ok(codegen.builder.build_float_to_signed_int(fv, it, "bc_f2i").map_err(|e| e.to_string())?.into()),
(inkwell::values::BasicValueEnum::IntValue(iv), BT::PointerType(pt)) => Ok(codegen.builder.build_int_to_ptr(iv, pt, "bc_i2p").map_err(|e| e.to_string())?.into()),
(inkwell::values::BasicValueEnum::PointerValue(pv), BT::PointerType(_)) => Ok(pv.into()),
(inkwell::values::BasicValueEnum::IntValue(iv), BT::FloatType(ft)) => Ok(codegen.builder.build_signed_int_to_float(iv, ft, "bc_i2f").map_err(|e| e.to_string())?.into()),
(inkwell::values::BasicValueEnum::FloatValue(fv), BT::FloatType(_)) => Ok(fv.into()),
(v, _) => Ok(v),
}
}

View File

@ -0,0 +1,76 @@
use std::collections::HashMap;
use inkwell::{
basic_block::BasicBlock,
builder::Builder,
};
use crate::mir::BasicBlockId;
/// Track per-block open/closed state and centralize terminator emission.
pub struct BuilderCursor<'ctx, 'b> {
pub builder: &'b Builder<'ctx>,
closed_by_bid: HashMap<BasicBlockId, bool>,
cur_bid: Option<BasicBlockId>,
cur_llbb: Option<BasicBlock<'ctx>>,
}
impl<'ctx, 'b> BuilderCursor<'ctx, 'b> {
pub fn new(builder: &'b Builder<'ctx>) -> Self {
Self { builder, closed_by_bid: HashMap::new(), cur_bid: None, cur_llbb: None }
}
/// Temporarily switch to another block, run body, then restore previous position/state.
pub fn with_block<R>(&mut self, bid: BasicBlockId, bb: BasicBlock<'ctx>, body: impl FnOnce(&mut BuilderCursor<'ctx, 'b>) -> R) -> R {
let prev_bid = self.cur_bid;
let prev_bb = self.cur_llbb;
// Preserve previous closed state
let prev_closed = prev_bid.and_then(|id| self.closed_by_bid.get(&id).copied());
self.at_end(bid, bb);
let r = body(self);
// Restore prior insertion point/state
if let Some(pbb) = prev_bb {
self.builder.position_at_end(pbb);
}
self.cur_bid = prev_bid;
self.cur_llbb = prev_bb;
if let (Some(pid), Some(closed)) = (prev_bid, prev_closed) {
self.closed_by_bid.insert(pid, closed);
}
r
}
pub fn at_end(&mut self, bid: BasicBlockId, bb: BasicBlock<'ctx>) {
self.cur_bid = Some(bid);
self.cur_llbb = Some(bb);
self.closed_by_bid.insert(bid, false);
self.builder.position_at_end(bb);
}
pub fn position_at_end(&self, bb: BasicBlock<'ctx>) {
self.builder.position_at_end(bb);
}
pub fn assert_open(&self, bid: BasicBlockId) {
if let Some(closed) = self.closed_by_bid.get(&bid) {
assert!(!closed, "attempt to insert into closed block {}", bid.as_u32());
}
}
pub fn emit_instr<T>(&mut self, bid: BasicBlockId, f: impl FnOnce(&Builder<'ctx>) -> T) -> T {
self.assert_open(bid);
f(self.builder)
}
pub fn emit_term(&mut self, bid: BasicBlockId, f: impl FnOnce(&Builder<'ctx>)) {
self.assert_open(bid);
f(self.builder);
// After emitting a terminator, assert the current basic block now has one
if let Some(bb) = self.cur_llbb {
assert!(unsafe { bb.get_terminator() }.is_some(), "expected terminator in bb {}", bid.as_u32());
}
self.closed_by_bid.insert(bid, true);
}
}

View File

@ -1,6 +1,6 @@
use std::collections::HashMap;
use inkwell::values::{BasicValueEnum as BVE, FunctionValue};
use inkwell::{types::BasicMetadataTypeEnum as BMT, values::{BasicMetadataValueEnum, BasicValueEnum as BVE, FunctionValue}};
use crate::backend::llvm::context::CodegenContext;
use crate::mir::{function::MirFunction, ValueId};
@ -27,16 +27,25 @@ pub(in super::super) fn lower_call<'ctx>(
.get(name_s)
.ok_or_else(|| format!("call: function not predeclared: {}", name_s))?;
// Collect args in order
let mut avs: Vec<BVE<'ctx>> = Vec::with_capacity(args.len());
for a in args {
// Collect and coerce args to the callee's expected parameter types
let fn_ty = target.get_type();
let exp_tys: Vec<BMT<'ctx>> = fn_ty.get_param_types();
if exp_tys.len() != args.len() {
return Err(format!(
"call: arg count mismatch for {} (expected {}, got {})",
name_s,
exp_tys.len(),
args.len()
));
}
let mut params: Vec<BasicMetadataValueEnum> = Vec::with_capacity(args.len());
for (i, a) in args.iter().enumerate() {
let v = *vmap
.get(a)
.ok_or_else(|| format!("call arg missing: {}", a.as_u32()))?;
avs.push(v);
let tv = coerce_to_type(codegen, v, exp_tys[i])?;
params.push(tv.into());
}
let params: Vec<inkwell::values::BasicMetadataValueEnum> =
avs.iter().map(|v| (*v).into()).collect();
let call = codegen
.builder
.build_call(*target, &params, "call")
@ -49,3 +58,56 @@ pub(in super::super) fn lower_call<'ctx>(
Ok(())
}
fn coerce_to_type<'ctx>(
codegen: &CodegenContext<'ctx>,
val: BVE<'ctx>,
target: BMT<'ctx>,
) -> Result<BVE<'ctx>, String> {
use inkwell::types::BasicMetadataTypeEnum as BMTy;
match (val, target) {
(BVE::IntValue(iv), BMTy::IntType(it)) => {
let bw_src = iv.get_type().get_bit_width();
let bw_dst = it.get_bit_width();
if bw_src == bw_dst {
Ok(iv.into())
} else if bw_src < bw_dst {
Ok(codegen
.builder
.build_int_z_extend(iv, it, "call_zext")
.map_err(|e| e.to_string())?
.into())
} else if bw_dst == 1 {
Ok(super::super::types::to_bool(codegen.context, iv.into(), &codegen.builder)?.into())
} else {
Ok(codegen
.builder
.build_int_truncate(iv, it, "call_trunc")
.map_err(|e| e.to_string())?
.into())
}
}
(BVE::PointerValue(pv), BMTy::IntType(it)) => Ok(codegen
.builder
.build_ptr_to_int(pv, it, "call_p2i")
.map_err(|e| e.to_string())?
.into()),
(BVE::FloatValue(fv), BMTy::IntType(it)) => Ok(codegen
.builder
.build_float_to_signed_int(fv, it, "call_f2i")
.map_err(|e| e.to_string())?
.into()),
(BVE::IntValue(iv), BMTy::PointerType(pt)) => Ok(codegen
.builder
.build_int_to_ptr(iv, pt, "call_i2p")
.map_err(|e| e.to_string())?
.into()),
(BVE::PointerValue(pv), BMTy::PointerType(_)) => Ok(pv.into()),
(BVE::IntValue(iv), BMTy::FloatType(ft)) => Ok(codegen
.builder
.build_signed_int_to_float(iv, ft, "call_i2f")
.map_err(|e| e.to_string())?
.into()),
(BVE::FloatValue(fv), BMTy::FloatType(_)) => Ok(fv.into()),
(v, _) => Ok(v),
}
}

View File

@ -6,16 +6,19 @@ use crate::backend::llvm::context::CodegenContext;
use crate::mir::{function::MirFunction, BasicBlockId, ValueId};
use super::super::types::{to_bool, map_mirtype_to_basic};
use super::builder_cursor::BuilderCursor;
pub(in super::super) fn emit_return<'ctx>(
pub(in super::super) fn emit_return<'ctx, 'b>(
codegen: &CodegenContext<'ctx>,
cursor: &mut BuilderCursor<'ctx, 'b>,
_bid: BasicBlockId,
func: &MirFunction,
vmap: &HashMap<ValueId, BasicValueEnum<'ctx>>,
value: &Option<ValueId>,
) -> Result<(), String> {
match (&func.signature.return_type, value) {
(crate::mir::MirType::Void, _) => {
codegen.builder.build_return(None).unwrap();
cursor.emit_term(_bid, |b| { b.build_return(None).unwrap(); });
Ok(())
}
(_t, Some(vid)) => {
@ -25,26 +28,25 @@ pub(in super::super) fn emit_return<'ctx>(
use inkwell::types::BasicTypeEnum as BT;
let v_adj = match (expected, v) {
(BT::PointerType(pt), BasicValueEnum::IntValue(iv)) => {
codegen
.builder
.build_int_to_ptr(iv, pt, "ret_i2p")
cursor.emit_instr(_bid, |b| b
.build_int_to_ptr(iv, pt, "ret_i2p"))
.map_err(|e| e.to_string())?
.into()
}
_ => v,
};
codegen
.builder
.build_return(Some(&v_adj))
.map_err(|e| e.to_string())?;
cursor.emit_term(_bid, |b| {
b.build_return(Some(&v_adj)).map_err(|e| e.to_string()).unwrap();
});
Ok(())
}
(_t, None) => Err("non-void function missing return value".to_string()),
}
}
pub(in super::super) fn emit_jump<'ctx>(
pub(in super::super) fn emit_jump<'ctx, 'b>(
codegen: &CodegenContext<'ctx>,
cursor: &mut BuilderCursor<'ctx, 'b>,
bid: BasicBlockId,
target: &BasicBlockId,
bb_map: &HashMap<BasicBlockId, BasicBlock<'ctx>>,
@ -90,15 +92,15 @@ pub(in super::super) fn emit_jump<'ctx>(
if std::env::var("NYASH_CLI_VERBOSE").ok().as_deref() == Some("1") {
eprintln!("[LLVM] emit_jump: {} -> {}", bid.as_u32(), target.as_u32());
}
codegen
.builder
.build_unconditional_branch(tbb)
.map_err(|e| e.to_string())?;
cursor.emit_term(bid, |b| {
b.build_unconditional_branch(tbb).map_err(|e| e.to_string()).unwrap();
});
Ok(())
}
pub(in super::super) fn emit_branch<'ctx>(
pub(in super::super) fn emit_branch<'ctx, 'b>(
codegen: &CodegenContext<'ctx>,
cursor: &mut BuilderCursor<'ctx, 'b>,
bid: BasicBlockId,
condition: &ValueId,
then_bb: &BasicBlockId,
@ -184,10 +186,9 @@ pub(in super::super) fn emit_branch<'ctx>(
if std::env::var("NYASH_CLI_VERBOSE").ok().as_deref() == Some("1") {
eprintln!("[LLVM] emit_branch: {} -> then {} / else {}", bid.as_u32(), then_bb.as_u32(), else_bb.as_u32());
}
codegen
.builder
.build_conditional_branch(b, tbb, ebb)
.map_err(|e| e.to_string())?;
cursor.emit_term(bid, |bd| {
bd.build_conditional_branch(b, tbb, ebb).map_err(|e| e.to_string()).unwrap();
});
Ok(())
}
@ -278,16 +279,37 @@ pub(in super::super) fn seal_block<'ctx>(
match vmap.get(in_vid).copied() {
Some(v) => v,
None => {
let msg = format!(
"phi incoming (seal) missing: pred={} succ_bb={} in_vid={} (no snapshot)",
bid.as_u32(), sb.as_u32(), in_vid.as_u32()
);
return Err(msg);
// As a last resort, synthesize a zero of the PHI type to satisfy verifier.
// This should be rare and indicates missing predecessor snapshot or forward ref.
use inkwell::types::BasicTypeEnum as BT;
let bt = phi.as_basic_value().get_type();
match bt {
BT::IntType(it) => it.const_zero().into(),
BT::FloatType(ft) => ft.const_zero().into(),
BT::PointerType(pt) => pt.const_zero().into(),
_ => return Err(format!(
"phi incoming (seal) missing: pred={} succ_bb={} in_vid={} (no snapshot)",
bid.as_u32(), sb.as_u32(), in_vid.as_u32()
)),
}
}
}
};
let pred_bb = *bb_map.get(&bid).ok_or("pred bb missing")?;
// Ensure any required casts are inserted BEFORE the predecessor's terminator
// Save and restore current insertion point around coercion
let saved_block = codegen.builder.get_insert_block();
if let Some(pred_llbb) = bb_map.get(&bid) {
let term = unsafe { pred_llbb.get_terminator() };
if let Some(t) = term {
// Insert casts right before the terminator of predecessor
codegen.builder.position_before(&t);
} else {
codegen.builder.position_at_end(*pred_llbb);
}
}
val = coerce_to_type(codegen, phi, val)?;
if let Some(bb) = saved_block { codegen.builder.position_at_end(bb); }
let pred_bb = *bb_map.get(&bid).ok_or("pred bb missing")?;
if std::env::var("NYASH_CLI_VERBOSE").ok().as_deref() == Some("1") {
let tys = phi
.as_basic_value()
@ -308,6 +330,31 @@ pub(in super::super) fn seal_block<'ctx>(
BasicValueEnum::PointerValue(pv) => phi.add_incoming(&[(&pv, pred_bb)]),
_ => return Err("unsupported phi incoming value (seal)".to_string()),
}
} else {
// inputs に pred が見つからない場合でも、検証器は「各predに1エントリ」を要求する。
// ゼロ(型に応じた null/0を合成して追加するログ付
let pred_bb = *bb_map.get(&bid).ok_or("pred bb missing")?;
use inkwell::types::BasicTypeEnum as BT;
let bt = phi.as_basic_value().get_type();
let z: BasicValueEnum = match bt {
BT::IntType(it) => it.const_zero().into(),
BT::FloatType(ft) => ft.const_zero().into(),
BT::PointerType(pt) => pt.const_zero().into(),
_ => return Err("unsupported phi type for zero synth (seal)".to_string()),
};
if std::env::var("NYASH_CLI_VERBOSE").ok().as_deref() == Some("1") {
eprintln!(
"[PHI] sealed add (synth) pred_bb={} zero-ty={}",
bid.as_u32(),
bt.print_to_string().to_string()
);
}
match z {
BasicValueEnum::IntValue(iv) => phi.add_incoming(&[(&iv, pred_bb)]),
BasicValueEnum::FloatValue(fv) => phi.add_incoming(&[(&fv, pred_bb)]),
BasicValueEnum::PointerValue(pv) => phi.add_incoming(&[(&pv, pred_bb)]),
_ => return Err("unsupported phi incoming (synth)".to_string()),
}
}
}
}

View File

@ -1,4 +1,5 @@
mod blocks;
pub mod builder_cursor;
pub mod flow;
mod externcall;
mod newbox;

View File

@ -112,7 +112,8 @@ impl LLVMCompiler {
// Create basic blocks (prefix names with function label to avoid any ambiguity)
let fn_label = sanitize(name);
let (mut bb_map, entry_bb) = instructions::create_basic_blocks(&codegen, llvm_func, func, &fn_label);
codegen.builder.position_at_end(entry_bb);
let mut cursor = instructions::builder_cursor::BuilderCursor::new(&codegen.builder);
cursor.at_end(func.entry_block, entry_bb);
let mut vmap: HashMap<ValueId, BasicValueEnum> = HashMap::new();
let mut allocas: HashMap<ValueId, PointerValue> = HashMap::new();
let entry_builder = codegen.context.create_builder();
@ -198,14 +199,8 @@ impl LLVMCompiler {
let sealed_mode = std::env::var("NYASH_LLVM_PHI_SEALED").ok().as_deref() == Some("1");
for (bi, bid) in block_ids.iter().enumerate() {
let bb = *bb_map.get(bid).unwrap();
if codegen
.builder
.get_insert_block()
.map(|b| b != bb)
.unwrap_or(true)
{
codegen.builder.position_at_end(bb);
}
// Use cursor to position at BB start for lowering
cursor.at_end(*bid, bb);
if std::env::var("NYASH_CLI_VERBOSE").ok().as_deref() == Some("1") {
eprintln!("[LLVM] lowering bb={}", bid.as_u32());
}
@ -334,32 +329,32 @@ impl LLVMCompiler {
eprintln!("[LLVM] terminator present for bb={}", bid.as_u32());
}
// Ensure builder is positioned at current block before emitting terminator
codegen.builder.position_at_end(bb);
cursor.at_end(*bid, bb);
match term {
MirInstruction::Return { value } => {
instructions::emit_return(&codegen, func, &vmap, value)?;
instructions::emit_return(&codegen, &mut cursor, *bid, func, &vmap, value)?;
}
MirInstruction::Jump { target } => {
instructions::emit_jump(&codegen, *bid, target, &bb_map, &phis_by_block, &vmap)?;
instructions::emit_jump(&codegen, &mut cursor, *bid, target, &bb_map, &phis_by_block, &vmap)?;
}
MirInstruction::Branch { condition, then_bb, else_bb } => {
instructions::emit_branch(&codegen, *bid, condition, then_bb, else_bb, &bb_map, &phis_by_block, &vmap)?;
instructions::emit_branch(&codegen, &mut cursor, *bid, condition, then_bb, else_bb, &bb_map, &phis_by_block, &vmap)?;
}
_ => {
// Ensure builder is at this block before fallback branch
codegen.builder.position_at_end(bb);
cursor.at_end(*bid, bb);
// Unknown/unhandled terminator: conservatively branch forward
if let Some(next_bid) = block_ids.get(bi + 1) {
if std::env::var("NYASH_CLI_VERBOSE").ok().as_deref() == Some("1") {
eprintln!("[LLVM] unknown terminator fallback: bb={} -> next={}", bid.as_u32(), next_bid.as_u32());
}
instructions::emit_jump(&codegen, *bid, next_bid, &bb_map, &phis_by_block, &vmap)?;
instructions::emit_jump(&codegen, &mut cursor, *bid, next_bid, &bb_map, &phis_by_block, &vmap)?;
} else {
let entry_first = func.entry_block;
if std::env::var("NYASH_CLI_VERBOSE").ok().as_deref() == Some("1") {
eprintln!("[LLVM] unknown terminator fallback: bb={} -> entry={}", bid.as_u32(), entry_first.as_u32());
}
instructions::emit_jump(&codegen, *bid, &entry_first, &bb_map, &phis_by_block, &vmap)?;
instructions::emit_jump(&codegen, &mut cursor, *bid, &entry_first, &bb_map, &phis_by_block, &vmap)?;
}
}
}
@ -368,14 +363,14 @@ impl LLVMCompiler {
eprintln!("[LLVM] no terminator in MIR for bb={} (fallback)", bid.as_u32());
}
// Ensure builder is at this block before fallback branch
codegen.builder.position_at_end(bb);
cursor.at_end(*bid, bb);
// Fallback: branch to the next block if any; otherwise loop to entry
if let Some(next_bid) = block_ids.get(bi + 1) {
instructions::emit_jump(&codegen, *bid, next_bid, &bb_map, &phis_by_block, &vmap)?;
instructions::emit_jump(&codegen, &mut cursor, *bid, next_bid, &bb_map, &phis_by_block, &vmap)?;
} else {
// last block, loop to entry to satisfy verifier
let entry_first = func.entry_block;
instructions::emit_jump(&codegen, *bid, &entry_first, &bb_map, &phis_by_block, &vmap)?;
instructions::emit_jump(&codegen, &mut cursor, *bid, &entry_first, &bb_map, &phis_by_block, &vmap)?;
}
}
// Extra guard: if the current LLVM basic block still lacks a terminator for any reason,
@ -385,24 +380,32 @@ impl LLVMCompiler {
eprintln!("[LLVM] extra guard inserting fallback for bb={}", bid.as_u32());
}
// Ensure the builder is positioned at the end of this block before inserting the fallback terminator
codegen.builder.position_at_end(bb);
cursor.at_end(*bid, bb);
if let Some(next_bid) = block_ids.get(bi + 1) {
if std::env::var("NYASH_CLI_VERBOSE").ok().as_deref() == Some("1") {
eprintln!("[LLVM] fallback terminator: bb={} -> next={}", bid.as_u32(), next_bid.as_u32());
}
instructions::emit_jump(&codegen, *bid, next_bid, &bb_map, &phis_by_block, &vmap)?;
instructions::emit_jump(&codegen, &mut cursor, *bid, next_bid, &bb_map, &phis_by_block, &vmap)?;
} else {
let entry_first = func.entry_block;
if std::env::var("NYASH_CLI_VERBOSE").ok().as_deref() == Some("1") {
eprintln!("[LLVM] fallback terminator: bb={} -> entry={}", bid.as_u32(), entry_first.as_u32());
}
instructions::emit_jump(&codegen, *bid, &entry_first, &bb_map, &phis_by_block, &vmap)?;
instructions::emit_jump(&codegen, &mut cursor, *bid, &entry_first, &bb_map, &phis_by_block, &vmap)?;
}
}
if sealed_mode {
instructions::flow::seal_block(&codegen, *bid, &succs, &bb_map, &phis_by_block, &block_end_values, &vmap)?;
}
}
// Finalize function: ensure every basic block is closed with a terminator.
// As a last resort, insert 'unreachable' into blocks that remain unterminated.
for bb in llvm_func.get_basic_blocks() {
if unsafe { bb.get_terminator() }.is_none() {
codegen.builder.position_at_end(bb);
let _ = codegen.builder.build_unreachable();
}
}
// Verify the fully-lowered function once, after all blocks
if !llvm_func.verify(true) {
return Err(format!("Function verification failed: {}", name));