Files
hakorune/docs/research/paper-11-compiler-knows-nothing
Moe Charm 11506cee3b Phase 11-12: LLVM backend initial, semantics layer, plugin unification
Major changes:
- LLVM backend initial implementation (compiler.rs, llvm mode)
- Semantics layer integration in interpreter (operators.rs)
- Phase 12 plugin architecture revision (3-layer system)
- Builtin box removal preparation
- MIR instruction set documentation (26→Core-15 migration)
- Cross-backend testing infrastructure
- Await/nowait syntax support

New features:
- LLVM AOT compilation support (--backend llvm)
- Semantics layer for interpreter→VM flow
- Tri-backend smoke tests
- Plugin-only registry mode

Bug fixes:
- Interpreter plugin box arithmetic operations
- Branch test returns incorrect values

Documentation:
- Phase 12 README.md updated with new plugin architecture
- Removed obsolete NYIR proposals
- Added LLVM test programs documentation

Co-Authored-By: Claude <noreply@anthropic.com>
2025-09-01 23:44:34 +09:00
..

Paper 11: コンパイラは世界を知らないPluginInvoke一元化と"フォールバック廃止"の実践

Status: Planning
Target: Systems/Engineering Conference (OSDI/SOSP/ASPLOS)
Lead Author: Nyash Team

📋 論文概要

タイトル

The Compiler Knows Nothing: PluginInvoke Unification and the Practice of "No Fallback" Policy

中心的主張

  • コンパイラからドメイン知識を完全排除し、全てをPluginInvokeに一元化
  • フォールバック全廃により複雑性爆発を回避し、保守性を最大化
  • 対応表1枚mir→vm→jitで全ての拡張を管理可能に

主要貢献

  1. 設計原則:「コンパイラは世界を知らない」哲学の体系化
  2. 実装手法:フォールバック廃止による複雑性制御
  3. 運用知見:プラグインエコシステムの実践的構築法

🔧 実証データ計画

フォールバック削減の定量化

削減前Phase 9:
- 型名分岐: 47箇所
- 特殊処理: 23箇所
- フォールバック: 15箇所

削減後Phase 10.11:
- 型名分岐: 0箇所
- 特殊処理: 0箇所
- フォールバック: 0箇所

保守性メトリクス

コード変更影響範囲:
- 新Box追加時の変更行数: 0行プラグインのみ
- 新機能追加時の変更行数: 0行プラグインのみ
- コンパイラ本体の安定性: 100%(変更不要)

プラグイン統合実績

統合成功例:
- Python統合: 2日eval/import/getattr/call
- ファイルI/O: 1日
- ネットワーク: 1日
- 数学関数: 0.5日

📊 実践的証明

型名分岐の回避例Before/After

Beforeアンチパターン:

match box_type {
    "StringBox" => self.emit_string_length(),
    "ArrayBox" => self.emit_array_length(),
    "FileBox" => self.emit_file_size(),
    // 新しいBoxごとに分岐追加... 😱
}

AfterPluginInvoke一元化:

self.emit_plugin_invoke(type_id, method_id, args)
// 新しいBox追加時もコード変更不要 🎉

CI/CDによる品質保証

禁止パターンCI:
- 型名文字列による分岐
- ビルトイン特殊処理
- フォールバック実装

必須テスト:
- trace_hash等価性VM/JIT/AOT
- プラグイン境界テスト
- ABI互換性チェック

🏗️ アーキテクチャ設計

対応表による一元管理

MIR → VM → JIT/AOT マッピング:
┌─────────────┬────────────────┬─────────────────┐
│ MIR命令     │ VM実装         │ JIT/AOT実装     │
├─────────────┼────────────────┼─────────────────┤
│ PluginInvoke│ plugin_invoke()│ emit_plugin_call│
└─────────────┴────────────────┴─────────────────┘
1行で全てを表現

ABI v0の設計

最小限のFFI契約:
- invoke(type_id, method_id, args) → TLV
- 引数: TLVエンコード
- 戻り値: TLVエンコード
- エラー: Result<TLV, String>

📝 論文構成(予定)

1. Introduction2ページ

  • 問題:言語実装の複雑性爆発
  • 解決:ドメイン知識のプラグイン分離
  • 影響:保守性と拡張性の両立

2. Design Philosophy3ページ

  • 「コンパイラは世界を知らない」原則
  • フォールバック廃止の必要性
  • プラグイン境界の設計

3. Implementation4ページ

  • PluginInvoke一元化の実装
  • 型名分岐の除去プロセス
  • CI/CDによる品質維持

4. Case Studies3ページ

  • Python統合複雑な例
  • FileBoxI/O例
  • NetworkBox非同期例

5. Evaluation3ページ

  • 保守性の定量評価
  • 性能オーバーヘッド分析
  • 開発効率の改善

6. Lessons Learned2ページ

  • 成功要因の分析
  • 失敗と回避策
  • ベストプラクティス
  • プラグインアーキテクチャ
  • 言語拡張機構
  • モジュラーコンパイラ

8. Conclusion1ページ

🎯 執筆スケジュール

  • Week 1: 実装データ収集・整理
  • Week 2: Philosophy + Implementation執筆
  • Week 3: Case Studies執筆
  • Week 4: Evaluation + Lessons執筆
  • Week 5: 推敲・コード例整備

💡 期待される影響

学術的影響

  • コンパイラ設計の新しいパラダイム
  • 複雑性管理の体系的手法
  • プラグインエコシステムの理論

実務的影響

  • 言語実装のベストプラクティス集
  • 保守可能な言語の作り方
  • 拡張可能なアーキテクチャ設計

🔥 実例LLVM統合の地獄からCranelift採用へ2025-09-01追記

LLVM統合で直面した問題

問題1: バージョン地獄
- llvm-sys v180.0.0 → LLVM 18.0.x要求
- 実際のLLVM: 18.1.3WSL、18.1.6vcpkg
- 環境変数LLVM_SYS_180_STRICT_VERSIONING=0も効果なし

問題2: Windows環境の複雑性
- 環境変数が伝わらないWSL→cmd.exe境界
- 文字化けによるバッチファイル実行失敗
- vcpkgでのLLVMビルドに数時間...

問題3: ユーザー体験の悪夢
- LLVMインストールだけで1日
- バージョン確認で混乱
- 環境変数設定で挫折

Cranelift採用という解決策

利点:
- Rust製で統合が簡単Cargo.tomlに追加のみ
- バイナリサイズ: LLVM 100MB+ → Cranelift 5-10MB
- ビルド時間: 数時間 → 数分
- 環境依存: 複雑 → ゼロ

ユーザー体験の改善:
Before: LLVM地獄環境構築で1日以上
After: cargo install nyash5分で完了

戦略的転換LLVMからCraneliftへ2025-09-01

経緯

  1. LLVM統合を試みる → バージョン地獄、ビルド困難、巨大サイズ
  2. ユーザー体験の危機を認識 → 「これではユーザーが使えない」
  3. 既存のCranelift実装に立ち返る → Phase 10.7で既に実装済み!
# LLVM: 100MB+、環境構築地獄、ビルド数時間
# ↓ 戦略的転換
# Cranelift: 5-10MB、Rust native、ビルド数分

cargo build --release --features cranelift-jit -j24
./target/release/nyash --backend cranelift apps/tests/mir-const-add/main.nyash
# 結果: "Cranelift JIT execution completed (skeleton)!"

教訓:コンパイラは環境も知らない

  • 外部依存LLVM= 制御不能な複雑性
  • 「大きい・難しい」に気づいたら既存の軽量案を再評価
  • Cranelift重視への転換 = 正しい判断

📚 参考文献(予定)

  • The Cathedral and the Bazaar (ESR)
  • Design Patterns (GoF)
  • Clean Architecture (Robert C. Martin)
  • LLVM: A Compilation Framework for Lifelong Program Analysis
  • The Art of Unix Programming