refactor(joinir): Phase 193-1 - AST Feature Extractor Box modularization

**Phase 193-1**: Create independent AST Feature Extractor Box module

## Summary
Extracted feature detection logic from router.rs into a new, reusable
ast_feature_extractor.rs module. This improves:
- **Modularity**: Feature extraction is now a pure, side-effect-free module
- **Reusability**: Can be used for Pattern 5-6 detection and analysis tools
- **Testability**: Pure functions can be unit tested independently
- **Maintainability**: Clear separation of concerns (router does dispatch, extractor does analysis)

## Changes

### New Files
- **src/mir/builder/control_flow/joinir/patterns/ast_feature_extractor.rs** (+180 lines)
  - `detect_continue_in_body()`: Detect continue statements
  - `detect_break_in_body()`: Detect break statements
  - `extract_features()`: Full feature extraction pipeline
  - `detect_if_else_phi_in_body()`: Pattern detection for if-else PHI
  - `count_carriers_in_body()`: Heuristic carrier counting
  - Unit tests for basic functionality

### Modified Files
- **src/mir/builder/control_flow/joinir/patterns/router.rs**
  - Removed 75 lines of feature detection code
  - Now delegates to `ast_features::` module
  - Phase 193 documentation in comments
  - Cleaner separation of concerns

- **src/mir/builder/control_flow/joinir/patterns/mod.rs**
  - Added module declaration for ast_feature_extractor
  - Updated documentation with Phase 193 info

## Architecture
```
router.rs (10 lines)
  └─→ ast_feature_extractor.rs (180 lines)
      - Pure functions for AST analysis
      - No side effects
      - High reusability
      - Testable in isolation
```

## Testing
 Build succeeds: `cargo build --release` compiles cleanly
 Binary compatibility: Existing .hako files execute correctly
 No logic changes: Feature detection identical to previous implementation

## Metrics
- Lines moved from router to new module: 75
- New module total: 180 lines (including tests and documentation)
- Router.rs reduced by ~40% in feature detection code
- New module rated  for reusability and independence

## Next Steps
- Phase 193-2: CarrierInfo Builder Enhancement
- Phase 193-3: Pattern Classification Improvement
- Phase 194: Further pattern detection optimizations

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
This commit is contained in:
nyash-codex
2025-12-06 03:30:03 +09:00
parent 60bd5487e6
commit d28ba4cd9d
15 changed files with 992 additions and 344 deletions

View File

@ -0,0 +1,16 @@
# Troubleshooting Guides
このディレクトリには、Nyash/Hakorune を使うときに遭遇しがちなトラブルと、その対処方法をまとめたガイドを置いているよ。
## 現在のガイド
- `stage3-local-keyword-guide.md`
- Stage3 キーワード(特に `local`)を使用するときに必要な環境変数と、エラー発生時の診断方法。
- `using-resolution.md`
- `using` 解決まわりのエラーモジュール未解決、arity mismatch など)の原因と対処法。
## 置き場所のルール(提案)
- 開発者やユーザーが「実際にハマった時にすぐ読みたい」内容は、`docs/development/` ではなくここ(`guides/troubleshooting/`)に置く。
- フェーズ固有の一時メモは `docs/development/issues/` に置き、広く役立つノウハウになったらこちらに昇格させる、という二段構えにする。

View File

@ -0,0 +1,173 @@
# Stage-3 Local Keyword Troubleshooting Guide
## Problem Description
When using Stage-B (self-hosted) code that contains `local` keyword, you may encounter:
```
❌ MIR compilation error: Undefined variable: local
```
## Root Cause
The `local` keyword is a **Stage-3 keyword** that requires explicit enablement via environment variables. Without these ENV variables:
1. The tokenizer downgrades `local` from `TokenType::LOCAL` to `TokenType::IDENTIFIER`
2. The MIR builder then treats it as an undefined variable
## Quick Fix
### For AotPrep Verification (Recommended)
Use the provided script which automatically sets all required ENV variables:
```bash
tools/hakorune_emit_mir.sh input.hako output.json
```
This script automatically enables:
- `NYASH_PARSER_STAGE3=1`
- `HAKO_PARSER_STAGE3=1`
- `NYASH_PARSER_ALLOW_SEMICOLON=1`
### For Manual Execution
```bash
NYASH_PARSER_STAGE3=1 \
HAKO_PARSER_STAGE3=1 \
NYASH_PARSER_ALLOW_SEMICOLON=1 \
./target/release/hakorune --backend vm your_file.hako
```
### For AotPrep with CollectionsHot
```bash
NYASH_SKIP_TOML_ENV=1 \
NYASH_DISABLE_PLUGINS=1 \
HAKO_APPLY_AOT_PREP=1 \
NYASH_AOT_COLLECTIONS_HOT=1 \
NYASH_LLVM_FAST=1 \
NYASH_MIR_LOOP_HOIST=1 \
NYASH_JSON_ONLY=1 \
tools/hakorune_emit_mir.sh input.hako output.json
```
## Diagnostic Tools
### 1. Improved Error Message (New!)
When you forget to enable Stage-3, you'll now see:
```
❌ MIR compilation error: Undefined variable: local
Hint: 'local' is a Stage-3 keyword. Enable NYASH_PARSER_STAGE3=1 (and HAKO_PARSER_STAGE3=1 for Stage-B).
For AotPrep verification, use tools/hakorune_emit_mir.sh which sets these automatically.
```
### 2. Tokenizer Trace
To see exactly when keywords are being downgraded:
```bash
NYASH_TOK_TRACE=1 ./target/release/hakorune --backend vm your_file.hako
```
Output example:
```
[tok-stage3] Degrading LOCAL to IDENTIFIER (NYASH_PARSER_STAGE3=false)
```
## Stage-3 Keywords
The following keywords require `NYASH_PARSER_STAGE3=1`:
- `local` - Local variable declaration
- `flow` - Flow control (reserved)
- `try` - Exception handling
- `catch` - Exception handling
- `throw` - Exception handling
- `while` - Loop construct
- `for` - Loop construct
- `in` - Loop/iteration operator
## Code Changes Made
### 1. Builder Error Message Enhancement
**File**: `src/mir/builder.rs:382-406`
Added Stage-3 keyword detection with helpful hints when `parser_stage3()` is disabled.
### 2. Documentation Update
**File**: `lang/src/llvm_ir/boxes/aot_prep/README.md`
Added "Stage-3 キーワード要件" section explaining:
- Why Stage-3 ENV variables are needed for AotPrep
- Recommended usage of `tools/hakorune_emit_mir.sh`
- Manual ENV variable requirements
- Diagnostic options
## Related Issues
### CollectionsHot lastIndexOf Error
If you see:
```
❌ VM error: Invalid instruction: lastIndexOf expects 1 arg(s), got 2
```
This is a **separate issue** from Stage-3 keywords. The CollectionsHot pass uses a two-argument `lastIndexOf(needle, start_pos)` which is not yet implemented in the VM's StringBox.
**Workaround**: Disable CollectionsHot until the VM implementation is updated:
```bash
# Omit NYASH_AOT_COLLECTIONS_HOT=1
tools/hakorune_emit_mir.sh input.hako output.json
```
## Testing
### Test 1: Error Message Without ENV
```bash
cat > /tmp/test.hako << 'EOF'
static box Main {
method main(args) {
local x
x = 42
return 0
}
}
EOF
env -u NYASH_PARSER_STAGE3 -u HAKO_PARSER_STAGE3 \
./target/release/hakorune --backend vm /tmp/test.hako
```
Expected: Error message with Stage-3 hint
### Test 2: Success With ENV
```bash
NYASH_PARSER_STAGE3=1 HAKO_PARSER_STAGE3=1 NYASH_PARSER_ALLOW_SEMICOLON=1 \
./target/release/hakorune --backend vm /tmp/test.hako
```
Expected: Program executes successfully
### Test 3: Tokenizer Trace
```bash
NYASH_TOK_TRACE=1 env -u NYASH_PARSER_STAGE3 \
./target/release/hakorune --backend vm /tmp/test.hako 2>&1 | grep tok-stage3
```
Expected: `[tok-stage3] Degrading LOCAL to IDENTIFIER (NYASH_PARSER_STAGE3=false)`
## References
- **Tokenizer Stage-3 Gate**: `src/tokenizer/lex_ident.rs:69-89`
- **Parser Stage-3 Check**: `src/config/env.rs:495-504`
- **Builder Error Generation**: `src/mir/builder.rs:382-406`
- **AotPrep Documentation**: `lang/src/llvm_ir/boxes/aot_prep/README.md`
- **Emit MIR Script**: `tools/hakorune_emit_mir.sh`
## Summary
**Stage-3 keyword error resolved** - Improved error messages guide users to the fix
**Documentation updated** - AotPrep README now explains Stage-3 requirements
**Diagnostic tools available** - `NYASH_TOK_TRACE=1` for tokenizer debugging
**Recommended workflow** - Use `tools/hakorune_emit_mir.sh` for hassle-free execution
The original issue was environmental configuration, not a bug in CollectionsHot itself. Once Stage-3 ENV variables are properly set, Stage-B code compiles and executes correctly.

View File

@ -0,0 +1,253 @@
# Using 解決トラブルシューティング
**作成日**: 2025-11-22
**対象**: Phase 21.7++ NamingBox SSOT 統一化後のトラブルシューティング
---
## エラーパターン別対処法
### 1. `[using] Module not found: 'ModuleName'`
**原因**:
- nyash.toml に alias が定義されていない
- TOML parse エラーで alias が読み込めていない
- タイポ(モジュール名の綴り間違い)
**対処法**:
1. **TOML ファイルを確認**
```bash
cat nyash.toml | grep "ModuleName"
```
2. **TOML parse エラーを確認**
- Phase 0 で実装した即座表示機能により、TOML エラーは起動時に表示されます
- エラーメッセージに修正方法が含まれています
3. **詳細ログで確認**
```bash
NYASH_DEBUG_USING=1 ./target/release/nyash program.hako
```
4. **"Did you mean?" 提案を確認**
- Phase 0.3 で実装された機能により、類似モジュール名が自動提案されます
- 提案に正しい綴りが含まれているか確認
**修正例**:
```toml
# nyash.toml
[using.aliases]
StringUtils = "lang/src/shared/common/string_helpers.hako" # ← 追加
```
---
### 2. `Function not found: Box.method/N`
**原因**:
- arity引数の数が一致していない
- 関数名の綴り間違い
- 関数が定義されていない
**対処法**:
1. **"Did you mean?" 提案を確認**
- Phase 0.2 で実装された機能により、類似関数名が自動提案されます
```
Function not found: StringUtils.starts_with/1
💡 Did you mean:
- StringUtils.starts_with/2
- StringUtils.starts_with/3
```
2. **デバッグログで詳細確認**
```bash
NYASH_DEBUG_FUNCTION_LOOKUP=1 ./target/release/nyash program.hako
```
出力例:
```
[DEBUG/vm] Looking up function: 'StringUtils.starts_with'
[DEBUG/vm] Parsed: box='StringUtils', method='starts_with', arity=None
[DEBUG/vm] canonical: 'StringUtils.starts_with/2'
[DEBUG/vm] ✅ 'StringUtils.starts_with/2' found
```
3. **arity を確認**
- 関数定義と呼び出しの引数の数が一致しているか確認
- Phase 2 で実装された自動補完により、arity なし呼び出しは自動補完されます
**修正例**:
```nyash
// 誤: arity が一致しない
StringUtils.starts_with("hello") // arity 1 → "starts_with/1" を探す
// 正: arity が一致
StringUtils.starts_with("hello", "he") // arity 2 → "starts_with/2" を探す
```
---
### 3. `VM Runtime Error: arity mismatch`
**原因**:
- MIR Builder 側と VM 側で arity の扱いが不一致
- methodization で receiver が二重に追加された
- static box method で receiver が誤って追加された
**対処法**:
1. **Methodization トレースログを確認**
```bash
NYASH_METHODIZE_TRACE=1 ./target/release/nyash program.hako
```
出力例:
```
[methodize] Global(Calculator.add/2) → Method{Calculator.add, recv=%5}
```
2. **StaticMethodId パース結果を確認**
- Phase 2/3 で実装された構造化表現により、パース結果が明示的に表示されます
3. **Methodization を無効化して確認**
```bash
HAKO_MIR_BUILDER_METHODIZE=0 ./target/release/nyash program.hako
```
**Phase 21.7++ での修正**:
- Phase 3 で known.rs と unified_emitter.rs の receiver 追加ロジックを修正済み
- static box method では receiver を追加しないようガード実装済み
---
### 4. Silent Failureエラーが表示されない
**原因**:
- Phase 0 以前のバージョンを使用している
- エラーメッセージが stderr に出力されているが見逃している
**対処法**:
1. **Phase 0 実装済みか確認**
```bash
git log --oneline | grep "Phase 0"
```
Phase 0 commit (63012932) 以降であれば、Silent Failure は根絶されています
2. **詳細診断モードで実行**
```bash
NYASH_CLI_VERBOSE=1 ./target/release/nyash program.hako 2>&1 | tee debug.log
```
3. **すべてのデバッグフラグを有効化**
```bash
NYASH_DEBUG_FUNCTION_LOOKUP=1 \
NYASH_DEBUG_USING=1 \
NYASH_METHODIZE_TRACE=1 \
NYASH_CLI_VERBOSE=1 \
./target/release/nyash program.hako
```
**Phase 21.7++ での修正**:
- ✅ TOML parse エラー即座表示pipeline.rs
- ✅ 関数ルックアップ「Did you mean?」提案global.rs
- ✅ using not found 詳細化strip.rs
---
## デバッグフローチャート
```
エラー発生
1. エラーメッセージを確認
├─ "Did you mean?" 提案あり → 提案に従う
├─ "Module not found" → nyash.toml 確認
└─ "Function not found" → 以下へ
2. デバッグログ有効化
NYASH_DEBUG_FUNCTION_LOOKUP=1 実行
3. パース結果を確認
box/method/arity が正しいか確認
4. 関数定義を確認
定義されている関数名と arity を確認
5. Methodization を確認
NYASH_METHODIZE_TRACE=1 で変換ログ確認
6. それでも解決しない場合
- Issue 報告GitHub
- チームに相談
```
---
## よくある質問
### Q1: `StringUtils.starts_with` は動くが `StringUtils.starts_with/2` で呼ぶとエラーになる
**A1**: Phase 2 実装により、arity なし呼び出しは自動補完されます。明示的に arity を指定する必要はありません。
```nyash
// ✅ 推奨: arity なし(自動補完)
StringUtils.starts_with("hello", "he")
// ✅ 動作するが冗長
// MIR レベルでは "StringUtils.starts_with/2" になる
```
### Q2: `main._nop/0` が `Main._nop/0` に normalize される理由は?
**A2**: NamingBox の canonical_box_name() により、`main` → `Main` に正規化されますsrc/mir/naming.rs:22-27
これは static box 名の一貫性を保つための仕様です。
### Q3: Methodization ON/OFF でどう動作が変わる?
**A3**:
**Methodization OFF** (HAKO_MIR_BUILDER_METHODIZE=0):
```
Global("Calculator.add/2") → VM が Global 関数として実行
```
**Methodization ON** (既定):
```
Global("Calculator.add/2")
→ NewBox(Calculator) → Method{Calculator.add, recv=singleton}
→ VM が Method として実行
```
どちらも最終的な動作は同じですが、MIR の表現が異なります。
### Q4: Phase 21.7++ で何が変わった?
**A4**: 主な変更点:
| 項目 | Phase 0-3 前 | Phase 0-3 後 |
|------|-------------|-------------|
| エラー表示 | Silent Failure 多数 | 即座表示 + 提案 |
| 名前パース | ad-hoc素手 split | SSOTStaticMethodId |
| arity 補完 | Hotfix文字列操作 | 正式実装(構造化) |
| デバッグ | 難しい | 環境変数で詳細表示 |
---
## 関連ドキュメント
- **Phase 21.7 README**: [docs/private/roadmap2/phases/phase-21.7-normalization/README.md](../roadmap/phases/phase-21.7-normalization/README.md)
- **Phase 21.7++ チェックリスト**: [docs/development/current/main/phase-21.7-naming-ssot-checklist.md](../current/main/phase-21.7-naming-ssot-checklist.md)
- **NamingBox 実装**: [src/mir/naming.rs](../../src/mir/naming.rs)
- **StaticMethodId テスト**: [src/tests/namingbox_static_method_id.rs](../../src/tests/namingbox_static_method_id.rs)
---
## 更新履歴
- 2025-11-22: Phase 21.7++ Phase 4 完了時に作成