=== 実装内容 === 1. v3 backend 詳細計測 - ENV: HAKMEM_SO_V3_STATS で alloc/free パス内訳計測 - 追加 stats: alloc_current_hit, alloc_partial_hit, free_current, free_partial, free_retire - so_alloc_fast / so_free_fast に埋め込み - デストラクタで [ALLOC_DETAIL] / [FREE_DETAIL] 出力 2. v3 backend ボトルネック分析完了 - C7-only: alloc_current_hit=99.99%, alloc_refill=0.9%, free_retire=0.1%, page_of_fail=0 - Mixed: alloc_current_hit=100%, alloc_refill=0.85%, free_retire=0.07%, page_of_fail=0 - 結論: v3 ロジック部分(ページ選択・retire)は完全最適化済み - 残り 5% overhead は内部コスト(header write, memcpy, 分岐) 3. Tiny/ULTRA 層「完成世代」宣言 - 総括ドキュメント作成: docs/analysis/PERF_EXEC_SUMMARY_ULTRA_PHASE_20251211.md - CURRENT_TASK.md に Phase ULTRA 総括セクション追加 - AGENTS.md に Tiny/ULTRA 完成世代宣言追加 - 最終成果: Mixed 16–1024B = 43.9M ops/s (baseline 30.6M → +43.5%) === ボトルネック地図 === | 層 | 関数 | overhead | |-----|------|----------| | Front | malloc/free dispatcher | ~40–45% | | ULTRA | C4–C7 alloc/free/refill | ~12% | | v3 backend | so_alloc/so_free | ~5% | | mid/pool | hak_super_lookup | 3–5% | === フェーズ履歴(Phase ULTRA cycle) === - Phase PERF-ULTRA-FREE-OPT-1: C4–C7 ULTRA統合 → +9.3% - Phase REFACTOR: Code quality (60行削減) - Phase PERF-ULTRA-REFILL-OPT-1a/1b: C7 ULTRA refill最適化 → +11.1% - Phase SO-BACKEND-OPT-1: v3 backend分解 → 設計限界確認 === 次フェーズ(独立ライン) === 1. Phase SO-BACKEND-OPT-2: v3 header write削減 (1-2%) 2. Headerless/v6系: out-of-band header (1-2%) 3. mid/pool v3新設計: C6-heavy 10M → 20–25M 本フェーズでTiny/ULTRA層は「完成世代」として基盤固定。 今後の大きい変更はHeaderless/mid系の独立ラインで検討。 🤖 Generated with Claude Code Co-Authored-By: Claude Haiku 4.5 <noreply@anthropic.com>
Docs Overview
このフォルダは hakmem の設計・計測・運用メモを体系化して管理する場所です。
- INDEX.md: 目次(各ドキュメントへのリンク)
- benchmarks/: ベンチマーク手順とスイープ結果の保存先
- specs/: 現在の仕様(SACS‑3/HW/ENV)を集約
- roadmap/: これからの実装計画・優先度・タスク
運用ルール(提案)
- 1つの変更/計測のまとまりにつき1ファイル(or 1フォルダ)
- 再現コマンド・環境変数・ハード構成は必ず記載
- 大きな連続出力はファイルへ保存し、本文からは抜粋/要約を記載