# ENV Profile Presets (HAKMEM) よく使う構成を 3 つのプリセットにまとめました。まずここからコピペし、必要な ENV だけを追加してください。v2 系や LEGACY 専用オプションは明示 opt-in で扱います。 ベンチバイナリでは `HAKMEM_PROFILE=<名前>` をセットすると、ここで定義した ENV を自動で注入します(既に設定済みの ENV は上書きしません)。 --- ## Profile 1: MIXED_TINYV3_C7_SAFE(標準 Mixed 16–1024B) ### 目的 - Mixed 16–1024B の標準ベンチ用。 - C7-only SmallObject v3 + Tiny front v3 + LUT + fast classify ON。 - v4 系(C6/C7 v4、fast classify v4、small segment v4)はすべて OFF。 - Tiny/Pool v2 もすべて OFF。 - C6 は凍結中(Tiny/SmallObject の特別扱いなし)。mid/pool の通常経路に任せる。 ### ENV 最小セット(Release) ```sh # プリセットでまとめて指定 HAKMEM_PROFILE=MIXED_TINYV3_C7_SAFE # Mixed 16–1024B 前提のサイズ範囲(必要に応じて明示) HAKMEM_BENCH_MIN_SIZE=16 HAKMEM_BENCH_MAX_SIZE=1024 ``` プリセットで自動設定される主な ENV: - `HAKMEM_TINY_HEAP_PROFILE=C7_SAFE` - `HAKMEM_TINY_C7_HOT=1` - `HAKMEM_TINY_HOTHEAP_V2=0` - `HAKMEM_SMALL_HEAP_V3_ENABLED=1` - `HAKMEM_SMALL_HEAP_V3_CLASSES=0x80`(C7-only v3) - `HAKMEM_SMALL_HEAP_V4_ENABLED=0` / `HAKMEM_SMALL_HEAP_V4_CLASSES=0x0` - `HAKMEM_TINY_PTR_FAST_CLASSIFY_ENABLED=1` - `HAKMEM_TINY_PTR_FAST_CLASSIFY_V4_ENABLED=0` - `HAKMEM_SMALL_SEGMENT_V4_ENABLED=0` - `HAKMEM_POOL_V2_ENABLED=0` - `HAKMEM_TINY_FRONT_V3_ENABLED=1` - `HAKMEM_TINY_FRONT_V3_LUT_ENABLED=1` ### 任意オプション - stats を見たいとき: ```sh HAKMEM_TINY_HEAP_STATS=1 HAKMEM_TINY_HEAP_STATS_DUMP=1 HAKMEM_SMALL_HEAP_V3_STATS=1 ``` - v2 系は触らない(C7_SAFE では Pool v2 / Tiny v2 は常時 OFF)。 - FREE_POLICY/THP を触る実験例(現在の HEAD では必須ではなく、組み合わせによっては微マイナスになる場合もある): ```sh HAKMEM_FREE_POLICY=keep HAKMEM_DISABLE_BATCH=1 HAKMEM_SS_MADVISE_STRICT=0 # or HAKMEM_FREE_POLICY=batch HAKMEM_THP=auto ``` - 参考(v4 研究箱の現状): - C7/C6 v4 + fast classify v4 ON(v3 OFF, segment OFF): **≈32.0–32.5M ops/s**(MIXED 1M/ws=400, Release)。 - C7-only v4(C6 v1、v3 OFF): **≈33.0M ops/s**。 - 現状は v3 構成が最速のため、標準プロファイルでは v4 系をすべて OFF に固定。 --- ## Profile 2: C6_HEAVY_LEGACY_POOLV1(mid/smallmid C6-heavy ベンチ) ### 目的 - C6-heavy mid/smallmid のベンチ用。 - C6 は v1 固定(C6 v3/v4/ULTRA は研究箱のみ)。Pool v2 OFF。Pool v1 flatten は bench 用に opt-in。 ### ENV(v1 基準線) ```sh HAKMEM_BENCH_MIN_SIZE=257 HAKMEM_BENCH_MAX_SIZE=768 HAKMEM_TINY_HEAP_PROFILE=C7_SAFE HAKMEM_TINY_C6_HOT=0 HAKMEM_TINY_HOTHEAP_V2=0 HAKMEM_SMALL_HEAP_V3_ENABLED=1 HAKMEM_SMALL_HEAP_V3_CLASSES=0x80 # C7-only v3, C6 v3 は OFF HAKMEM_POOL_V2_ENABLED=0 HAKMEM_POOL_V1_FLATTEN_ENABLED=0 # flatten は初回 OFF ``` - mid_desc_lookup TLS キャッシュを試すときだけ: `HAKMEM_MID_DESC_CACHE_ENABLED=1` を上乗せ(デフォルトは OFF)。 ### Pool v1 flatten A/B 用(LEGACY 専用) ```sh # LEGACY + flatten ON (研究/bench専用) HAKMEM_TINY_HEAP_PROFILE=LEGACY HAKMEM_POOL_V2_ENABLED=0 HAKMEM_POOL_V1_FLATTEN_ENABLED=1 HAKMEM_POOL_V1_FLATTEN_STATS=1 ``` ## Profile 2b: C6_HEAVY_LEGACY_POOLV1_FLATTEN(mid/smallmid LEGACY flatten ベンチ専用) ### 目的 - LEGACY プロファイルで mid/smallmid の flatten + header-only zero をまとめて opt-in するベンチ専用セット。 - C7_SAFE では使わないこと(安定性優先のため C7_SAFE は flatten 常時 OFF)。 ### ENV(ベンチ専用) ```sh HAKMEM_PROFILE=C6_HEAVY_LEGACY_POOLV1 # base を流用 HAKMEM_POOL_V1_FLATTEN_ENABLED=1 HAKMEM_POOL_ZERO_MODE=header HAKMEM_POOL_V1_FLATTEN_STATS=1 ``` ※ LEGACY 専用。C7_SAFE / C7_ULTRA_BENCH ではこのプリセットを使用しないこと。 - flatten は LEGACY 専用。C7_SAFE / C7_ULTRA_BENCH ではコード側で強制 OFF になる前提。 ### C6 研究用プリセット(標準ラインには影響させない) - C6 v3 研究(Tiny/SmallObject に C6 を載せるときだけ) ```sh HAKMEM_PROFILE=C6_SMALL_HEAP_V3_EXPERIMENT HAKMEM_BENCH_MIN_SIZE=257 HAKMEM_BENCH_MAX_SIZE=768 # bench_profile が以下を自動注入(既存 ENV を上書きしません): # HAKMEM_TINY_C6_HOT=1 # HAKMEM_SMALL_HEAP_V3_ENABLED=1 # HAKMEM_SMALL_HEAP_V3_CLASSES=0x40 # C6 only v3 ``` - C6 v4 研究(C6 を v4 に載せるときだけ) ```sh HAKMEM_PROFILE=C6_SMALL_HEAP_V4_EXPERIMENT HAKMEM_BENCH_MIN_SIZE=257 HAKMEM_BENCH_MAX_SIZE=768 # bench_profile が以下を自動注入(既存 ENV を上書きしません): # HAKMEM_TINY_C6_HOT=1 # HAKMEM_SMALL_HEAP_V3_ENABLED=0 # HAKMEM_SMALL_HEAP_V4_ENABLED=1 # HAKMEM_SMALL_HEAP_V4_CLASSES=0x40 # C6 only v4 ``` ※ いずれも「研究箱」です。Mixed/C6-heavy の標準評価では使わず、回帰やセグフォを許容できるときだけ明示的に opt-in してください。 --- ## Research Profile 0: C6_SMALL_HEAP_V5_STUB(SmallObject v5 C6-only route stub, Phase v5-1) ### 目的 - C6-only を SmallObject v5 route に載せるベンチ専用(v5-1 段階では挙動は v1/pool fallback)。 - ENV gate(HAKMEM_SMALL_HEAP_V5_ENABLED=1, HAKMEM_SMALL_HEAP_V5_CLASSES=0x40)で route 制御。 - front 経由で v5 通電確認&sanity テスト(実装は v5-2 以降)。 - Mixed/C6-heavy で v1 baseline と同じ perf を期待。 ### ENV(v5 C6-only opt-in) ```sh HAKMEM_BENCH_MIN_SIZE=257 HAKMEM_BENCH_MAX_SIZE=768 HAKMEM_TINY_HEAP_PROFILE=C7_SAFE HAKMEM_TINY_C6_HOT=0 HAKMEM_TINY_HOTHEAP_V2=0 HAKMEM_SMALL_HEAP_V3_ENABLED=1 HAKMEM_SMALL_HEAP_V3_CLASSES=0x80 # C7-only v3(C6 は v3 OFF) HAKMEM_SMALL_HEAP_V5_ENABLED=1 # ★ v5 ON HAKMEM_SMALL_HEAP_V5_CLASSES=0x40 # ★ C6(bit6) だけ v5 route に HAKMEM_POOL_V2_ENABLED=0 HAKMEM_POOL_V1_FLATTEN_ENABLED=0 ``` ### テストコマンド ```sh export HAKMEM_PROFILE=C6_HEAVY_LEGACY_POOLV1 export HAKMEM_SMALL_HEAP_V5_ENABLED=1 export HAKMEM_SMALL_HEAP_V5_CLASSES=0x40 ./bench_random_mixed_hakmem 256 512 100 # C6 size range ./bench_mid_large_mt_hakmem 1 1000000 400 1 # pool baseline comparison ``` ### 期待値 - Throughput ≈ v1 baseline(変化なし、v1 fallback の為) - segv/assert なし - route snapshot で C6 → TINY_ROUTE_SMALL_HEAP_V5 に分岐確認 ### 注意 - v5-1 では中身は v1/pool fallback のまま(実装は v5-2) - 本線には載せない、研究箱扱い --- ## Research Profile 1: C6_ONLY_SMALLOBJECT_V4(SmallObject v4 C6-only 試運転) ### 目的 - C6-only を SmallObject v4 route に載せて、page_meta_of() の試運転。 - 挙動はまだ pool v1 fallback のため、perf は v1 固定と同じ。 - Phase v4-mid-1: page_meta_of() が落ちないか、segv/assert なしか確認する研究ベンチ。 ### ENV(v4 C6-only opt-in) ```sh HAKMEM_BENCH_MIN_SIZE=257 HAKMEM_BENCH_MAX_SIZE=768 HAKMEM_TINY_HEAP_PROFILE=C7_SAFE HAKMEM_TINY_C6_HOT=0 HAKMEM_TINY_HOTHEAP_V2=0 HAKMEM_SMALL_HEAP_V3_ENABLED=1 HAKMEM_SMALL_HEAP_V3_CLASSES=0x80 # C7-only v3(C6 は v3 OFF) HAKMEM_SMALL_HEAP_V4_ENABLED=1 # ★ v4 ON HAKMEM_SMALL_HEAP_V4_CLASSES=0x40 # ★ C6(bit6) だけ v4 route に HAKMEM_POOL_V2_ENABLED=0 HAKMEM_POOL_V1_FLATTEN_ENABLED=0 ``` ### テストコマンド ```sh export HAKMEM_PROFILE=C6_HEAVY_LEGACY_POOLV1 export HAKMEM_SMALL_HEAP_V4_ENABLED=1 export HAKMEM_SMALL_HEAP_V4_CLASSES=0x40 ./bench_mid_large_mt_hakmem 1000000 400 1 ``` ### 期待値 - Throughput ≈ **28–29M ops/s**(v1 基線の ≈28M と同じ) - segv/assert なし - small_segment_v4_page_meta_of(ptr) が動く(debug output で確認可能) ### 注意 - 実際の alloc/free 動作は pool v1 のまま(v4 freelist は使わない) - Phase v4-mid-2 で本格実装時に差し替える --- ## Research Profile 2: C7_C6_V4_EXPERIMENT(C7+C6 v4 統合研究) ### 目的 - 後続フェーズで C7+C6 両者を v4 に載せるときの参考プリセット。 - 現フェーズではまだ使わない(v4-mid-1 は C6-only)。 ### ENV(参考用) ```sh HAKMEM_BENCH_MIN_SIZE=16 HAKMEM_BENCH_MAX_SIZE=1024 HAKMEM_SMALL_HEAP_V4_ENABLED=1 HAKMEM_SMALL_HEAP_V4_CLASSES=0xC0 # C6(0x40) + C7(0x80) ``` --- ## Profile 3: DEBUG_TINY_FRONT_PERF(perf 用 DEBUG プロファイル) ### 目的 - Tiny front v3(C7 v3 含む)の perf record 用。 - -O0 / -g / LTO OFF でシンボル付き計測。 ### ビルド例 ```sh make clean CFLAGS='-O0 -g' USE_LTO=0 OPT_LEVEL=0 NATIVE=0 \ make bench_random_mixed_hakmem -j4 ``` ### ENV ```sh HAKMEM_BENCH_MIN_SIZE=16 HAKMEM_BENCH_MAX_SIZE=1024 HAKMEM_TINY_HEAP_PROFILE=C7_SAFE HAKMEM_TINY_C7_HOT=1 HAKMEM_TINY_HOTHEAP_V2=0 HAKMEM_SMALL_HEAP_V3_ENABLED=1 HAKMEM_SMALL_HEAP_V3_CLASSES=0x80 HAKMEM_POOL_V2_ENABLED=0 HAKMEM_TINY_FRONT_V3_ENABLED=1 HAKMEM_TINY_FRONT_V3_LUT_ENABLED=1 HAKMEM_TINY_PTR_FAST_CLASSIFY_ENABLED=1 ``` ### perf 例 ```sh perf record -F 5000 --call-graph dwarf -e cycles:u \ -o perf.data.tiny_front_tf3 \ ./bench_random_mixed_hakmem 1000000 400 1 ``` - perf 計測時はログを極力 OFF、ENV は MIXED_TINYV3_C7_SAFE をベースにする。 --- ### 共通注意 - プリセットから外れて単発の ENV を積み足すと再現が難しくなるので、まずは上記いずれかからスタートし、変更点を必ずメモしてください。 - v2 系(Pool v2 / Tiny v2)はベンチごとに opt-in。不要なら常に 0。