Files
hakmem/core/box/free_path_stats_box.h

46 lines
1.3 KiB
C
Raw Normal View History

Phase FREE-LEGACY-OPT-4-1: Legacy per-class breakdown analysis ## 目的 Legacy fallback 49.2% の内訳を per-class で分析し、最も Legacy を使用しているクラスを特定。 ## 実装内容 1. FreePathStats 構造体の拡張 - legacy_by_class[8] フィールドを追加(C0-C7 の Legacy fallback 内訳) 2. デストラクタ出力の更新 - [FREE_PATH_STATS_LEGACY_BY_CLASS] 行を追加し、C0-C7 の内訳を出力 3. カウンタの散布 - free_tiny_fast() の Legacy fallback 経路で legacy_by_class[class_idx] をインクリメント - class_idx の範囲チェック(0-7)を実施 ## 測定結果(Mixed 16-1024B) **測定安定性**: 完全に安定(3 回とも同一の値、決定的測定) Legacy per-class 内訳: - C0: 0 (0.0%) - C1: 0 (0.0%) - C2: 8,746 (3.3% of legacy) - C3: 17,279 (6.5% of legacy) - C4: 34,727 (13.0% of legacy) - C5: 68,871 (25.8% of legacy) - C6: 137,319 (51.4% of legacy) ← 最大シェア - C7: 0 (0.0%) 合計: 266,942 (49.2% of total free calls) ## 分析結果 **最大シェアクラス**: C6 (513-1024B) が Legacy の 51.4% を占める **理由**: - Mixed 16-1024B では C6 サイズのアロケーションが多い - C7 ULTRA は C7 専用で C6 は未対応 - v3/v4 も C6 をカバーしていない - Route 設定で C6 は Legacy に直接落ちている ## 次のアクション Phase FREE-LEGACY-OPT-4-2 で C6 クラスに ULTRA-Free lane を実装: - Legacy fallback を 51% 削減(C6 分) - Legacy: 49.2% → 24-27% に改善(半減) - Mixed 16-1024B: 44.8M → 47-48M ops/s 程度(+5-8% 改善) ## 変更ファイル - core/box/free_path_stats_box.h: FreePathStats 構造体に legacy_by_class[8] 追加 - core/box/free_path_stats_box.c: デストラクタに per-class 出力追加 - core/front/malloc_tiny_fast.h: Legacy fallback 経路に per-class カウンタ追加 - docs/analysis/FREE_LEGACY_PATH_ANALYSIS.md: Phase 4-1 分析結果を記録 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2025-12-11 18:04:14 +09:00
#ifndef HAKMEM_FREE_PATH_STATS_BOX_H
#define HAKMEM_FREE_PATH_STATS_BOX_H
#include <stdint.h>
#include <stdbool.h>
#include <stdlib.h>
typedef struct FreePathStats {
uint64_t total_calls;
uint64_t c7_ultra_fast;
uint64_t c6_ultra_free_fast; // Phase 4-2: C6 ULTRA-free
uint64_t c6_ultra_alloc_hit; // Phase 4-4: C6 ULTRA-alloc (TLS pop)
Phase FREE-LEGACY-OPT-4-1: Legacy per-class breakdown analysis ## 目的 Legacy fallback 49.2% の内訳を per-class で分析し、最も Legacy を使用しているクラスを特定。 ## 実装内容 1. FreePathStats 構造体の拡張 - legacy_by_class[8] フィールドを追加(C0-C7 の Legacy fallback 内訳) 2. デストラクタ出力の更新 - [FREE_PATH_STATS_LEGACY_BY_CLASS] 行を追加し、C0-C7 の内訳を出力 3. カウンタの散布 - free_tiny_fast() の Legacy fallback 経路で legacy_by_class[class_idx] をインクリメント - class_idx の範囲チェック(0-7)を実施 ## 測定結果(Mixed 16-1024B) **測定安定性**: 完全に安定(3 回とも同一の値、決定的測定) Legacy per-class 内訳: - C0: 0 (0.0%) - C1: 0 (0.0%) - C2: 8,746 (3.3% of legacy) - C3: 17,279 (6.5% of legacy) - C4: 34,727 (13.0% of legacy) - C5: 68,871 (25.8% of legacy) - C6: 137,319 (51.4% of legacy) ← 最大シェア - C7: 0 (0.0%) 合計: 266,942 (49.2% of total free calls) ## 分析結果 **最大シェアクラス**: C6 (513-1024B) が Legacy の 51.4% を占める **理由**: - Mixed 16-1024B では C6 サイズのアロケーションが多い - C7 ULTRA は C7 専用で C6 は未対応 - v3/v4 も C6 をカバーしていない - Route 設定で C6 は Legacy に直接落ちている ## 次のアクション Phase FREE-LEGACY-OPT-4-2 で C6 クラスに ULTRA-Free lane を実装: - Legacy fallback を 51% 削減(C6 分) - Legacy: 49.2% → 24-27% に改善(半減) - Mixed 16-1024B: 44.8M → 47-48M ops/s 程度(+5-8% 改善) ## 変更ファイル - core/box/free_path_stats_box.h: FreePathStats 構造体に legacy_by_class[8] 追加 - core/box/free_path_stats_box.c: デストラクタに per-class 出力追加 - core/front/malloc_tiny_fast.h: Legacy fallback 経路に per-class カウンタ追加 - docs/analysis/FREE_LEGACY_PATH_ANALYSIS.md: Phase 4-1 分析結果を記録 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2025-12-11 18:04:14 +09:00
uint64_t smallheap_v3_fast;
uint64_t smallheap_v6_fast;
uint64_t tiny_heap_v1_fast;
uint64_t pool_v1_fast;
uint64_t remote_free;
uint64_t super_lookup_called;
uint64_t legacy_fallback;
// Phase 4-1: Legacy per-class breakdown
uint64_t legacy_by_class[8]; // C0-C7 の Legacy fallback 内訳
} FreePathStats;
// ENV gate
static inline bool free_path_stats_enabled(void) {
static int g_enabled = -1;
if (__builtin_expect(g_enabled == -1, 0)) {
const char* e = getenv("HAKMEM_FREE_PATH_STATS");
g_enabled = (e && *e && *e != '0') ? 1 : 0;
}
return g_enabled;
}
// Global stats instance
extern FreePathStats g_free_path_stats;
// Increment macros (with unlikely guard)
#define FREE_PATH_STAT_INC(field) \
do { if (__builtin_expect(free_path_stats_enabled(), 0)) { \
g_free_path_stats.field++; \
} } while(0)
#endif // HAKMEM_FREE_PATH_STATS_BOX_H