Audio Module Deep Dive
Audio Module Deep Dive
Pipeline
- استخراج الصوت من الفيديو عبر
ffmpeg(عند الحاجة). - Resample إلى
22050 Hzmono. - Slice windows (
2.0 s, hop متغير حسب الواجهة). - تحويل كل window إلى
128-bin log-Mel. - Min-Max normalization per-window.
- CNN inference وإخراج probability.
- Optional M-of-N temporal confirmation.
نقاط ضبط مهمة
thresholdالافتراضي:0.5.window_s:2.0.hop_s: غالبًا1.0أو0.5حسب المسار.