hass_doc/audio__enhancer_8py_source.html

 """Audio enhancement for Assist."""


 from abc import ABC, abstractmethod

 from dataclasses import dataclass

 import logging


 from pymicro_vad import MicroVad

 from pyspeex_noise import AudioProcessor


 from .const import BYTES_PER_CHUNK


 _LOGGER = logging.getLogger(__name__)


 @dataclass(frozen=True, slots=True)

 class EnhancedAudioChunk:

     """Enhanced audio chunk and metadata."""


     audio: bytes

     """Raw PCM audio @ 16Khz with 16-bit mono samples"""


     timestamp_ms: int

     """Timestamp relative to start of audio stream (milliseconds)"""


     speech_probability: float | None

     """Probability that audio chunk contains speech (0-1), None if unknown"""


 class AudioEnhancer(ABC):

     """Base class for audio enhancement."""


     def __init__(

         self, auto_gain: int, noise_suppression: int, is_vad_enabled: bool

     ) -> None:

         """Initialize audio enhancer."""

         self.auto_gainauto_gain = auto_gain

         self.noise_suppressionnoise_suppression = noise_suppression

         self.is_vad_enabledis_vad_enabled = is_vad_enabled


     @abstractmethod

     def enhance_chunk(self, audio: bytes, timestamp_ms: int) -> EnhancedAudioChunk:

         """Enhance chunk of PCM audio @ 16Khz with 16-bit mono samples."""


 class MicroVadSpeexEnhancer(AudioEnhancer):

     """Audio enhancer that runs microVAD and speex."""


     def __init__(

         self, auto_gain: int, noise_suppression: int, is_vad_enabled: bool

     ) -> None:

         """Initialize audio enhancer."""

         super().__init__(auto_gain, noise_suppression, is_vad_enabled)


         self.audio_processoraudio_processor: AudioProcessor | None = None


         # Scale from 0-4

         self.noise_suppressionnoise_suppressionnoise_suppression = noise_suppression * -15


         # Scale from 0-31

         self.auto_gainauto_gainauto_gain = auto_gain * 300


         if (self.auto_gainauto_gainauto_gain != 0) or (self.noise_suppressionnoise_suppressionnoise_suppression != 0):

             self.audio_processoraudio_processor = AudioProcessor(

                 self.auto_gainauto_gainauto_gain, self.noise_suppressionnoise_suppressionnoise_suppression

             )

             _LOGGER.debug(

                 "Initialized speex with auto_gain=%s, noise_suppression=%s",

                 self.auto_gainauto_gainauto_gain,

                 self.noise_suppressionnoise_suppressionnoise_suppression,

             )


         self.vadvad: MicroVad | None = None


         if self.is_vad_enabledis_vad_enabled:

             self.vadvad = MicroVad()

             _LOGGER.debug("Initialized microVAD")


     def enhance_chunk(self, audio: bytes, timestamp_ms: int) -> EnhancedAudioChunk:

         """Enhance 10ms chunk of PCM audio @ 16Khz with 16-bit mono samples."""

         speech_probability: float | None = None


         assert len(audio) == BYTES_PER_CHUNK


         if self.vadvad is not None:

             # Run VAD

             speech_probability = self.vadvad.Process10ms(audio)


         if self.audio_processoraudio_processor is not None:

             # Run noise suppression and auto gain

             audio = self.audio_processoraudio_processor.Process10ms(audio).audio


         return EnhancedAudioChunk(

             audio=audio,

             timestamp_ms=timestamp_ms,

             speech_probability=speech_probability,

         )

homeassistant.components.assist_pipeline.audio_enhancer.AudioEnhancer
Definition: audio_enhancer.py:29

homeassistant.components.assist_pipeline.audio_enhancer.AudioEnhancer.noise_suppression
noise_suppression
Definition: audio_enhancer.py:37

homeassistant.components.assist_pipeline.audio_enhancer.AudioEnhancer.auto_gain
auto_gain
Definition: audio_enhancer.py:36

homeassistant.components.assist_pipeline.audio_enhancer.AudioEnhancer.enhance_chunk
EnhancedAudioChunk enhance_chunk(self, bytes audio, int timestamp_ms)
Definition: audio_enhancer.py:41

homeassistant.components.assist_pipeline.audio_enhancer.AudioEnhancer.__init__
None __init__(self, int auto_gain, int noise_suppression, bool is_vad_enabled)
Definition: audio_enhancer.py:34

homeassistant.components.assist_pipeline.audio_enhancer.AudioEnhancer.is_vad_enabled
is_vad_enabled
Definition: audio_enhancer.py:38

homeassistant.components.assist_pipeline.audio_enhancer.EnhancedAudioChunk
Definition: audio_enhancer.py:16

homeassistant.components.assist_pipeline.audio_enhancer.MicroVadSpeexEnhancer
Definition: audio_enhancer.py:45

homeassistant.components.assist_pipeline.audio_enhancer.MicroVadSpeexEnhancer.noise_suppression
noise_suppression
Definition: audio_enhancer.py:57

homeassistant.components.assist_pipeline.audio_enhancer.MicroVadSpeexEnhancer.audio_processor
audio_processor
Definition: audio_enhancer.py:63

homeassistant.components.assist_pipeline.audio_enhancer.MicroVadSpeexEnhancer.__init__
None __init__(self, int auto_gain, int noise_suppression, bool is_vad_enabled)
Definition: audio_enhancer.py:50

homeassistant.components.assist_pipeline.audio_enhancer.MicroVadSpeexEnhancer.vad
vad
Definition: audio_enhancer.py:75

homeassistant.components.assist_pipeline.audio_enhancer.MicroVadSpeexEnhancer.enhance_chunk
EnhancedAudioChunk enhance_chunk(self, bytes audio, int timestamp_ms)
Definition: audio_enhancer.py:78

homeassistant.components.assist_pipeline.audio_enhancer.MicroVadSpeexEnhancer.auto_gain
auto_gain
Definition: audio_enhancer.py:60