hass_doc/voip_2assist__satellite_8py_source.html

 """Assist satellite entity for VoIP integration."""


 from __future__ import annotations


 import asyncio

 from enum import IntFlag

 from functools import partial

 import io

 import logging

 from pathlib import Path

 from typing import TYPE_CHECKING, Any, Final

 import wave


 from voip_utils import RtpDatagramProtocol


 from homeassistant.components import tts

 from homeassistant.components.assist_pipeline import PipelineEvent, PipelineEventType

 from homeassistant.components.assist_satellite import (

     AssistSatelliteConfiguration,

     AssistSatelliteEntity,

     AssistSatelliteEntityDescription,

 )

 from homeassistant.config_entries import ConfigEntry

 from homeassistant.core import Context, HomeAssistant, callback

 from homeassistant.helpers.entity_platform import AddEntitiesCallback


 from .const import CHANNELS, DOMAIN, RATE, RTP_AUDIO_SETTINGS, WIDTH

 from .devices import VoIPDevice

 from .entity import VoIPEntity


 if TYPE_CHECKING:

     from . import DomainData


 _LOGGER = logging.getLogger(__name__)


 _PIPELINE_TIMEOUT_SEC: Final = 30


 class Tones(IntFlag):

     """Feedback tones for specific events."""


     LISTENING = 1

     PROCESSING = 2

     ERROR = 4


 _TONE_FILENAMES: dict[Tones, str] = {

     Tones.LISTENING: "tone.pcm",

     Tones.PROCESSING: "processing.pcm",

     Tones.ERROR: "error.pcm",

 }


 async def async_setup_entry(

     hass: HomeAssistant,

     config_entry: ConfigEntry,

     async_add_entities: AddEntitiesCallback,

 ) -> None:

     """Set up VoIP Assist satellite entity."""

     domain_data: DomainData = hass.data[DOMAIN]


     @callback

     def async_add_device(device: VoIPDevice) -> None:

         """Add device."""

         async_add_entities([VoipAssistSatellite(hass, device, config_entry)])


     domain_data.devices.async_add_new_device_listener(async_add_device)


     entities: list[VoIPEntity] = [

         VoipAssistSatellite(hass, device, config_entry)

         for device in domain_data.devices

     ]


     async_add_entities(entities)


 class VoipAssistSatellite(VoIPEntity, AssistSatelliteEntity, RtpDatagramProtocol):

     """Assist satellite for VoIP devices."""


     entity_description = AssistSatelliteEntityDescription(key="assist_satellite")

     _attr_translation_key = "assist_satellite"

     _attr_name = None


     def __init__(

         self,

         hass: HomeAssistant,

         voip_device: VoIPDevice,

         config_entry: ConfigEntry,

         tones=Tones.LISTENING | Tones.PROCESSING | Tones.ERROR,

     ) -> None:

         """Initialize an Assist satellite."""

         VoIPEntity.__init__(self, voip_device)

         AssistSatelliteEntity.__init__(self)

         RtpDatagramProtocol.__init__(self)


         self.config_entryconfig_entry = config_entry


         self._audio_queue: asyncio.Queue[bytes | None] = asyncio.Queue()

         self._audio_chunk_timeout: float = 2.0

         self._run_pipeline_task_run_pipeline_task: asyncio.Task | None = None

         self._pipeline_had_error_pipeline_had_error: bool = False

         self._tts_done_tts_done = asyncio.Event()

         self._tts_extra_timeout: float = 1.0

         self._tone_bytes: dict[Tones, bytes] = {}

         self._tones_tones = tones

         self._processing_tone_done_processing_tone_done = asyncio.Event()


     @property

     def pipeline_entity_id(self) -> str | None:

         """Return the entity ID of the pipeline to use for the next conversation."""

         return self.voip_devicevoip_device.get_pipeline_entity_id(self.hass)


     @property

     def vad_sensitivity_entity_id(self) -> str | None:

         """Return the entity ID of the VAD sensitivity to use for the next conversation."""

         return self.voip_devicevoip_device.get_vad_sensitivity_entity_id(self.hass)


     @property

     def tts_options(self) -> dict[str, Any] | None:

         """Options passed for text-to-speech."""

         return {

             tts.ATTR_PREFERRED_FORMAT: "wav",

             tts.ATTR_PREFERRED_SAMPLE_RATE: 16000,

             tts.ATTR_PREFERRED_SAMPLE_CHANNELS: 1,

             tts.ATTR_PREFERRED_SAMPLE_BYTES: 2,

         }


     async def async_added_to_hass(self) -> None:

         """Run when entity about to be added to hass."""

         await super().async_added_to_hass()

         self.voip_devicevoip_device.protocol = self


     async def async_will_remove_from_hass(self) -> None:

         """Run when entity will be removed from hass."""

         await super().async_will_remove_from_hass()

         assert self.voip_devicevoip_device.protocol == self

         self.voip_devicevoip_device.protocol = None


     @callback

     def async_get_configuration(

         self,

     ) -> AssistSatelliteConfiguration:

         """Get the current satellite configuration."""

         raise NotImplementedError


     async def async_set_configuration(

         self, config: AssistSatelliteConfiguration

     ) -> None:

         """Set the current satellite configuration."""

         raise NotImplementedError


     # -------------------------------------------------------------------------

     # VoIP

     # -------------------------------------------------------------------------


     def on_chunk(self, audio_bytes: bytes) -> None:

         """Handle raw audio chunk."""

         if self._run_pipeline_task_run_pipeline_task is None:

             # Run pipeline until voice command finishes, then start over

             self._clear_audio_queue_clear_audio_queue()

             self._tts_done_tts_done.clear()

             self._run_pipeline_task_run_pipeline_task = self.config_entryconfig_entry.async_create_background_task(

                 self.hass,

                 self._run_pipeline_run_pipeline(),

                 "voip_pipeline_run",

             )


         self._audio_queue.put_nowait(audio_bytes)


     async def _run_pipeline(self) -> None:

         _LOGGER.debug("Starting pipeline")


         self.async_set_context(Context(user_id=self.config_entryconfig_entry.data["user"]))

         self.voip_devicevoip_device.set_is_active(True)


         async def stt_stream():

             while True:

                 async with asyncio.timeout(self._audio_chunk_timeout):

                     chunk = await self._audio_queue.get()

                     if not chunk:

                         break


                     yield chunk


         # Play listening tone at the start of each cycle

         await self._play_tone_play_tone(Tones.LISTENING, silence_before=0.2)


         try:

             await self.async_accept_pipeline_from_satelliteasync_accept_pipeline_from_satellite(

                 audio_stream=stt_stream(),

             )


             if self._pipeline_had_error_pipeline_had_error:

                 self._pipeline_had_error_pipeline_had_error = False

                 await self._play_tone_play_tone(Tones.ERROR)

             else:

                 # Block until TTS is done speaking.

                 #

                 # This is set in _send_tts and has a timeout that's based on the

                 # length of the TTS audio.

                 await self._tts_done_tts_done.wait()

         except TimeoutError:

             self.disconnect()  # caller hung up

         finally:

             # Stop audio stream

             await self._audio_queue.put(None)


             self.voip_devicevoip_device.set_is_active(False)

             self._run_pipeline_task_run_pipeline_task = None

             _LOGGER.debug("Pipeline finished")


     def _clear_audio_queue(self) -> None:

         """Ensure audio queue is empty."""

         while not self._audio_queue.empty():

             self._audio_queue.get_nowait()


     def on_pipeline_event(self, event: PipelineEvent) -> None:

         """Set state based on pipeline stage."""

         if event.type == PipelineEventType.STT_END:

             if (self._tones_tones & Tones.PROCESSING) == Tones.PROCESSING:

                 self._processing_tone_done_processing_tone_done.clear()

                 self.config_entryconfig_entry.async_create_background_task(

                     self.hass, self._play_tone_play_tone(Tones.PROCESSING), "voip_process_tone"

                 )

         elif event.type == PipelineEventType.TTS_END:

             # Send TTS audio to caller over RTP

             if event.data and (tts_output := event.data["tts_output"]):

                 media_id = tts_output["media_id"]

                 self.config_entryconfig_entry.async_create_background_task(

                     self.hass,

                     self._send_tts_send_tts(media_id),

                     "voip_pipeline_tts",

                 )

             else:

                 # Empty TTS response

                 self._tts_done_tts_done.set()

         elif event.type == PipelineEventType.ERROR:

             # Play error tone instead of wait for TTS when pipeline is finished.

             self._pipeline_had_error_pipeline_had_error = True

             _LOGGER.warning(event)


     async def _send_tts(self, media_id: str) -> None:

         """Send TTS audio to caller via RTP."""

         try:

             if self.transport is None:

                 return  # not connected


             extension, data = await tts.async_get_media_source_audio(

                 self.hass,

                 media_id,

             )


             if extension != "wav":

                 raise ValueError(f"Only WAV audio can be streamed, got {extension}")


             if (self._tones_tones & Tones.PROCESSING) == Tones.PROCESSING:

                 # Don't overlap TTS and processing beep

                 _LOGGER.debug("Waiting for processing tone")

                 await self._processing_tone_done_processing_tone_done.wait()


             with io.BytesIO(data) as wav_io:

                 with wave.open(wav_io, "rb") as wav_file:

                     sample_rate = wav_file.getframerate()

                     sample_width = wav_file.getsampwidth()

                     sample_channels = wav_file.getnchannels()


                     if (

                         (sample_rate != RATE)

                         or (sample_width != WIDTH)

                         or (sample_channels != CHANNELS)

                     ):

                         raise ValueError(

                             f"Expected rate/width/channels as {RATE}/{WIDTH}/{CHANNELS},"

                             f" got {sample_rate}/{sample_width}/{sample_channels}"

                         )


                 audio_bytes = wav_file.readframes(wav_file.getnframes())


             _LOGGER.debug("Sending %s byte(s) of audio", len(audio_bytes))


             # Time out 1 second after TTS audio should be finished

             tts_samples = len(audio_bytes) / (WIDTH * CHANNELS)

             tts_seconds = tts_samples / RATE


             async with asyncio.timeout(tts_seconds + self._tts_extra_timeout):

                 # TTS audio is 16Khz 16-bit mono

                 await self._async_send_audio_async_send_audio(audio_bytes)

         except TimeoutError:

             _LOGGER.warning("TTS timeout")

             raise

         finally:

             # Update satellite state

             self.tts_response_finishedtts_response_finished()


             # Signal pipeline to restart

             self._tts_done_tts_done.set()


     async def _async_send_audio(self, audio_bytes: bytes, **kwargs):

         """Send audio in executor."""

         await self.hass.async_add_executor_job(

             partial(self.send_audio, audio_bytes, **RTP_AUDIO_SETTINGS, **kwargs)

         )


     async def _play_tone(self, tone: Tones, silence_before: float = 0.0) -> None:

         """Play a tone as feedback to the user if it's enabled."""

         if (self._tones_tones & tone) != tone:

             return  # not enabled


         if tone not in self._tone_bytes:

             # Do I/O in executor

             self._tone_bytes[tone] = await self.hass.async_add_executor_job(

                 self._load_pcm_load_pcm,

                 _TONE_FILENAMES[tone],

             )


         await self._async_send_audio_async_send_audio(

             self._tone_bytes[tone],

             silence_before=silence_before,

         )


         if tone == Tones.PROCESSING:

             self._processing_tone_done_processing_tone_done.set()


     def _load_pcm(self, file_name: str) -> bytes:

         """Load raw audio (16Khz, 16-bit mono)."""

         return (Path(__file__).parent / file_name).read_bytes()

homeassistant.components.assist_satellite.entity.AssistSatelliteEntityDescription
Definition: entity.py:57

homeassistant.components.assist_satellite.entity.AssistSatelliteEntity
Definition: entity.py:102

homeassistant.components.assist_satellite.entity.AssistSatelliteEntity.async_accept_pipeline_from_satellite
None async_accept_pipeline_from_satellite(self, AsyncIterable[bytes] audio_stream, PipelineStage start_stage=PipelineStage.STT, PipelineStage end_stage=PipelineStage.TTS, str|None wake_word_phrase=None)
Definition: entity.py:260

homeassistant.components.assist_satellite.entity.AssistSatelliteEntity.tts_response_finished
None tts_response_finished(self)
Definition: entity.py:393

homeassistant.components.voip.assist_satellite.Tones
Definition: assist_satellite.py:39

homeassistant.components.voip.assist_satellite.VoipAssistSatellite
Definition: assist_satellite.py:77

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.async_set_configuration
None async_set_configuration(self, AssistSatelliteConfiguration config)
Definition: assist_satellite.py:148

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.vad_sensitivity_entity_id
str|None vad_sensitivity_entity_id(self)
Definition: assist_satellite.py:114

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._tones
_tones
Definition: assist_satellite.py:105

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._pipeline_had_error
_pipeline_had_error
Definition: assist_satellite.py:194

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.on_pipeline_event
None on_pipeline_event(self, PipelineEvent event)
Definition: assist_satellite.py:217

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.async_will_remove_from_hass
None async_will_remove_from_hass(self)
Definition: assist_satellite.py:133

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._clear_audio_queue
None _clear_audio_queue(self)
Definition: assist_satellite.py:212

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.pipeline_entity_id
str|None pipeline_entity_id(self)
Definition: assist_satellite.py:109

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._run_pipeline_task
_run_pipeline_task
Definition: assist_satellite.py:162

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.config_entry
config_entry
Definition: assist_satellite.py:96

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._play_tone
None _play_tone(self, Tones tone, float silence_before=0.0)
Definition: assist_satellite.py:304

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.async_added_to_hass
None async_added_to_hass(self)
Definition: assist_satellite.py:128

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._async_send_audio
def _async_send_audio(self, bytes audio_bytes, **kwargs)
Definition: assist_satellite.py:298

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._tts_done
_tts_done
Definition: assist_satellite.py:102

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.async_get_configuration
AssistSatelliteConfiguration async_get_configuration(self)
Definition: assist_satellite.py:142

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.on_chunk
None on_chunk(self, bytes audio_bytes)
Definition: assist_satellite.py:156

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.__init__
None __init__(self, HomeAssistant hass, VoIPDevice voip_device, ConfigEntry config_entry, tones=Tones.LISTENING|Tones.PROCESSING|Tones.ERROR)
Definition: assist_satellite.py:90

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._load_pcm
bytes _load_pcm(self, str file_name)
Definition: assist_satellite.py:324

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._send_tts
None _send_tts(self, str media_id)
Definition: assist_satellite.py:242

homeassistant.components.voip.assist_satellite.VoipAssistSatellite.tts_options
dict[str, Any]|None tts_options(self)
Definition: assist_satellite.py:119

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._processing_tone_done
_processing_tone_done
Definition: assist_satellite.py:106

homeassistant.components.voip.assist_satellite.VoipAssistSatellite._run_pipeline
None _run_pipeline(self)
Definition: assist_satellite.py:170

homeassistant.components.voip.entity.VoIPEntity
Definition: entity.py:12

homeassistant.components.voip.entity.VoIPEntity.voip_device
voip_device
Definition: entity.py:20

homeassistant.core.Context
Definition: core.py:1256

homeassistant.components.assist_pipeline
Definition: __init__.py:1

homeassistant.components.assist_satellite
Definition: __init__.py:1

homeassistant.components.config.view.get
web.Response get(self, web.Request request, str config_key)
Definition: view.py:88

homeassistant.components.mysensors.sensor.async_add_entities
async_add_entities
Definition: sensor.py:224

homeassistant.components.voip.assist_satellite.async_setup_entry
None async_setup_entry(HomeAssistant hass, ConfigEntry config_entry, AddEntitiesCallback async_add_entities)
Definition: assist_satellite.py:58

homeassistant.components
Definition: __init__.py:1

homeassistant.config_entries
Definition: config_entries.py:1

homeassistant.core
Definition: core.py:1

homeassistant.helpers.entity_platform
Definition: entity_platform.py:1