hass_doc/assist__pipeline_2websocket__api_8py_source.html

 """Assist pipeline Websocket API."""


 import asyncio


 # Suppressing disable=deprecated-module is needed for Python 3.11

 import audioop  # pylint: disable=deprecated-module

 import base64

 from collections.abc import AsyncGenerator, Callable

 import contextlib

 import logging

 import math

 from typing import Any, Final


 import voluptuous as vol


 from homeassistant.components import conversation, stt, tts, websocket_api

 from homeassistant.const import ATTR_DEVICE_ID, ATTR_SECONDS, MATCH_ALL

 from homeassistant.core import HomeAssistant, callback

 from homeassistant.helpers import config_validation as cv, entity_registry as er

 from homeassistant.util import language as language_util


 from .const import (

     DEFAULT_PIPELINE_TIMEOUT,

     DEFAULT_WAKE_WORD_TIMEOUT,

     DOMAIN,

     EVENT_RECORDING,

     SAMPLE_CHANNELS,

     SAMPLE_RATE,

     SAMPLE_WIDTH,

 )

 from .error import PipelineNotFound

 from .pipeline import (

     AudioSettings,

     DeviceAudioQueue,

     PipelineData,

     PipelineError,

     PipelineEvent,

     PipelineEventType,

     PipelineInput,

     PipelineRun,

     PipelineStage,

     WakeWordSettings,

     async_get_pipeline,

 )


 _LOGGER = logging.getLogger(__name__)


 CAPTURE_RATE: Final = 16000

 CAPTURE_WIDTH: Final = 2

 CAPTURE_CHANNELS: Final = 1

 MAX_CAPTURE_TIMEOUT: Final = 60.0


 @callback

 def async_register_websocket_api(hass: HomeAssistant) -> None:

     """Register the websocket API."""

     websocket_api.async_register_command(hass, websocket_run)

     websocket_api.async_register_command(hass, websocket_list_languages)

     websocket_api.async_register_command(hass, websocket_list_runs)

     websocket_api.async_register_command(hass, websocket_list_devices)

     websocket_api.async_register_command(hass, websocket_get_run)

     websocket_api.async_register_command(hass, websocket_device_capture)


 @websocket_api.websocket_command(
    vol.All(
        websocket_api.BASE_COMMAND_MESSAGE_SCHEMA.extend(
            {
                vol.Required("type"): "assist_pipeline/run",

                 # pylint: disable-next=unnecessary-lambda

                 vol.Required("start_stage"): lambda val: PipelineStage(val),

                 # pylint: disable-next=unnecessary-lambda

                 vol.Required("end_stage"): lambda val: PipelineStage(val),

                 vol.Optional("input"): dict,

                 vol.Optional("pipeline"): str,

                 vol.Optional("conversation_id"): vol.Any(str, None),

                 vol.Optional("device_id"): vol.Any(str, None),

                 vol.Optional("timeout"): vol.Any(float, int),

             },

         ),

         cv.key_value_schemas(

             "start_stage",

             {

                 PipelineStage.WAKE_WORD: vol.Schema(

                     {

                         vol.Required("input"): {

                             vol.Required("sample_rate"): int,

                             vol.Optional("timeout"): vol.Any(float, int),

                             vol.Optional("audio_seconds_to_buffer"): vol.Any(

                                 float, int

                             ),

                             # Audio enhancement

                             vol.Optional("noise_suppression_level"): int,

                             vol.Optional("auto_gain_dbfs"): int,

                             vol.Optional("volume_multiplier"): float,

                             # Advanced use cases/testing

                             vol.Optional("no_vad"): bool,

                         }

                     },

                     extra=vol.ALLOW_EXTRA,

                 ),

                 PipelineStage.STT: vol.Schema(

                     {

                         vol.Required("input"): {

                             vol.Required("sample_rate"): int,

                             vol.Optional("wake_word_phrase"): str,

                         }

                     },

                     extra=vol.ALLOW_EXTRA,

                 ),

                 PipelineStage.INTENT: vol.Schema(

                     {vol.Required("input"): {"text": str}},

                     extra=vol.ALLOW_EXTRA,

                 ),

                 PipelineStage.TTS: vol.Schema(

                     {vol.Required("input"): {"text": str}},

                     extra=vol.ALLOW_EXTRA,

                 ),

             },

         ),

     ),

 )

 @websocket_api.async_response

 async def websocket_run(

     hass: HomeAssistant,

     connection: websocket_api.ActiveConnection,

     msg: dict[str, Any],

 ) -> None:

     """Run a pipeline."""

     pipeline_id = msg.get("pipeline")

     try:

         pipeline = async_get_pipeline(hass, pipeline_id=pipeline_id)

     except PipelineNotFound:

         connection.send_error(

             msg["id"],

             "pipeline-not-found",

             f"Pipeline not found: id={pipeline_id}",

         )

         return


     timeout = msg.get("timeout", DEFAULT_PIPELINE_TIMEOUT)

     start_stage = PipelineStage(msg["start_stage"])

     end_stage = PipelineStage(msg["end_stage"])

     handler_id: int | None = None

     unregister_handler: Callable[[], None] | None = None

     wake_word_settings: WakeWordSettings | None = None

     audio_settings: AudioSettings | None = None


     # Arguments to PipelineInput

     input_args: dict[str, Any] = {

         "conversation_id": msg.get("conversation_id"),

         "device_id": msg.get("device_id"),

     }


     if start_stage in (PipelineStage.WAKE_WORD, PipelineStage.STT):

         # Audio pipeline that will receive audio as binary websocket messages

         msg_input = msg["input"]

         audio_queue: asyncio.Queue[bytes] = asyncio.Queue()

         incoming_sample_rate = msg_input["sample_rate"]

         wake_word_phrase: str | None = None


         if start_stage == PipelineStage.WAKE_WORD:

             wake_word_settings = WakeWordSettings(

                 timeout=msg["input"].get("timeout", DEFAULT_WAKE_WORD_TIMEOUT),

                 audio_seconds_to_buffer=msg_input.get("audio_seconds_to_buffer", 0),

             )

         elif start_stage == PipelineStage.STT:

             wake_word_phrase = msg["input"].get("wake_word_phrase")


         async def stt_stream() -> AsyncGenerator[bytes]:

             state = None


             # Yield until we receive an empty chunk

             while chunk := await audio_queue.get():

                 if incoming_sample_rate != SAMPLE_RATE:

                     chunk, state = audioop.ratecv(

                         chunk,

                         SAMPLE_WIDTH,

                         SAMPLE_CHANNELS,

                         incoming_sample_rate,

                         SAMPLE_RATE,

                         state,

                     )

                 yield chunk


         def handle_binary(

             _hass: HomeAssistant,

             _connection: websocket_api.ActiveConnection,

             data: bytes,

         ) -> None:

             # Forward to STT audio stream

             audio_queue.put_nowait(data)


         handler_id, unregister_handler = connection.async_register_binary_handler(

             handle_binary

         )


         # Audio input must be raw PCM at 16Khz with 16-bit mono samples

         input_args["stt_metadata"] = stt.SpeechMetadata(

             language=pipeline.stt_language or pipeline.language,

             format=stt.AudioFormats.WAV,

             codec=stt.AudioCodecs.PCM,

             bit_rate=stt.AudioBitRates.BITRATE_16,

             sample_rate=stt.AudioSampleRates.SAMPLERATE_16000,

             channel=stt.AudioChannels.CHANNEL_MONO,

         )

         input_args["stt_stream"] = stt_stream()

         input_args["wake_word_phrase"] = wake_word_phrase


         # Audio settings

         audio_settings = AudioSettings(

             noise_suppression_level=msg_input.get("noise_suppression_level", 0),

             auto_gain_dbfs=msg_input.get("auto_gain_dbfs", 0),

             volume_multiplier=msg_input.get("volume_multiplier", 1.0),

             is_vad_enabled=not msg_input.get("no_vad", False),

         )

     elif start_stage == PipelineStage.INTENT:

         # Input to conversation agent

         input_args["intent_input"] = msg["input"]["text"]

     elif start_stage == PipelineStage.TTS:

         # Input to text-to-speech system

         input_args["tts_input"] = msg["input"]["text"]


     input_args["run"] = PipelineRun(

         hass,

         context=connection.context(msg),

         pipeline=pipeline,

         start_stage=start_stage,

         end_stage=end_stage,

         event_callback=lambda event: connection.send_event(msg["id"], event),

         runner_data={

             "stt_binary_handler_id": handler_id,

             "timeout": timeout,

         },

         wake_word_settings=wake_word_settings,

         audio_settings=audio_settings or AudioSettings(),

     )


     pipeline_input = PipelineInput(**input_args)


     try:

         await pipeline_input.validate()

     except PipelineError as error:

         # Report more specific error when possible

         connection.send_error(msg["id"], error.code, error.message)

         return


     # Confirm subscription

     connection.send_result(msg["id"])


     run_task = hass.async_create_task(pipeline_input.execute())


     # Cancel pipeline if user unsubscribes

     connection.subscriptions[msg["id"]] = run_task.cancel


     try:

         # Task contains a timeout

         async with asyncio.timeout(timeout):

             await run_task

     except TimeoutError:

         pipeline_input.run.process_event(

             PipelineEvent(

                 PipelineEventType.ERROR,

                 {"code": "timeout", "message": "Timeout running pipeline"},

             )

         )

     finally:

         if unregister_handler is not None:

             # Unregister binary handler

             unregister_handler()


 @callback

 @websocket_api.require_admin

 @websocket_api.websocket_command(
    {
        vol.Required("type"): "assist_pipeline/pipeline_debug/list",

         vol.Required("pipeline_id"): str,

     }

 )

 def websocket_list_runs(

     hass: HomeAssistant,

     connection: websocket_api.connection.ActiveConnection,

     msg: dict[str, Any],

 ) -> None:

     """List pipeline runs for which debug data is available."""

     pipeline_data: PipelineData = hass.data[DOMAIN]

     pipeline_id = msg["pipeline_id"]


     if pipeline_id not in pipeline_data.pipeline_debug:

         connection.send_result(msg["id"], {"pipeline_runs": []})

         return


     pipeline_debug = pipeline_data.pipeline_debug[pipeline_id]


     connection.send_result(

         msg["id"],

         {

             "pipeline_runs": [

                 {

                     "pipeline_run_id": pipeline_run_id,

                     "timestamp": pipeline_run.timestamp,

                 }

                 for pipeline_run_id, pipeline_run in pipeline_debug.items()

             ]

         },

     )


 @callback

 @websocket_api.require_admin

 @websocket_api.websocket_command(
    {
        vol.Required("type"): "assist_pipeline/device/list",

     }

 )

 def websocket_list_devices(

     hass: HomeAssistant,

     connection: websocket_api.connection.ActiveConnection,

     msg: dict[str, Any],

 ) -> None:

     """List assist devices."""

     pipeline_data: PipelineData = hass.data[DOMAIN]

     ent_reg = er.async_get(hass)

     connection.send_result(

         msg["id"],

         [

             {

                 "device_id": device_id,

                 "pipeline_entity": ent_reg.async_get_entity_id(

                     "select", info.domain, f"{info.unique_id_prefix}-pipeline"

                 ),

             }

             for device_id, info in pipeline_data.pipeline_devices.items()

         ],

     )


 @callback

 @websocket_api.require_admin

 @websocket_api.websocket_command(
    {
        vol.Required("type"): "assist_pipeline/pipeline_debug/get",

         vol.Required("pipeline_id"): str,

         vol.Required("pipeline_run_id"): str,

     }

 )

 def websocket_get_run(

     hass: HomeAssistant,

     connection: websocket_api.connection.ActiveConnection,

     msg: dict[str, Any],

 ) -> None:

     """Get debug data for a pipeline run."""

     pipeline_data: PipelineData = hass.data[DOMAIN]

     pipeline_id = msg["pipeline_id"]

     pipeline_run_id = msg["pipeline_run_id"]


     if pipeline_id not in pipeline_data.pipeline_debug:

         connection.send_error(

             msg["id"],

             websocket_api.ERR_NOT_FOUND,

             f"pipeline_id {pipeline_id} not found",

         )

         return


     pipeline_debug = pipeline_data.pipeline_debug[pipeline_id]


     if pipeline_run_id not in pipeline_debug:

         connection.send_error(

             msg["id"],

             websocket_api.ERR_NOT_FOUND,

             f"pipeline_run_id {pipeline_run_id} not found",

         )

         return


     connection.send_result(

         msg["id"],

         {"events": pipeline_debug[pipeline_run_id].events},

     )


 @websocket_api.websocket_command(
    {
        vol.Required("type"): "assist_pipeline/language/list",

     }

 )

 @callback

 def websocket_list_languages(

     hass: HomeAssistant,

     connection: websocket_api.connection.ActiveConnection,

     msg: dict[str, Any],

 ) -> None:

     """List languages which are supported by a complete pipeline.


     This will return a list of languages which are supported by at least one stt, tts

     and conversation engine respectively.

     """

     conv_language_tags = conversation.async_get_conversation_languages(hass)

     stt_language_tags = stt.async_get_speech_to_text_languages(hass)

     tts_language_tags = tts.async_get_text_to_speech_languages(hass)

     pipeline_languages: set[str] | None = None


     if conv_language_tags and conv_language_tags != MATCH_ALL:

         languages = set()

         for language_tag in conv_language_tags:

             dialect = language_util.Dialect.parse(language_tag)

             languages.add(dialect.language)

         pipeline_languages = languages


     if stt_language_tags:

         languages = set()

         for language_tag in stt_language_tags:

             dialect = language_util.Dialect.parse(language_tag)

             languages.add(dialect.language)

         if pipeline_languages is not None:

             pipeline_languages = language_util.intersect(pipeline_languages, languages)

         else:

             pipeline_languages = languages


     if tts_language_tags:

         languages = set()

         for language_tag in tts_language_tags:

             dialect = language_util.Dialect.parse(language_tag)

             languages.add(dialect.language)

         if pipeline_languages is not None:

             pipeline_languages = language_util.intersect(pipeline_languages, languages)

         else:

             pipeline_languages = languages


     connection.send_result(

         msg["id"],

         {

             "languages": (

                 sorted(pipeline_languages) if pipeline_languages else pipeline_languages

             )

         },

     )


 @websocket_api.require_admin

 @websocket_api.websocket_command(
    {
        vol.Required("type"): "assist_pipeline/device/capture",

         vol.Required("device_id"): str,

         vol.Required("timeout"): vol.All(

             # 0 < timeout <= MAX_CAPTURE_TIMEOUT

             vol.Coerce(float),

             vol.Range(min=0, min_included=False, max=MAX_CAPTURE_TIMEOUT),

         ),

     }

 )

 @websocket_api.async_response

 async def websocket_device_capture(

     hass: HomeAssistant,

     connection: websocket_api.connection.ActiveConnection,

     msg: dict[str, Any],

 ) -> None:

     """Capture raw audio from a satellite device and forward to client."""

     pipeline_data: PipelineData = hass.data[DOMAIN]

     device_id = msg["device_id"]


     # Number of seconds to record audio in wall clock time

     timeout_seconds = msg["timeout"]


     # We don't know the chunk size, so the upper bound is calculated assuming a

     # single sample (16 bits) per queue item.

     max_queue_items = (

         # +1 for None to signal end

         int(math.ceil(timeout_seconds * CAPTURE_RATE)) + 1

     )


     audio_queue = DeviceAudioQueue(queue=asyncio.Queue(maxsize=max_queue_items))


     # Running simultaneous captures for a single device will not work by design.

     # The new capture will cause the old capture to stop.

     if (

         old_audio_queue := pipeline_data.device_audio_queues.pop(device_id, None)

     ) is not None:

         with contextlib.suppress(asyncio.QueueFull):

             # Signal other websocket command that we're taking over

             old_audio_queue.queue.put_nowait(None)


     # Only one client can be capturing audio at a time

     pipeline_data.device_audio_queues[device_id] = audio_queue


     def clean_up_queue() -> None:

         # Clean up our audio queue

         maybe_audio_queue = pipeline_data.device_audio_queues.get(device_id)

         if (maybe_audio_queue is not None) and (maybe_audio_queue.id == audio_queue.id):

             # Only pop if this is our queue

             pipeline_data.device_audio_queues.pop(device_id)


     # Unsubscribe cleans up queue

     connection.subscriptions[msg["id"]] = clean_up_queue


     # Audio will follow as events

     connection.send_result(msg["id"])


     # Record to logbook

     hass.bus.async_fire(

         EVENT_RECORDING,

         {

             ATTR_DEVICE_ID: device_id,

             ATTR_SECONDS: timeout_seconds,

         },

     )


     try:

         with contextlib.suppress(TimeoutError):

             async with asyncio.timeout(timeout_seconds):

                 while True:

                     # Send audio chunks encoded as base64

                     audio_bytes = await audio_queue.queue.get()

                     if audio_bytes is None:

                         # Signal to stop

                         break


                     connection.send_event(

                         msg["id"],

                         {

                             "type": "audio",

                             "rate": CAPTURE_RATE,  # hertz

                             "width": CAPTURE_WIDTH,  # bytes

                             "channels": CAPTURE_CHANNELS,

                             "audio": base64.b64encode(audio_bytes).decode("ascii"),

                         },

                     )


         # Capture has ended

         connection.send_event(

             msg["id"], {"type": "end", "overflow": audio_queue.overflow}

         )

     finally:

         clean_up_queue()

 homeassistant.components.assist_pipeline.pipeline.AudioSettings
Definition: pipeline.py:499

homeassistant.components.assist_pipeline.pipeline.DeviceAudioQueue
Definition: pipeline.py:1787

homeassistant.components.assist_pipeline.pipeline.PipelineEvent
Definition: pipeline.py:379

homeassistant.components.assist_pipeline.pipeline.PipelineInput
Definition: pipeline.py:1360

homeassistant.components.assist_pipeline.pipeline.PipelineRun
Definition: pipeline.py:536

homeassistant.components.assist_pipeline.pipeline.PipelineStage
Definition: pipeline.py:451

homeassistant.components.assist_pipeline.pipeline.WakeWordSettings
Definition: pipeline.py:488

homeassistant.components.stt.models.SpeechMetadata
Definition: models.py:16

homeassistant.components.websocket_api.connection.ActiveConnection
Definition: connection.py:39

homeassistant.components.apcupsd.const.int
int
Definition: const.py:6

homeassistant.components.assist_pipeline.pipeline.async_get_pipeline
Pipeline async_get_pipeline(HomeAssistant hass, str|None pipeline_id=None)
Definition: pipeline.py:282

homeassistant.components.assist_pipeline.websocket_api.websocket_run
None websocket_run(HomeAssistant hass, websocket_api.ActiveConnection connection, dict[str, Any] msg)
Definition: websocket_api.py:128

homeassistant.components.assist_pipeline.websocket_api.websocket_list_languages
None websocket_list_languages(HomeAssistant hass, websocket_api.connection.ActiveConnection connection, dict[str, Any] msg)
Definition: websocket_api.py:392

homeassistant.components.assist_pipeline.websocket_api.websocket_device_capture
None websocket_device_capture(HomeAssistant hass, websocket_api.connection.ActiveConnection connection, dict[str, Any] msg)
Definition: websocket_api.py:457

homeassistant.components.assist_pipeline.websocket_api.websocket_get_run
None websocket_get_run(HomeAssistant hass, websocket_api.connection.ActiveConnection connection, dict[str, Any] msg)
Definition: websocket_api.py:352

homeassistant.components.assist_pipeline.websocket_api.websocket_list_runs
None websocket_list_runs(HomeAssistant hass, websocket_api.connection.ActiveConnection connection, dict[str, Any] msg)
Definition: websocket_api.py:285

homeassistant.components.assist_pipeline.websocket_api.websocket_list_devices
None websocket_list_devices(HomeAssistant hass, websocket_api.connection.ActiveConnection connection, dict[str, Any] msg)
Definition: websocket_api.py:321

homeassistant.components.assist_pipeline.websocket_api.async_register_websocket_api
None async_register_websocket_api(HomeAssistant hass)
Definition: websocket_api.py:55

homeassistant.components.config.view.get
web.Response get(self, web.Request request, str config_key)
Definition: view.py:88

homeassistant.components
Definition: __init__.py:1

homeassistant.const
Definition: const.py:1

homeassistant.core
Definition: core.py:1

homeassistant.helpers
Definition: __init__.py:1

homeassistant.util
Definition: __init__.py:1