upgrades websockets and cartesia to latest versions (#729)

* upgrades websockets and cartesia to latest versions * fix lint * fix typecheck
vocodedev · Nov 15, 2024 · e054c33 · e054c33
1 parent fb8e079
commit e054c33
Show file tree

Hide file tree

Showing 8 changed files with 377 additions and 281 deletions.
diff --git a/playground/streaming/agent/websocket_user_implemented_agent.py b/playground/streaming/agent/websocket_user_implemented_agent.py
@@ -1,6 +1,6 @@
 import asyncio
 
-from websockets.server import serve
+from websockets.asyncio.server import serve
 
 from vocode.streaming.models.websocket_agent import (
     WebSocketAgentMessage,

diff --git a/poetry.lock b/poetry.lock
diff --git a/pyproject.toml b/pyproject.toml
@@ -34,7 +34,7 @@ sentry-sdk = { extras = ["fastapi"], version = "^2.3.1" }
 sounddevice = "^0.4.7"
 tiktoken = "^0.7.0"
 uvicorn = "^0.30.0"
-websockets = "^12.0"
+websockets = "^14.1"
 nltk = "^3.8.1"
 
 # LLM Providers
@@ -43,7 +43,7 @@ groq = { version = "^0.9.0", optional = true }
 # Synthesizers
 google-cloud-texttospeech = { version = "^2.16.3", optional = true }
 pvkoala = { version = "^2.0.1", optional = true }
-cartesia = { version = "^1.0.10", optional = true }
+cartesia = {version = "^1.1.0", optional = true}
 
 # Transcribers
 google-cloud-speech = { version = "^2.26.0", optional = true }

diff --git a/vocode/streaming/agent/websocket_user_implemented_agent.py b/vocode/streaming/agent/websocket_user_implemented_agent.py
@@ -3,7 +3,7 @@
 
 import websockets
 from loguru import logger
-from websockets.client import WebSocketClientProtocol, connect
+from websockets.asyncio.client import ClientConnection
 
 from vocode.streaming.agent.base_agent import (
     AgentInput,
@@ -73,10 +73,10 @@ async def _process(self) -> None:
         socket_url = self.get_agent_config().respond.url
         logger.info("Connecting to web socket agent %s", socket_url)
 
-        async with connect(socket_url) as ws:
+        async with websockets.connect(socket_url) as ws:
 
             async def sender(
-                ws: WebSocketClientProtocol,
+                ws: ClientConnection,
             ) -> None:  # sends audio to websocket
                 while not self.has_ended:
                     logger.info("Waiting for data from agent request queue")
@@ -109,7 +109,7 @@ async def sender(
 
                 logger.debug("Terminating web socket agent sender")
 
-            async def receiver(ws: WebSocketClientProtocol) -> None:
+            async def receiver(ws: ClientConnection) -> None:
                 while not self.has_ended:
                     try:
                         msg = await ws.recv()

diff --git a/vocode/streaming/synthesizer/eleven_labs_websocket_synthesizer.py b/vocode/streaming/synthesizer/eleven_labs_websocket_synthesizer.py
@@ -176,7 +176,7 @@ async def establish_websocket_listeners(self, chunk_size):
 
         async with websockets.connect(
             url,
-            extra_headers=headers,
+            additional_headers=headers,
         ) as ws:
 
             async def write() -> None:

diff --git a/vocode/streaming/transcriber/assembly_ai_transcriber.py b/vocode/streaming/transcriber/assembly_ai_transcriber.py
@@ -94,7 +94,7 @@ async def process(self):
 
         async with websockets.connect(
             URL,
-            extra_headers=(("Authorization", self.api_key),),
+            additional_headers=(("Authorization", self.api_key),),
             ping_interval=5,
             ping_timeout=20,
         ) as ws:

diff --git a/vocode/streaming/transcriber/deepgram_transcriber.py b/vocode/streaming/transcriber/deepgram_transcriber.py
@@ -8,7 +8,7 @@
 import websockets
 from loguru import logger
 from pydantic.v1 import BaseModel, Field
-from websockets.client import WebSocketClientProtocol
+from websockets.asyncio.client import ClientConnection
 
 from vocode import getenv
 from vocode.streaming.models.audio import AudioEncoding
@@ -389,16 +389,18 @@ async def process(self):
         self.audio_cursor = 0.0
         self.start_ts = now()
 
-        extra_headers = {"Authorization": f"Token {self.api_key}"}
+        additional_headers = {"Authorization": f"Token {self.api_key}"}
         deepgram_url = self.get_deepgram_url()
         logger.info(f"Connecting to Deepgram at {deepgram_url}")
 
         try:
-            async with websockets.connect(deepgram_url, extra_headers=extra_headers) as ws:
+            async with websockets.connect(
+                deepgram_url, additional_headers=additional_headers
+            ) as ws:
                 self.connected_ts = now()
 
                 async def sender(
-                    ws: WebSocketClientProtocol,
+                    ws: ClientConnection,
                 ):  # sends audio to websocket
                     byte_rate = self.get_byte_rate()
 
@@ -417,7 +419,7 @@ async def sender(
 
                     logger.debug("Terminating Deepgram transcriber sender")
 
-                async def receiver(ws: WebSocketClientProtocol):
+                async def receiver(ws: ClientConnection):
                     buffer = ""
                     buffer_avg_confidence = 0.0
                     num_buffer_utterances = 1

diff --git a/vocode/streaming/transcriber/rev_ai_transcriber.py b/vocode/streaming/transcriber/rev_ai_transcriber.py
@@ -5,7 +5,7 @@
 
 import websockets
 from loguru import logger
-from websockets.client import WebSocketClientProtocol
+from websockets.asyncio.client import ClientConnection
 
 from vocode import getenv
 from vocode.streaming.models.transcriber import (
@@ -71,7 +71,7 @@ async def _run_loop(self):
     async def process(self):
         async with websockets.connect(self.get_rev_ai_url()) as ws:
 
-            async def sender(ws: WebSocketClientProtocol):
+            async def sender(ws: ClientConnection):
                 while not self.closed:
                     try:
                         data = await asyncio.wait_for(self._input_queue.get(), 5)
@@ -81,7 +81,7 @@ async def sender(ws: WebSocketClientProtocol):
                 await ws.close()
                 logger.debug("Terminating Rev.AI transcriber sender")
 
-            async def receiver(ws: WebSocketClientProtocol):
+            async def receiver(ws: ClientConnection):
                 buffer = ""
 
                 while not self.closed: