Clean

vllm-project · DarkLight1337 · Aug 9, 2024 · Aug 7, 2024 · Aug 7, 2024 · Aug 7, 2024
commit 76af1724f5f18aa4f3a31fb7c212b9158567163e
diff --git a/vllm/engine/async_llm_engine.py b/vllm/engine/async_llm_engine.py
@@ -13,7 +13,8 @@
 from vllm.core.scheduler import SchedulerOutputs
 from vllm.engine.arg_utils import AsyncEngineArgs
 from vllm.engine.async_timeout import asyncio_timeout
-from vllm.engine.llm_engine import LLMEngine
+from vllm.engine.llm_engine import (DecoderPromptComponents, LLMEngine,
+                                    PromptComponents)
 from vllm.engine.metrics import StatLoggerBase
 from vllm.executor.executor_base import ExecutorAsyncBase
 from vllm.executor.ray_utils import initialize_ray_cluster, ray
@@ -22,7 +23,6 @@
 from vllm.inputs.parse import is_explicit_encoder_decoder_prompt
 from vllm.logger import init_logger
 from vllm.lora.request import LoRARequest
-from vllm.multimodal import MultiModalDataDict
 from vllm.outputs import EmbeddingRequestOutput, RequestOutput
 from vllm.pooling_params import PoolingParams
 from vllm.prompt_adapter.request import PromptAdapterRequest
@@ -314,7 +314,7 @@ async def _extract_prompt_components_async(
         inputs: SingletonPromptInputs,
         request_id: str,
         lora_request: Optional[LoRARequest] = None,
-    ) -> Tuple[Optional[str], List[int], Optional[MultiModalDataDict]]:
+    ) -> PromptComponents:
         """Async version of :meth:`_extract_prompt_components`."""
         if isinstance(inputs, str):
             prompt = inputs
@@ -349,50 +349,36 @@ async def _process_encoder_decoder_prompt_async(
         request_id: str,
     ) -> EncoderDecoderLLMInputs:
         """Async version of :meth:`_process_encoder_decoder_prompt`."""
+        encoder_comps: PromptComponents
+        decoder_comps: DecoderPromptComponents
+
         if is_explicit_encoder_decoder_prompt(inputs):
             encoder_task = self._extract_prompt_components_async(
                 inputs["encoder_prompt"],
                 request_id=request_id,
             )
 
-            decoder_input = inputs["decoder_prompt"]
-            if decoder_input is None:
-                (
-                    encoder_prompt,
-                    encoder_prompt_ids,
-                    encoder_mm_data,
-                ) = await encoder_task
-
-                (
-                    decoder_prompt,
-                    decoder_prompt_ids,
-                    decoder_mm_data,
-                ) = None, None, None
+            if (decoder_input := inputs["decoder_prompt"]) is None:
+                encoder_comps = await encoder_task
+                decoder_comps = None, None, None
             else:
                 decoder_task = self._extract_prompt_components_async(
                     decoder_input,
                     request_id=request_id,
                 )
 
-                # NOTE: mypy crashes without the intermediate assignment to
-                # (a, b)
-                (
-                    (encoder_prompt, encoder_prompt_ids, encoder_mm_data),
-                    (decoder_prompt, decoder_prompt_ids, decoder_mm_data),
-                ) = a, b = await asyncio.gather(encoder_task, decoder_task)
+                encoder_comps, decoder_comps = await asyncio.gather(
+                    encoder_task, decoder_task)
         else:
-            (
-                encoder_prompt,
-                encoder_prompt_ids,
-                encoder_mm_data,
-            ) = await self._extract_prompt_components_async(
+            encoder_comps = await self._extract_prompt_components_async(
                 inputs,
                 request_id=request_id,
             )
 
-            decoder_prompt_ids = encoder_prompt_ids
-            decoder_prompt = encoder_prompt
-            decoder_mm_data = encoder_mm_data
+            decoder_comps = encoder_comps
+
+        encoder_prompt, encoder_prompt_ids, encoder_mm_data = encoder_comps
+        decoder_prompt, decoder_prompt_ids, decoder_mm_data = decoder_comps
 
         if encoder_mm_data is not None or decoder_mm_data is not None:
             raise ValueError("Multi-modal data is not supported for "

diff --git a/vllm/engine/llm_engine.py b/vllm/engine/llm_engine.py
@@ -70,6 +70,11 @@ def _load_generation_config_dict(model_config: ModelConfig) -> Dict[str, Any]:
 
 _O = TypeVar("_O", RequestOutput, EmbeddingRequestOutput)
 
+PromptComponents = Tuple[Optional[str], List[int],
+                         Optional[MultiModalDataDict]]
+DecoderPromptComponents = Tuple[Optional[str], Optional[List[int]],
+                                Optional[MultiModalDataDict]]
+
 
 class LLMEngine:
     """An LLM engine that receives requests and generates texts.
@@ -690,7 +695,7 @@ def _extract_prompt_components(
         inputs: SingletonPromptInputs,
         request_id: str,
         lora_request: Optional[LoRARequest] = None,
-    ) -> Tuple[Optional[str], List[int], Optional[MultiModalDataDict]]:
+    ) -> PromptComponents:
         '''
         Extract the components of any single encoder or decoder input prompt.
 
@@ -820,45 +825,32 @@ def _process_encoder_decoder_prompt(
         * :class:`EncoderDecoderLLMInputs` instance
         '''
 
+        encoder_comps: PromptComponents
+        decoder_comps: DecoderPromptComponents
+
         if is_explicit_encoder_decoder_prompt(inputs):
-            (
-                encoder_prompt,
-                encoder_prompt_ids,
-                encoder_mm_data,
-            ) = self._extract_prompt_components(
+            encoder_comps = self._extract_prompt_components(
                 inputs["encoder_prompt"],
                 request_id=request_id,
             )
 
-            decoder_input = inputs["decoder_prompt"]
-            if decoder_input is None:
-                (
-                    decoder_prompt,
-                    decoder_prompt_ids,
-                    decoder_mm_data,
-                ) = None, None, None
+            if (decoder_input := inputs["decoder_prompt"]) is None:
+                decoder_comps = None, None, None
             else:
-                (
-                    decoder_prompt,
-                    decoder_prompt_ids,
-                    decoder_mm_data,
-                ) = self._extract_prompt_components(
+                decoder_comps = self._extract_prompt_components(
                     decoder_input,
                     request_id=request_id,
                 )
         else:
-            (
-                encoder_prompt,
-                encoder_prompt_ids,
-                encoder_mm_data,
-            ) = self._extract_prompt_components(
+            encoder_comps = self._extract_prompt_components(
                 inputs,
                 request_id=request_id,
             )
 
-            decoder_prompt_ids = encoder_prompt_ids
-            decoder_prompt = encoder_prompt
-            decoder_mm_data = encoder_mm_data
+            decoder_comps = encoder_comps
+
+        encoder_prompt, encoder_prompt_ids, encoder_mm_data = encoder_comps
+        decoder_prompt, decoder_prompt_ids, decoder_mm_data = decoder_comps
 
         if encoder_mm_data is not None or decoder_mm_data is not None:
             raise ValueError("Multi-modal data is not supported for "