支持视频生成时插图没必填,大幅提升视频生成速度

2025-11-07 14:09:32 +08:00
parent 514dbfaa1b
commit 8d5c578958
11 changed files with 674 additions and 330 deletions
--- a/pixelle_video/pipelines/standard.py
+++ b/pixelle_video/pipelines/standard.py
@@ -250,6 +250,14 @@ class StandardPipeline(BasePipeline):
            created_at=datetime.now()
        )
        
+        # ========== Step 0.8: Check template requirements ==========
+        template_requires_image = self._check_template_requires_image(config.frame_template)
+        if template_requires_image:
+            logger.info(f"📸 Template requires image generation")
+        else:
+            logger.info(f"⚡ Template does not require images - skipping image generation pipeline")
+            logger.info(f"   💡 Benefits: Faster generation + Lower cost + No ComfyUI dependency")
+        
        try:
            # ========== Step 1: Generate/Split narrations ==========
            if mode == "generate":
@@ -268,54 +276,61 @@ class StandardPipeline(BasePipeline):
                logger.info(f"✅ Split script into {len(narrations)} segments (by lines)")
                logger.info(f"   Note: n_scenes={n_scenes} is ignored in fixed mode")
            
-            # ========== Step 2: Generate image prompts ==========
-            self._report_progress(progress_callback, "generating_image_prompts", 0.15)
-            
-            # Override prompt_prefix if provided
-            original_prefix = None
-            if prompt_prefix is not None:
-                image_config = self.core.config.get("comfyui", {}).get("image", {})
-                original_prefix = image_config.get("prompt_prefix")
-                image_config["prompt_prefix"] = prompt_prefix
-                logger.info(f"Using custom prompt_prefix: '{prompt_prefix}'")
-            
-            try:
-                # Create progress callback wrapper for image prompt generation
-                def image_prompt_progress(completed: int, total: int, message: str):
-                    batch_progress = completed / total if total > 0 else 0
-                    overall_progress = 0.15 + (batch_progress * 0.15)
-                    self._report_progress(
-                        progress_callback,
-                        "generating_image_prompts",
-                        overall_progress,
-                        extra_info=message
+            # ========== Step 2: Generate image prompts (conditional) ==========
+            if template_requires_image:
+                self._report_progress(progress_callback, "generating_image_prompts", 0.15)
+                
+                # Override prompt_prefix if provided
+                original_prefix = None
+                if prompt_prefix is not None:
+                    image_config = self.core.config.get("comfyui", {}).get("image", {})
+                    original_prefix = image_config.get("prompt_prefix")
+                    image_config["prompt_prefix"] = prompt_prefix
+                    logger.info(f"Using custom prompt_prefix: '{prompt_prefix}'")
+                
+                try:
+                    # Create progress callback wrapper for image prompt generation
+                    def image_prompt_progress(completed: int, total: int, message: str):
+                        batch_progress = completed / total if total > 0 else 0
+                        overall_progress = 0.15 + (batch_progress * 0.15)
+                        self._report_progress(
+                            progress_callback,
+                            "generating_image_prompts",
+                            overall_progress,
+                            extra_info=message
+                        )
+                    
+                    # Generate base image prompts
+                    base_image_prompts = await generate_image_prompts(
+                        self.llm,
+                        narrations=narrations,
+                        min_words=min_image_prompt_words,
+                        max_words=max_image_prompt_words,
+                        progress_callback=image_prompt_progress
                    )
+                    
+                    # Apply prompt prefix
+                    from pixelle_video.utils.prompt_helper import build_image_prompt
+                    image_config = self.core.config.get("comfyui", {}).get("image", {})
+                    prompt_prefix_to_use = prompt_prefix if prompt_prefix is not None else image_config.get("prompt_prefix", "")
+                    
+                    image_prompts = []
+                    for base_prompt in base_image_prompts:
+                        final_prompt = build_image_prompt(base_prompt, prompt_prefix_to_use)
+                        image_prompts.append(final_prompt)
+                    
+                finally:
+                    # Restore original prompt_prefix
+                    if original_prefix is not None:
+                        image_config["prompt_prefix"] = original_prefix
                
-                # Generate base image prompts
-                base_image_prompts = await generate_image_prompts(
-                    self.llm,
-                    narrations=narrations,
-                    min_words=min_image_prompt_words,
-                    max_words=max_image_prompt_words,
-                    progress_callback=image_prompt_progress
-                )
-                
-                # Apply prompt prefix
-                from pixelle_video.utils.prompt_helper import build_image_prompt
-                image_config = self.core.config.get("comfyui", {}).get("image", {})
-                prompt_prefix_to_use = prompt_prefix if prompt_prefix is not None else image_config.get("prompt_prefix", "")
-                
-                image_prompts = []
-                for base_prompt in base_image_prompts:
-                    final_prompt = build_image_prompt(base_prompt, prompt_prefix_to_use)
-                    image_prompts.append(final_prompt)
-                
-            finally:
-                # Restore original prompt_prefix
-                if original_prefix is not None:
-                    image_config["prompt_prefix"] = original_prefix
-            
-            logger.info(f"✅ Generated {len(image_prompts)} image prompts")
+                logger.info(f"✅ Generated {len(image_prompts)} image prompts")
+            else:
+                # Skip image prompt generation
+                image_prompts = [None] * len(narrations)
+                self._report_progress(progress_callback, "preparing_frames", 0.15)
+                logger.info(f"⚡ Skipped image prompt generation (template doesn't need images)")
+                logger.info(f"   💡 Savings: {len(narrations)} LLM calls + {len(narrations)} image generations")
            
            # ========== Step 3: Create frames ==========
            for i, (narration, image_prompt) in enumerate(zip(narrations, image_prompts)):
@@ -418,4 +433,30 @@ class StandardPipeline(BasePipeline):
        except Exception as e:
            logger.error(f"❌ Video generation failed: {e}")
            raise
+    
+    def _check_template_requires_image(self, frame_template: str) -> bool:
+        """
+        Check if template requires image generation
+        
+        This is checked at pipeline level to avoid unnecessary:
+        - LLM calls (generating image_prompts)
+        - Image generation API calls
+        - ComfyUI dependency
+        
+        Args:
+            frame_template: Template path (e.g., "1080x1920/default.html")
+        
+        Returns:
+            True if template contains {{image}}, False otherwise
+        """
+        from pixelle_video.services.frame_html import HTMLFrameGenerator
+        from pixelle_video.utils.template_util import resolve_template_path
+        
+        template_path = resolve_template_path(frame_template)
+        generator = HTMLFrameGenerator(template_path)
+        
+        requires = generator.requires_image()
+        logger.debug(f"Template '{frame_template}' requires_image={requires}")
+        
+        return requires