fix(upscale_sdx4): upgrade for v3.1 nodes API

fix(upscale_sdx4): remove workaround for diffusers#4349 (fixed upstream)
Merge branch 'main' into feat/upscale4x
2024-08-30 20:32:17 +00:00 · 2023-09-16 14:21:29 -07:00 · 2023-09-16 14:15:00 -07:00 · 2023-09-16 13:55:17 -07:00 · 2023-08-16 16:11:19 -07:00 · 2023-08-16 15:06:57 -07:00
3 changed files with 176 additions and 0 deletions
--- a/invokeai/app/invocations/upscale_sdx4.py
+++ b/invokeai/app/invocations/upscale_sdx4.py
@ -0,0 +1,173 @@
+from typing import List, Union
+
+import torch
+from diffusers import StableDiffusionUpscalePipeline
+
+from invokeai.app.invocations.baseinvocation import (
+    BaseInvocation,
+    FieldDescriptions,
+    Input,
+    InputField,
+    InvocationContext,
+    UIType,
+    invocation,
+)
+from invokeai.app.invocations.image import ImageOutput
+from invokeai.app.invocations.latent import SAMPLER_NAME_VALUES, get_scheduler
+from invokeai.app.invocations.metadata import CoreMetadata
+from invokeai.app.invocations.model import UNetField, VaeField
+from invokeai.app.invocations.primitives import ConditioningField, ImageField
+from invokeai.app.models.image import ImageCategory, ResourceOrigin
+from invokeai.app.util.step_callback import stable_diffusion_step_callback
+from invokeai.backend import BaseModelType
+from invokeai.backend.stable_diffusion import ConditioningData, PipelineIntermediateState, PostprocessingSettings
+
+
+@invocation("upscale_sdx4", title="Upscale (Stable Diffusion x4)", tags=["upscale"], version="0.1.0")
+class UpscaleLatentsInvocation(BaseInvocation):
+    """Upscales an image using an upscaling diffusion model.
+
+    https://huggingface.co/stabilityai/stable-diffusion-x4-upscaler
+
+    The upscaling model is its own thing, independent of other Stable Diffusion text-to-image
+    models. We don't have ControlNet or LoRA support for it. It has its own VAE.
+    """
+
+    # Inputs
+    image: ImageField = InputField(description="The image to upscale")
+
+    positive_conditioning: ConditioningField = InputField(
+        description=FieldDescriptions.positive_cond, input=Input.Connection
+    )
+    negative_conditioning: ConditioningField = InputField(
+        description=FieldDescriptions.negative_cond, input=Input.Connection
+    )
+    steps: int = InputField(default=10, gt=0, description=FieldDescriptions.steps)
+    cfg_scale: Union[float, List[float]] = InputField(
+        default=7.5, ge=1, description=FieldDescriptions.cfg_scale, ui_type=UIType.Float
+    )
+    scheduler: SAMPLER_NAME_VALUES = InputField(default="euler", description=FieldDescriptions.scheduler)
+    seed: int = InputField(default=0, description=FieldDescriptions.seed)
+
+    unet: UNetField = InputField(description=FieldDescriptions.unet, input=Input.Connection)
+    vae: VaeField = InputField(description=FieldDescriptions.vae, input=Input.Connection)
+    metadata: CoreMetadata = InputField(default=None, description=FieldDescriptions.core_metadata)
+    tiled: bool = InputField(default=False, description=FieldDescriptions.tiled)
+
+    @torch.inference_mode()
+    def invoke(self, context: InvocationContext) -> ImageOutput:
+        image = context.services.images.get_pil_image(self.image.image_name)
+
+        model_manager = context.services.model_manager
+        unet_info = model_manager.get_model(**self.unet.unet.dict(), context=context)
+        vae_info = model_manager.get_model(**self.vae.vae.dict(), context=context)
+
+        with unet_info as unet, vae_info as vae:
+            # don't re-use the same scheduler instance for both fields
+            low_res_scheduler = get_scheduler(context, self.unet.scheduler, self.scheduler, self.seed ^ 0xFFFFFFFF)
+            scheduler = get_scheduler(context, self.unet.scheduler, self.scheduler, self.seed ^ 0xF7F7F7F7)
+
+            conditioning_data = self.get_conditioning_data(context, scheduler, unet, self.seed)
+
+            pipeline = StableDiffusionUpscalePipeline(
+                vae=vae,
+                text_encoder=None,
+                tokenizer=None,
+                unet=unet,
+                low_res_scheduler=low_res_scheduler,
+                scheduler=scheduler,
+            )
+
+            if self.tiled or context.services.configuration.tiled_decode:
+                vae.enable_tiling()
+            else:
+                vae.disable_tiling()
+
+            generator = torch.Generator().manual_seed(self.seed)
+
+            output = pipeline(
+                image=image,
+                # latents=noise,
+                num_inference_steps=self.steps,
+                guidance_scale=self.cfg_scale,
+                # noise_level =
+                generator=generator,
+                prompt_embeds=conditioning_data.text_embeddings.embeds.data,
+                negative_prompt_embeds=conditioning_data.unconditioned_embeddings.embeds.data,
+                output_type="pil",
+                callback=lambda *args: self.dispatch_upscale_progress(context, *args),
+            )
+            result_image = output.images[0]
+
+        image_dto = context.services.images.create(
+            image=result_image,
+            image_origin=ResourceOrigin.INTERNAL,
+            image_category=ImageCategory.GENERAL,
+            node_id=self.id,
+            session_id=context.graph_execution_state_id,
+            is_intermediate=self.is_intermediate,
+            metadata=self.metadata.dict() if self.metadata else None,
+            workflow=self.workflow,
+        )
+
+        return ImageOutput(
+            image=ImageField(image_name=image_dto.image_name),
+            width=image_dto.width,
+            height=image_dto.height,
+        )
+
+    def get_conditioning_data(
+        self,
+        context: InvocationContext,
+        scheduler,
+        unet,
+        seed,
+    ) -> ConditioningData:
+        # FIXME: duplicated from DenoiseLatentsInvocation.get_conditoning_data
+        positive_cond_data = context.services.latents.get(self.positive_conditioning.conditioning_name)
+        c = positive_cond_data.conditionings[0].to(device=unet.device, dtype=unet.dtype)
+        extra_conditioning_info = c.extra_conditioning
+
+        negative_cond_data = context.services.latents.get(self.negative_conditioning.conditioning_name)
+        uc = negative_cond_data.conditionings[0].to(device=unet.device, dtype=unet.dtype)
+
+        conditioning_data = ConditioningData(
+            unconditioned_embeddings=uc,
+            text_embeddings=c,
+            guidance_scale=self.cfg_scale,
+            extra=extra_conditioning_info,
+            postprocessing_settings=PostprocessingSettings(
+                threshold=0.0,  # threshold,
+                warmup=0.2,  # warmup,
+                h_symmetry_time_pct=None,  # h_symmetry_time_pct,
+                v_symmetry_time_pct=None,  # v_symmetry_time_pct,
+            ),
+        )
+
+        conditioning_data = conditioning_data.add_scheduler_args_if_applicable(
+            scheduler,
+            # for ddim scheduler
+            eta=0.0,  # ddim_eta
+            # for ancestral and sde schedulers
+            # FIXME: why do we need both a generator here and a seed argument to get_scheduler?
+            generator=torch.Generator(device=unet.device).manual_seed(seed ^ 0xFFFFFFFF),
+        )
+        return conditioning_data
+
+    def dispatch_upscale_progress(self, context, step, timestep, latents):
+        graph_execution_state = context.services.graph_execution_manager.get(context.graph_execution_state_id)
+        source_node_id = graph_execution_state.prepared_source_mapping[self.id]
+        intermediate_state = PipelineIntermediateState(
+            step=step,
+            order=1,  # FIXME: fudging this, but why does it need both order and total-steps anyway?
+            total_steps=self.steps,
+            timestep=timestep,
+            latents=latents,
+        )
+        stable_diffusion_step_callback(
+            context=context,
+            intermediate_state=intermediate_state,
+            node=self.dict(),
+            source_node_id=source_node_id,
+            base_model=BaseModelType.StableDiffusionXLRefiner,  # FIXME: this upscaler needs its own model type
+        )
--- a/invokeai/backend/model_management/model_probe.py
+++ b/invokeai/backend/model_management/model_probe.py
@ -47,6 +47,7 @@ class ModelProbe(object):
    CLASS2TYPE = {
        "StableDiffusionPipeline": ModelType.Main,
        "StableDiffusionInpaintPipeline": ModelType.Main,
+        "StableDiffusionUpscalePipeline": ModelType.Main,
        "StableDiffusionXLPipeline": ModelType.Main,
        "StableDiffusionXLImg2ImgPipeline": ModelType.Main,
        "StableDiffusionXLInpaintPipeline": ModelType.Main,
--- a/invokeai/backend/model_management/models/stable_diffusion.py
+++ b/invokeai/backend/model_management/models/stable_diffusion.py
@ -194,6 +194,8 @@ class StableDiffusion2Model(DiffusersModel):
            variant = ModelVariantType.Depth
        elif in_channels == 4:
            variant = ModelVariantType.Normal
+        elif in_channels == 7:
+            variant = ModelVariantType.Normal  # FIXME: temp kludge for 4x upscaler
        else:
            raise Exception("Unkown stable diffusion 2.* model format")
Author	SHA1	Message	Date
Kevin Turner	e06024d8ed	fix(upscale_sdx4): upgrade for v3.1 nodes API	2023-09-16 14:21:29 -07:00
Kevin Turner	caf52cfcce	fix(upscale_sdx4): remove workaround for diffusers#4349 (fixed upstream)	2023-09-16 14:15:00 -07:00
Kevin Turner	16891401c8	Merge branch 'main' into feat/upscale4x	2023-09-16 13:55:17 -07:00
Kevin Turner	5dd9eb3e9a	chore(upscale_sdx4): update for nodes #4114	2023-08-16 16:11:19 -07:00
Kevin Turner	825ff212fa	Merge branch 'main' into feat/upscale4x	2023-08-16 15:06:57 -07:00
Kevin Turner	14bd61df9d	Merge branch 'main' into feat/upscale4x	2023-08-12 12:44:18 -07:00
Kevin Turner	9b658fecd0	lint(upscale_sdx4): formatting	2023-08-07 13:15:06 -07:00
Kevin Turner	3b6a1737f4	Merge branch 'main' into feat/upscale4x	2023-08-07 13:12:17 -07:00
Kevin Turner	0e38f762ef	Merge branch 'main' into feat/upscale4x	2023-08-01 20:23:39 -07:00
Kevin Turner	3d54beab67	refactor(upscale_sdx4): bug filed upstream	2023-07-28 11:56:32 -07:00
Kevin Turner	269de738fe	stopgap(upscale_sdx4): temp kludge to allow loading upscaling model	2023-07-28 11:15:17 -07:00
Kevin Turner	34ecb06f57	refactor(upscale_sdx4): remove workaround for check_inputs bug Fixed upstream by https://github.com/huggingface/diffusers/pull/4278 before I even got to reporting it — thank you!	2023-07-28 11:14:31 -07:00
Kevin Turner	b3e3f79158	Merge remote-tracking branch 'origin/main' into feat/upscale4x	2023-07-28 11:01:20 -07:00
Kevin Turner	68cea7e5ad	Merge remote-tracking branch 'origin/main' into feat/upscale4x # Conflicts: # invokeai/backend/model_management/model_probe.py	2023-07-27 13:36:55 -07:00
Kevin Turner	a63b08721d	Merge branch 'main' into feat/upscale4x	2023-07-26 15:42:24 -07:00
Kevin Turner	9b7cb074e8	Merge remote-tracking branch 'origin/main' into feat/upscale4x	2023-07-25 21:52:04 -07:00
Kevin Turner	829721ba10	refactor(upscale_sdx4): streamlining a bit	2023-07-25 21:51:28 -07:00
Kevin Turner	5acb6af447	Merge branch 'main' into feat/upscale4x	2023-07-25 19:32:37 -07:00
Kevin Turner	19114dff3e	feat: upscale with the Stable Diffusion x4 upscaler model. [proof of concept]	2023-07-25 18:54:24 -07:00