Change attention processor apply logic

2024-08-30 20:32:17 +00:00 · 2024-07-16 20:03:29 +03:00 · 2024-07-16 20:03:29 +03:00 · cec345cb5c
commit cec345cb5c
parent 608cbe3f5c
5 changed files with 36 additions and 34 deletions
--- a/invokeai/app/invocations/denoise_latents.py
+++ b/invokeai/app/invocations/denoise_latents.py
@ -776,6 +776,7 @@ class DenoiseLatentsInvocation(BaseInvocation):
                    seed=seed,
                    scheduler_step_kwargs=scheduler_step_kwargs,
                    conditioning_data=conditioning_data,
                    attention_processor_cls=CustomAttnProcessor2_0,
                ),
                unet=None,
                scheduler=scheduler,
@ -797,8 +798,9 @@ class DenoiseLatentsInvocation(BaseInvocation):
            assert isinstance(unet_info.model, UNet2DConditionModel)
            with (
                unet_info.model_on_device() as (model_state_dict, unet),
                ModelPatcher.patch_unet_attention_processor(unet, denoise_ctx.inputs.attention_processor_cls),
                # ext: controlnet
-                ext_manager.patch_attention_processor(unet, CustomAttnProcessor2_0),
+                ext_manager.patch_extensions(unet),
                # ext: freeu, seamless, ip adapter, lora
                ext_manager.patch_unet(model_state_dict, unet),
            ):
--- a/invokeai/backend/model_patcher.py
+++ b/invokeai/backend/model_patcher.py
@ -5,7 +5,7 @@ from __future__ import annotations
 import pickle
 from contextlib import contextmanager
-from typing import Any, Dict, Generator, Iterator, List, Optional, Tuple, Union
+from typing import Any, Dict, Generator, Iterator, List, Optional, Tuple, Type, Union
 import numpy as np
 import torch
@ -32,8 +32,27 @@ with LoRAHelper.apply_lora_unet(unet, loras):
 """
 # TODO: rename smth like ModelPatcher and add TI method?
 class ModelPatcher:
    @staticmethod
    @contextmanager
    def patch_unet_attention_processor(unet: UNet2DConditionModel, processor_cls: Type[Any]):
        """A context manager that patches `unet` with the provided attention processor.
        Args:
            unet (UNet2DConditionModel): The UNet model to patch.
            processor (Type[Any]): Class which will be initialized for each key and passed to set_attn_processor(...).
        """
        unet_orig_processors = unet.attn_processors
        try:
            # create separate instance for each attention, to be able modify each attention separately
            new_attn_processors = {key: processor_cls() for key in unet_orig_processors.keys()}
            unet.set_attn_processor(new_attn_processors)
            yield None
        finally:
            unet.set_attn_processor(unet_orig_processors)
    @staticmethod
    def _resolve_lora_key(model: torch.nn.Module, lora_key: str, prefix: str) -> Tuple[str, torch.nn.Module]:
        assert "." not in lora_key
--- a/invokeai/backend/stable_diffusion/denoise_context.py
+++ b/invokeai/backend/stable_diffusion/denoise_context.py
@ -1,7 +1,7 @@
 from __future__ import annotations
 from dataclasses import dataclass, field
-from typing import TYPE_CHECKING, Any, Dict, Optional, Tuple, Union
+from typing import TYPE_CHECKING, Any, Dict, Optional, Tuple, Type, Union
 import torch
 from diffusers import UNet2DConditionModel
@ -38,6 +38,7 @@ class DenoiseInputs:
    seed: int
    timesteps: torch.Tensor
    init_timestep: torch.Tensor
    attention_processor_cls: Type[Any]
@dataclass
--- a/invokeai/backend/stable_diffusion/extensions/base.py
+++ b/invokeai/backend/stable_diffusion/extensions/base.py
@ -1,10 +1,15 @@
 from __future__ import annotations
 from contextlib import contextmanager
 from dataclasses import dataclass
-from typing import Callable, Dict, List, Optional
+from typing import TYPE_CHECKING, Callable, Dict, List, Optional
 import torch
 from diffusers import UNet2DConditionModel
 if TYPE_CHECKING:
    from invokeai.backend.stable_diffusion.denoise_context import DenoiseContext
@dataclass
 class InjectionInfo:
@ -37,7 +42,7 @@ class ExtensionBase:
            self.injections.append(InjectionInfo(**func.__inj_info__, function=func))
    @contextmanager
-    def patch_attention_processor(self, attention_processor_cls: object):
+    def patch_extension(self, context: DenoiseContext):
        yield None
    @contextmanager
--- a/invokeai/backend/stable_diffusion/extensions_manager.py
+++ b/invokeai/backend/stable_diffusion/extensions_manager.py
@ -98,39 +98,14 @@ class ExtensionsManager:
        if name in self._callbacks:
            self._callbacks[name](*args, **kwargs)
    # TODO: is there any need in such high abstarction
    # @contextmanager
    # def patch_extensions(self):
    #    exit_stack = ExitStack()
    #    try:
    #        for ext in self.extensions:
    #            exit_stack.enter_context(ext.patch_extension(self))
    #
    #        yield None
    #
    #    finally:
    #        exit_stack.close()
    @contextmanager
-    def patch_attention_processor(self, unet: UNet2DConditionModel, attn_processor_cls: object):
+    def patch_extensions(self, context: DenoiseContext):
-        unet_orig_processors = unet.attn_processors
+        with ExitStack() as exit_stack:
        exit_stack = ExitStack()
        try:
            # just to be sure that attentions have not same processor instance
            attn_procs = {}
            for name in unet.attn_processors.keys():
                attn_procs[name] = attn_processor_cls()
            unet.set_attn_processor(attn_procs)
            for ext in self.extensions:
-                exit_stack.enter_context(ext.patch_attention_processor(attn_processor_cls))
+                exit_stack.enter_context(ext.patch_extension(context))
            yield None
        finally:
            unet.set_attn_processor(unet_orig_processors)
            exit_stack.close()
    @contextmanager
    def patch_unet(self, state_dict: Dict[str, torch.Tensor], unet: UNet2DConditionModel):
        exit_stack = ExitStack()