when unlocking models, offload_unlocked_models should prune to vram limit only (#6450)

Co-authored-by: Lincoln Stein <lstein@gmail.com>
2024-08-30 20:32:17 +00:00 · 2024-05-28 23:01:21 -04:00
parent df91d1b849
commit 21a60af881
1 changed files with 1 additions and 1 deletions
--- a/invokeai/backend/model_manager/load/model_cache/model_locker.py
+++ b/invokeai/backend/model_manager/load/model_cache/model_locker.py
@ -60,5 +60,5 @@ class ModelLocker(ModelLockerBase):
        self._cache_entry.unlock()
        if not self._cache.lazy_offloading:
-            self._cache.offload_unlocked_models(self._cache_entry.size)
+            self._cache.offload_unlocked_models(0)
            self._cache.print_cuda_stats()