Fix some OOM issues with split and sub quad attention.

2025-08-02 23:14:49 +08:00 · 2023-10-25 20:17:28 -04:00
parent 7fbb217d3a
commit a373367b0c
2 changed files with 9 additions and 3 deletions
--- a/comfy/ldm/modules/attention.py
+++ b/comfy/ldm/modules/attention.py
@@ -222,9 +222,14 @@ def attention_split(q, k, v, heads, mask=None):

    mem_free_total = model_management.get_free_memory(q.device)

+    if _ATTN_PRECISION =="fp32":
+        element_size = 4
+    else:
+        element_size = q.element_size()
+
    gb = 1024 ** 3
-    tensor_size = q.shape[0] * q.shape[1] * k.shape[1] * q.element_size()
-    modifier = 3 if q.element_size() == 2 else 2.5
+    tensor_size = q.shape[0] * q.shape[1] * k.shape[1] * element_size
+    modifier = 3 if element_size == 2 else 2.5
    mem_required = tensor_size * modifier
    steps = 1