ZettaAI · dodamih · Nov 6, 2023 · Oct 12, 2023
diff --git a/specs/dodam/warp_zfish_subchunkable_example.cue b/specs/dodam/warp_zfish_subchunkable_example.cue
@@ -13,7 +13,7 @@
 	}
 
 	start_coord: [4096 * 3, 4096 * 4, 3003]
-	end_coord: [12288 * 2, 12288 * 2, 3011]
+	end_coord: [12288 * 2, 12288 * 2, 3006]
 	coord_resolution: [16, 16, 30]
 
 	dst_resolution: [32, 32, 30]
@@ -24,7 +24,7 @@
 	//processing_crop_pads: [[0, 0, 0], [16, 16, 0], [32, 32, 0]]
 	//processing_blend_pads: [[0, 0, 0], [0, 0, 0], [16, 16, 0]]
 	//level_intermediaries_dirs: [#TEMP_PATH2, #TEMP_PATH1, #TEMP_PATH0]
-	processing_chunk_sizes: [[8192, 8192, 1], [2048, 2048, 1]]
+	processing_chunk_sizes: [[1024, 1024, 1], [512, 512, 1]]
 	processing_crop_pads: [[0, 0, 0], [16, 16, 0]]
 	processing_blend_pads: [[0, 0, 0], [16, 16, 0]]
 	processing_blend_modes: "quadratic"
@@ -62,10 +62,11 @@
 "@type": "mazepa.execute_locally"
 target:
 		#FLOW_TMPL
-num_procs: 4
+num_procs: 32
 semaphores_spec: {
-	read:  4
-	write: 4
-	cuda:  4
-	cpu:   4
+	read:  8
+	write: 8
+	cuda:  8
+	cpu:   8
 }
+debug: false
diff --git a/specs/dodam/warp_zfish_subchunkable_example_remote.cue b/specs/dodam/warp_zfish_subchunkable_example_remote.cue
@@ -60,19 +60,20 @@
 }
 
 "@type":         "mazepa.execute_on_gcp_with_sqs"
-worker_image:    "us.gcr.io/zetta-research/zetta_utils:dodam_subchunkable_parallel"
-worker_replicas: 16
+worker_image:    "us.gcr.io/zetta-research/zetta_utils:dodam-dev"
+worker_replicas: 4
 
 worker_resources: {
 	"nvidia.com/gpu": "1"
 }
 
-local_test: false
-num_procs:  4
+num_procs: 4
 semaphores_spec: {
 	read:  4
 	write: 4
-	cuda:  4
+	cuda:  1
 	cpu:   4
 }
-target: #FLOW_TMPL
+target:     #FLOW_TMPL
+debug:      false
+local_test: false
diff --git a/tests/unit/common/test_multiprocessing.py b/tests/unit/common/test_multiprocessing.py
diff --git a/tests/unit/mazepa/test_end_to_end_workflow_sqs.py b/tests/unit/mazepa/test_end_to_end_workflow_sqs.py
@@ -11,7 +11,7 @@
 from zetta_utils.mazepa.tasks import _TaskableOperation
 from zetta_utils.message_queues.sqs.queue import SQSQueue
 
-from ..message_queues.test_sqs_queue import aws_credentials, sqs_endpoint
+from ..message_queues.sqs.test_queue import aws_credentials, sqs_endpoint
 
 boto3.setup_default_session()
 

diff --git a/tests/unit/common/test_semaphores.py → tests/unit/mazepa/test_semaphores.py b/tests/unit/common/test_semaphores.py → tests/unit/mazepa/test_semaphores.py
@@ -6,7 +6,7 @@
 import posix_ipc
 import pytest
 
-from zetta_utils.common.semaphores import (
+from zetta_utils.mazepa.semaphores import (
     DummySemaphore,
     SemaphoreType,
     configure_semaphores,
@@ -21,7 +21,7 @@ def cleanup_semaphores():
     sema_types: List[SemaphoreType] = ["read", "write", "cuda", "cpu"]
     for name in sema_types:
         try:
-            # two unlinks in case parent semaphore exists
+            # two unlinks in case grandparent semaphore exists
             semaphore(name).unlink()
             semaphore(name).unlink()
         except:

diff --git a/tests/unit/message_queues/file/__init__.py b/tests/unit/message_queues/file/__init__.py
diff --git a/tests/unit/message_queues/file/test_queue.py b/tests/unit/message_queues/file/test_queue.py
@@ -0,0 +1,73 @@
+import time
+
+import pytest
+
+from zetta_utils.message_queues.file.queue import FileQueue
+
+
+def success_fn():
+    return "Success"
+
+
+def test_make_and_delete_file_queue():
+    with FileQueue("test_queue"):
+        pass
+
+
+def test_get_tq_queue():
+    with FileQueue("test_queue"):
+        FileQueue("test_queue")._get_tq_queue()  # pylint:disable = protected-access
+
+
+def test_push_pull():
+    with FileQueue("test_queue") as q:
+        payloads = {None, 1, "asdfadsfdsa", success_fn}
+        q.push(list(payloads))
+        time.sleep(0.1)
+        result = q.pull(max_num=len(payloads))
+        assert len(result) == len(payloads)
+        received_payloads = {r.payload for r in result}
+        assert received_payloads == payloads
+
+
+def test_delete():
+    with FileQueue("test_queue") as q:
+        q.push([None])
+        time.sleep(0.1)
+        result = q.pull(max_num=10)
+        assert len(result) == 1
+        result[0].acknowledge_fn()
+        time.sleep(1.1)
+        result_empty = q.pull()
+        assert len(result_empty) == 0
+
+
+def test_extend_lease():
+    with FileQueue("test_queue") as q:
+        q.push([None])
+        time.sleep(0.1)
+        result = q.pull()
+        assert len(result) == 1
+        result[0].extend_lease_fn(3)
+        time.sleep(1)
+        result_empty = q.pull()
+        assert len(result_empty) == 0
+        time.sleep(2.1)
+        result_nonempty = q.pull()
+        assert len(result_nonempty) == 1
+
+
+@pytest.mark.parametrize(
+    "queue_name", ["fq://test_queue", "file://test_queue", "sqs://test_queue"]
+)
+def test_prefix_exc(queue_name):
+    with pytest.raises(ValueError):
+        with FileQueue(queue_name):
+            pass
+
+
+def test_double_init_exc():
+    with pytest.raises(RuntimeError):
+        with FileQueue("test_queue"):
+            with FileQueue("test_queue"):
+                pass
diff --git a/tests/unit/message_queues/sqs/__init__.py b/tests/unit/message_queues/sqs/__init__.py
diff --git a/tests/unit/message_queues/test_sqs_queue.py → tests/unit/message_queues/sqs/test_queue.py b/tests/unit/message_queues/test_sqs_queue.py → tests/unit/message_queues/sqs/test_queue.py
diff --git a/zetta_utils/cloud_management/resource_allocation/k8s/common.py b/zetta_utils/cloud_management/resource_allocation/k8s/common.py
@@ -10,7 +10,7 @@
 
 from kubernetes import client as k8s_client  # type: ignore
 from zetta_utils import builder, log
-from zetta_utils.common import SemaphoreType
+from zetta_utils.mazepa import SemaphoreType
 
 from .eks import eks_cluster_data
 from .gke import gke_cluster_data
@@ -68,7 +68,7 @@ def get_mazepa_worker_command(
     result = (
         """
     zetta -vv -l try run -s '{
-        "@type": "mazepa.run_worker"
+        "@type": "mazepa.run_worker_manager"
     """
         + f"task_queue: {json.dumps(task_queue_spec)}\n"
         + f"outcome_queue: {json.dumps(outcome_queue_spec)}\n"

diff --git a/zetta_utils/cloud_management/resource_allocation/k8s/deployment.py b/zetta_utils/cloud_management/resource_allocation/k8s/deployment.py
@@ -9,7 +9,7 @@
 
 from kubernetes import client as k8s_client  # type: ignore
 from zetta_utils import builder, log
-from zetta_utils.common import SemaphoreType
+from zetta_utils.mazepa import SemaphoreType
 
 from ..resource_tracker import (
     ExecutionResource,

diff --git a/zetta_utils/common/__init__.py b/zetta_utils/common/__init__.py
@@ -11,5 +11,3 @@
 from .pprint import lrpad
 from .signal_handlers import custom_signal_handler_ctx
 from .timer import RepeatTimer
-from .semaphores import SemaphoreType, configure_semaphores, semaphore
-from .multiprocessing import setup_persistent_process_pool, get_persistent_process_pool
diff --git a/zetta_utils/common/multiprocessing.py b/zetta_utils/common/multiprocessing.py
diff --git a/zetta_utils/common/path.py b/zetta_utils/common/path.py
@@ -11,10 +11,15 @@ def abspath(path: str) -> str:
     path_no_prefix = split[-1]
     if len(prefixes) == 0:
         prefixes = ["file"]
-    if prefixes == ["file"]:
+    if prefixes in (["file"], ["fq"]):
         path_no_prefix = os.path.abspath(os.path.expanduser(path_no_prefix))
     return "://".join(prefixes + [path_no_prefix])
 
 
+def strip_prefix(path: str) -> str:  # pragma: no cover
+    return path.split("://")[-1]
+
+
 def is_local(path: str) -> bool:  # pragma: no cover
-    return abspath(path).startswith("file://")
+    local_prefixes = ["file://", "fq://"]
+    return any(abspath(path).startswith(local_prefix) for local_prefix in local_prefixes)
diff --git a/zetta_utils/convnet/utils.py b/zetta_utils/convnet/utils.py
@@ -40,7 +40,7 @@ def _load_model(
     return result
 
 
-_load_model_cached = cachetools.cached(cachetools.LRUCache(maxsize=8))(_load_model)
+_load_model_cached = cachetools.cached(cachetools.LRUCache(maxsize=2))(_load_model)
 
 
 @typechecked

diff --git a/zetta_utils/layer/volumetric/cloudvol/backend.py b/zetta_utils/layer/volumetric/cloudvol/backend.py
@@ -113,7 +113,7 @@ def _set_cv_defaults(self):
         self.cv_kwargs.setdefault("progress", False)
         self.cv_kwargs.setdefault("autocrop", False)
         self.cv_kwargs.setdefault("non_aligned_writes", False)
-        self.cv_kwargs.setdefault("cache", not self.is_local)
+        self.cv_kwargs.setdefault("cache", False)
         self.cv_kwargs.setdefault("compress_cache", False)
         self.cv_kwargs.setdefault("compress", True)
         self.cv_kwargs.setdefault("cdn_cache", False)
@@ -195,7 +195,6 @@ def clear_disk_cache(self) -> None:  # pragma: no cover
 
     def clear_cache(self) -> None:  # pragma: no cover
         _clear_cv_cache(self.path)
-        self.clear_disk_cache()
 
     def read(self, idx: VolumetricIndex) -> torch.Tensor:
         # Data out: cxyz

diff --git a/zetta_utils/mazepa/__init__.py b/zetta_utils/mazepa/__init__.py
@@ -29,3 +29,4 @@
 from .progress_tracker import progress_ctx_mngr
 from .execution import Executor, execute
 from .worker import run_worker
+from .semaphores import SemaphoreType, configure_semaphores, semaphore
diff --git a/zetta_utils/mazepa/autoexecute_task_queue.py b/zetta_utils/mazepa/autoexecute_task_queue.py
@@ -6,7 +6,6 @@
 from typeguard import typechecked
 
 from zetta_utils import log
-from zetta_utils.common import get_persistent_process_pool
 from zetta_utils.mazepa.worker import process_task_message
 from zetta_utils.message_queues.base import MessageQueue, ReceivedMessage
 
@@ -23,7 +22,6 @@ class AutoexecuteTaskQueue(MessageQueue):
     tasks_todo: list[Task] = attrs.field(init=False, factory=list)
     debug: bool = False
     handle_exceptions: bool = False
-    parallel_if_pool_exists: bool = False
 
     def push(self, payloads: Iterable[Task]):
         # TODO: Fix progress bar issue with multiple live displays in rich
@@ -40,27 +38,9 @@ def pull(
         if len(self.tasks_todo) == 0:
             return []
         else:
-            pool = get_persistent_process_pool()
-            if not self.parallel_if_pool_exists or pool is None:
-                results: list[ReceivedMessage[OutcomeReport]] = []
-                for task in self.tasks_todo[:max_num]:
-                    results.append(execute_task(task, self.debug, self.handle_exceptions))
-            # TODO: remove monkey patching from builder so that unit tests work;
-            # pickle does not handle monkey patched objects inside Python
-            else:  # pragma: no cover
-                futures = []
-                for task in self.tasks_todo[:max_num]:
-                    futures.append(
-                        pool.schedule(
-                            execute_task,
-                            kwargs={
-                                "task": task,
-                                "debug": self.debug,
-                                "handle_exceptions": self.handle_exceptions,
-                            },
-                        )
-                    )
-                results = [future.result() for future in futures]
+            results: list[ReceivedMessage[OutcomeReport]] = []
+            for task in self.tasks_todo[:max_num]:
+                results.append(execute_task(task, self.debug, self.handle_exceptions))
             self.tasks_todo = self.tasks_todo[max_num:]
             return results