GoogleCloudDataproc · Jeyaprakash-NK · Apr 15, 2024 · Apr 15, 2024 · Apr 16, 2024 · Apr 16, 2024
diff --git a/dataproc_jupyter_plugin/controllers/dataproc.py b/dataproc_jupyter_plugin/controllers/dataproc.py
@@ -22,7 +22,7 @@
 from dataproc_jupyter_plugin.services import dataproc
 
 
-class ClusterListController(APIHandler):
+class RuntimeController(APIHandler):
     @tornado.web.authenticated
     async def get(self):
         try:
@@ -32,25 +32,74 @@ async def get(self):
                 client = dataproc.Client(
                     await credentials.get_cached(), self.log, client_session
                 )
-                cluster_list = await client.list_clusters(page_size, page_token)
-            self.finish(json.dumps(cluster_list))
+                runtime_list = await client.list_runtime(page_size, page_token)
+            self.finish(json.dumps(runtime_list))
         except Exception as e:
-            self.log.exception("Error fetching cluster list")
+            self.log.exception(f"Error fetching runtime template list: {str(e)}")
             self.finish({"error": str(e)})
 
 
-class RuntimeController(APIHandler):
+class ClusterListController(APIHandler):
     @tornado.web.authenticated
     async def get(self):
         try:
             page_token = self.get_argument("pageToken")
             page_size = self.get_argument("pageSize")
-            async with aiohttp.ClientSession() as client_session:
-                client = dataproc.Client(
-                    await credentials.get_cached(), self.log, client_session
-                )
-                runtime_list = await client.list_runtime(page_size, page_token)
-            self.finish(json.dumps(runtime_list))
+            client = dataproc.Client(await credentials.get_cached(), self.log)
+            cluster_list = await client.list_clusters(page_size, page_token)
+            self.finish(json.dumps(cluster_list))
         except Exception as e:
-            self.log.exception(f"Error fetching runtime template list: {str(e)}")
+            self.log.exception(f"Error fetching cluster list")
+            self.finish({"error": str(e)})
+
+
+class ClusterDetailController(APIHandler):
+    @tornado.web.authenticated
+    async def get(self):
+        try:
+            cluster = self.get_argument("cluster")
+            client = dataproc.Client(await credentials.get_cached(), self.log)
+            get_cluster = await client.get_cluster_detail(cluster)
+            self.finish(json.dumps(get_cluster))
+        except Exception as e:
+            self.log.exception(f"Error fetching get cluster")
+            self.finish({"error": str(e)})
+
+
+class StopClusterController(APIHandler):
+    @tornado.web.authenticated
+    async def post(self):
+        try:
+            cluster = self.get_argument("cluster")
+            client = dataproc.Client(await credentials.get_cached(), self.log)
+            stop_cluster = await client.stop_cluster(cluster)
+            self.finish(json.dumps(stop_cluster))
+        except Exception as e:
+            self.log.exception(f"Error fetching stop cluster")
+            self.finish({"error": str(e)})
+
+
+class StartClusterController(APIHandler):
+    @tornado.web.authenticated
+    async def post(self):
+        try:
+            cluster = self.get_argument("cluster")
+            client = dataproc.Client(await credentials.get_cached(), self.log)
+            start_cluster = await client.start_cluster(cluster)
+            self.finish(json.dumps(start_cluster))
+        except Exception as e:
+            self.log.exception(f"Error fetching start cluster")
+            self.finish({"error": str(e)})
+
+
+class DeleteClusterController(APIHandler):
+    @tornado.web.authenticated
+    async def delete(self):
+        try:
+            cluster = self.get_argument("cluster")
+            client = dataproc.Client(await credentials.get_cached(), self.log)
+            delete_cluster = await client.delete_cluster(cluster)
+            self.finish(json.dumps(delete_cluster))
+        except Exception as e:
+            self.log.exception(f"Error deleting cluster")
             self.finish({"error": str(e)})
diff --git a/dataproc_jupyter_plugin/handlers.py b/dataproc_jupyter_plugin/handlers.py
@@ -193,6 +193,10 @@ def full_path(name):
         "dagRunTask": airflow.DagRunTaskController,
         "dagRunTaskLogs": airflow.DagRunTaskLogsController,
         "clusterList": dataproc.ClusterListController,
+        "clusterDetail": dataproc.ClusterDetailController,
+        "stopCluster": dataproc.StopClusterController,
+        "startCluster": dataproc.StartClusterController,
+        "deleteCluster": dataproc.DeleteClusterController,
         "runtimeList": dataproc.RuntimeController,
         "createJobScheduler": executor.ExecutorController,
         "dagList": airflow.DagListController,

diff --git a/dataproc_jupyter_plugin/services/dataproc.py b/dataproc_jupyter_plugin/services/dataproc.py
@@ -18,9 +18,15 @@
     DATAPROC_SERVICE_NAME,
 )
 
+from google.cloud import dataproc_v1 as dataproc
+import proto
+import json
+import google.oauth2.credentials as oauth2
+from google.protobuf.empty_pb2 import Empty
+
 
 class Client:
-    def __init__(self, credentials, log, client_session):
+    def __init__(self, credentials, log, client_session=None):
         self.log = log
         if not (
             ("access_token" in credentials)
@@ -40,10 +46,10 @@ def create_headers(self):
             "Authorization": f"Bearer {self._access_token}",
         }
 
-    async def list_clusters(self, page_size, page_token):
+    async def list_runtime(self, page_size, page_token):
         try:
             dataproc_url = await urls.gcp_service_url(DATAPROC_SERVICE_NAME)
-            api_endpoint = f"{dataproc_url}/v1/projects/{self.project_id}/regions/{self.region_id}/clusters?pageSize={page_size}&pageToken={page_token}"
+            api_endpoint = f"{dataproc_url}/v1/projects/{self.project_id}/locations/{self.region_id}/sessionTemplates?pageSize={page_size}&pageToken={page_token}"
             async with self.client_session.get(
                 api_endpoint, headers=self.create_headers()
             ) as response:
@@ -52,27 +58,146 @@ async def list_clusters(self, page_size, page_token):
                     return resp
                 else:
                     return {
-                        "error": f"Failed to fetch clusters: {response.status} {await response.text()}"
+                        "error": f"Failed to fetch runtimes: {response.status} {await response.text()}"
                     }
+        except Exception as e:
+            self.log.exception(f"Error fetching runtime list: {str(e)}")
+            return {"error": str(e)}
+
+    async def list_clusters(self, page_size, page_token):
+        try:
+            # Create a client
+            client = dataproc.ClusterControllerAsyncClient(
+                client_options={
+                    "api_endpoint": f"us-central1-dataproc.googleapis.com:443"
+                },
+                credentials=oauth2.Credentials(self._access_token),
+            )
+
+            # Initialize request argument(s)
+            request = dataproc.ListClustersRequest(
+                project_id=self.project_id,
+                page_size=int(page_size),
+                page_token=page_token,
+                region=self.region_id,
+            )
+
+            # Make the request
+            page_result = await client.list_clusters(request=request)
+            clusters_list = []
 
+            # Handle the response
+            async for response in page_result:
+                clusters_list.append(json.loads(proto.Message.to_json(response)))
+
+            return clusters_list
         except Exception as e:
-            self.log.exception("Error fetching cluster list")
+            self.log.exception(f"Error fetching cluster list")
             return {"error": str(e)}
 
-    async def list_runtime(self, page_size, page_token):
+    async def get_cluster_detail(self, cluster):
         try:
-            dataproc_url = await urls.gcp_service_url(DATAPROC_SERVICE_NAME)
-            api_endpoint = f"{dataproc_url}/v1/projects/{self.project_id}/locations/{self.region_id}/sessionTemplates?pageSize={page_size}&pageToken={page_token}"
-            async with self.client_session.get(
-                api_endpoint, headers=self.create_headers()
-            ) as response:
-                if response.status == 200:
-                    resp = await response.json()
-                    return resp
-                else:
-                    return {
-                        "error": f"Failed to fetch runtimes: {response.status} {await response.text()}"
-                    }
+            # Create a client
+            client = dataproc.ClusterControllerAsyncClient(
+                client_options={
+                    "api_endpoint": f"us-central1-dataproc.googleapis.com:443"
+                },
+                credentials=oauth2.Credentials(self._access_token),
+            )
+
+            # Initialize request argument(s)
+            request = dataproc.GetClusterRequest(
+                project_id=self.project_id,
+                region=self.region_id,
+                cluster_name=cluster,
+            )
+
+            # Make the request
+            response = await client.get_cluster(request=request)
+
+            # Handle the response
+            return json.loads(proto.Message.to_json(response))
         except Exception as e:
-            self.log.exception(f"Error fetching runtime list: {str(e)}")
+            self.log.exception(f"Error fetching cluster detail")
+            return {"error": str(e)}
+
+    async def stop_cluster(self, cluster):
+        try:
+            # Create a client
+            client = dataproc.ClusterControllerAsyncClient(
+                client_options={
+                    "api_endpoint": f"us-central1-dataproc.googleapis.com:443"
+                },
+                credentials=oauth2.Credentials(self._access_token),
+            )
+
+            # Initialize request argument(s)
+            request = dataproc.StopClusterRequest(
+                project_id=self.project_id,
+                region=self.region_id,
+                cluster_name=cluster,
+            )
+
+            operation = await client.stop_cluster(request=request)
+
+            response = await operation.result()
+            # Handle the response
+            return json.loads(proto.Message.to_json(response))
+        except Exception as e:
+            self.log.exception(f"Error fetching stop cluster")
+            return {"error": str(e)}
+
+    async def start_cluster(self, cluster):
+        try:
+            # Create a client
+            client = dataproc.ClusterControllerAsyncClient(
+                client_options={
+                    "api_endpoint": f"us-central1-dataproc.googleapis.com:443"
+                },
+                credentials=oauth2.Credentials(self._access_token),
+            )
+
+            # Initialize request argument(s)
+            request = dataproc.StartClusterRequest(
+                project_id=self.project_id,
+                region=self.region_id,
+                cluster_name=cluster,
+            )
+
+            operation = await client.start_cluster(request=request)
+
+            response = await operation.result()
+            # Handle the response
+            return json.loads(proto.Message.to_json(response))
+        except Exception as e:
+            self.log.exception(f"Error fetching start cluster")
+            return {"error": str(e)}
+
+    async def delete_cluster(self, cluster):
+        try:
+            # Create a client
+            client = dataproc.ClusterControllerAsyncClient(
+                client_options={
+                    "api_endpoint": f"us-central1-dataproc.googleapis.com:443"
+                },
+                credentials=oauth2.Credentials(self._access_token),
+            )
+
+            # Initialize request argument(s)
+            request = dataproc.DeleteClusterRequest(
+                project_id=self.project_id,
+                region=self.region_id,
+                cluster_name=cluster,
+            )
+
+            operation = await client.delete_cluster(request=request)
+
+            response = await operation.result()
+            # Handle the response
+            if isinstance(response, Empty):
+                return "Deleted successfully"
+            else:
+                return json.loads(proto.Message.to_json(response))
+        except Exception as e:
+            self.log.exception(f"Error deleting cluster")
             return {"error": str(e)}
diff --git a/pyproject.toml b/pyproject.toml
@@ -29,7 +29,8 @@ dependencies = [
     "pendulum>=3.0.0",
     "pydantic~=1.10.0",
     "bigframes~=0.22.0",
-    "aiohttp~=3.9.5"
+    "aiohttp~=3.9.5",
+    "google-cloud-dataproc~=5.10.2"
 ]
 dynamic = ["version", "description", "authors", "urls", "keywords"]