traceloop · Gmin2 · Dec 23, 2024 · Dec 23, 2024 · Dec 23, 2024 · Dec 24, 2024
diff --git a/Cargo.lock b/Cargo.lock
diff --git a/Cargo.toml b/Cargo.toml
@@ -39,3 +39,5 @@ axum-prometheus = "0.7.0"
 reqwest-streams = { version = "0.8.1", features = ["json"] }
 futures = "0.3.31"
 async-stream = "0.3.6"
+jsonwebtoken = "9.2.0"
+base64 = "0.21.7"
diff --git a/src/providers/mod.rs b/src/providers/mod.rs
@@ -3,3 +3,4 @@ pub mod azure;
 pub mod openai;
 pub mod provider;
 pub mod registry;
+pub mod vertexai;
diff --git a/src/providers/registry.rs b/src/providers/registry.rs
@@ -5,6 +5,7 @@ use std::sync::Arc;
 use crate::config::models::Provider as ProviderConfig;
 use crate::providers::{
     anthropic::AnthropicProvider, azure::AzureProvider, openai::OpenAIProvider, provider::Provider,
+    vertexai::VertexAIProvider,
 };
 
 pub struct ProviderRegistry {
@@ -20,6 +21,7 @@ impl ProviderRegistry {
                 "openai" => Arc::new(OpenAIProvider::new(config)),
                 "anthropic" => Arc::new(AnthropicProvider::new(config)),
                 "azure" => Arc::new(AzureProvider::new(config)),
+                "vertexaai" => Arc::new(VertexAIProvider::new(config)),
                 _ => continue,
             };
             providers.insert(config.key.clone(), provider);

diff --git a/src/providers/vertexai/mod.rs b/src/providers/vertexai/mod.rs
@@ -0,0 +1,4 @@
+mod models;
+mod provider;
+
+pub use provider::VertexAIProvider;
diff --git a/src/providers/vertexai/models.rs b/src/providers/vertexai/models.rs
@@ -0,0 +1,131 @@
+use crate::config::constants::default_max_tokens;
+use crate::models::chat::{ChatCompletion, ChatCompletionChoice};
+use crate::models::content::{ChatCompletionMessage, ChatMessageContent}; 
+use serde::{Deserialize, Serialize};
+
+#[derive(Deserialize, Serialize, Clone, Debug)]
+pub(crate) struct VertexAIChatCompletionRequest {
+    pub contents: Vec<VertexAIChatContent>,
+    pub model: String,
+    pub parameters: VertexAIChatParameters,
+}
+
+#[derive(Deserialize, Serialize, Clone, Debug)]
+pub(crate) struct VertexAIChatParameters {
+    #[serde(skip_serializing_if = "Option::is_none")]
+    pub temperature: Option<f32>,
+    #[serde(skip_serializing_if = "Option::is_none")]
+    pub top_p: Option<f32>,
+    #[serde(skip_serializing_if = "Option::is_none")]
+    pub max_output_tokens: Option<u32>,
+}
+
+#[derive(Deserialize, Serialize, Clone, Debug)]
+#[serde(tag = "role")]
+pub(crate) enum VertexAIChatContent {
+    #[serde(rename = "user")]
+    User(VertexAIChatContentPart),
+    #[serde(rename = "model")]
+    Model(VertexAIChatContentPart),
+}
+
+#[derive(Deserialize, Serialize, Clone, Debug)]
+pub(crate) struct VertexAIChatContentPart {
+    pub parts: Vec<VertexAIChatPart>,
+}
+
+#[derive(Deserialize, Serialize, Clone, Debug)]
+#[serde(tag = "mimeType", content = "data")]
+pub(crate) enum VertexAIChatPart {
+    #[serde(rename = "text/plain")]
+    Text(String),
+}
+
+#[derive(Deserialize, Serialize, Clone, Debug)]
+pub(crate) struct VertexAIChatCompletionResponse {
+    pub predictions: Vec<VertexAIChatPrediction>,
+}
+
+#[derive(Deserialize, Serialize, Clone, Debug)]
+pub(crate) struct VertexAIChatPrediction {
+    pub content: String,
+}
+
+impl From<crate::models::chat::ChatCompletionRequest> for VertexAIChatCompletionRequest {
+    fn from(request: crate::models::chat::ChatCompletionRequest) -> Self {
+        let mut contents = Vec::new();
+        for message in request.messages {
+            let content_parts = match message.content {
+                Some(crate::models::content::ChatMessageContent::String(text)) => {
+                    vec![VertexAIChatPart::Text(text)]
+                }
+                Some(crate::models::content::ChatMessageContent::Array(parts)) => parts
+                    .into_iter()
+                    .filter_map(|part| {
+                        if part.r#type == "text" {
+                            Some(VertexAIChatPart::Text(part.text))
+                        } else {
+                            None
+                        }
+                    })
+                    .collect(),
+                None => vec![],
+            };
+
+            let vertex_content_part = VertexAIChatContentPart {
+                parts: content_parts,
+            };
+
+            let vertex_content = match message.role.as_str() {
+                "user" => VertexAIChatContent::User(vertex_content_part),
+                "assistant" => VertexAIChatContent::Model(vertex_content_part),
+                _ => continue,
+            };
+            contents.push(vertex_content);
+        }
+
+        VertexAIChatCompletionRequest {
+            contents,
+            model: request.model,
+            parameters: VertexAIChatParameters {
+                temperature: request.temperature,
+                top_p: request.top_p,
+                max_output_tokens: request.max_tokens.or(Some(default_max_tokens())),
+            },
+        }
+    }
+}
+
+impl From<VertexAIChatCompletionResponse> for ChatCompletion {
+    fn from(response: VertexAIChatCompletionResponse) -> Self {
+        let mut choices = Vec::new();
+        for (index, prediction) in response.predictions.iter().enumerate() {
+            let content = ChatMessageContent::String(prediction.content.clone());
+            let message = ChatCompletionMessage {
+                role: "assistant".to_string(),
+                content: Some(content),
+                name: None,
+                tool_calls: None,
+            };
+
+            choices.push(ChatCompletionChoice {
+                index: index as u32,
+                message: message,
+                finish_reason: Some("stop".to_string()),
+                logprobs: None,
+            });
+        }
+
+        ChatCompletion {
+            // Generate a UUID since Vertex AI does not provide an ID.
+            id: uuid::Uuid::new_v4().to_string(), 
+            object: None,
+            created: None,
+            model: "".to_string(),
+            choices,
+            // Vertex AI does not return usage.
+            usage: crate::models::usage::Usage::default(),
+            system_fingerprint: None,
+        }
+    }
+}