From 029e394eaf76a3922f5dbe83116369990e6e4ac3 Mon Sep 17 00:00:00 2001
From: Radu-Mihai Dondera <rdondera@microsoft.com>
Date: Wed, 5 Jun 2024 10:22:01 -0700
Subject: [PATCH 1/8] Honor input and label column parameters for vision tasks.

---
 .../components/model_prediction/spec.yaml     |  2 +-
 .../model_evaluation/src/image_constants.py   |  3 +-
 .../model_evaluation/src/image_dataset.py     | 63 ++++++++++---------
 .../model_evaluation/src/model_prediction.py  |  4 +-
 assets/training/model_evaluation/src/utils.py | 54 +++++++++++++---
 .../model_evaluation/src/validation.py        | 19 +++---
 6 files changed, 95 insertions(+), 50 deletions(-)

diff --git a/assets/training/model_evaluation/components/model_prediction/spec.yaml b/assets/training/model_evaluation/components/model_prediction/spec.yaml
index 3512c28af5..ee9d926a4a 100644
--- a/assets/training/model_evaluation/components/model_prediction/spec.yaml
+++ b/assets/training/model_evaluation/components/model_prediction/spec.yaml
@@ -3,7 +3,7 @@ name: model_prediction
 display_name: Model Prediction
 description: Generate predictions on a given mlflow model for supported tasks.
 
-version: 0.0.27
+version: 0.0.29
 type: command
 tags:
   type: evaluation
diff --git a/assets/training/model_evaluation/src/image_constants.py b/assets/training/model_evaluation/src/image_constants.py
index 1be2863aed..30f772883b 100644
--- a/assets/training/model_evaluation/src/image_constants.py
+++ b/assets/training/model_evaluation/src/image_constants.py
@@ -6,7 +6,8 @@
 class SettingLiterals:
     """Setting literals for classification dataset."""
 
-    LABEL_COLUMN_NAME = "label_column_name"
+    IMAGE_URL = "image_url"
+    LABEL = "label"
     MASKS_REQUIRED = "masks_required"
     USE_BG_LABEL = "use_bg_label"
     IGNORE_DATA_ERRORS = "ignore_data_errors"
diff --git a/assets/training/model_evaluation/src/image_dataset.py b/assets/training/model_evaluation/src/image_dataset.py
index e477c4fe4a..4245624e35 100644
--- a/assets/training/model_evaluation/src/image_dataset.py
+++ b/assets/training/model_evaluation/src/image_dataset.py
@@ -13,11 +13,11 @@
 
 from PIL import Image
 from torch import Tensor
-from typing import cast, Dict, Tuple
+from typing import cast, Dict, List, Tuple
 
 import constants
 
-from image_constants import SettingLiterals, ImageDataFrameParams, ODISLiterals
+from image_constants import SettingLiterals, ODISLiterals
 from logging_utilities import get_logger
 
 from azureml.automl.core.shared.constants import MLTableLiterals, MLTableDataLabel
@@ -150,13 +150,17 @@ def read_image(image_path):
 
 def get_classification_dataset(
     testing_mltable: str,
+    input_column_names: List[str],
+    label_column_name: str,
     settings: Dict = {},
     multi_label: bool = False,
-) -> AmlDatasetWrapper:
+) -> pd.DataFrame:
     """
     Return training and validation dataset for classification task from mltable.
 
-    :param testing_mltable: The training mltable path
+    :param test_mltable: The path to the prediction input mltable
+    :param input_column_names: The column names of the model inputs
+    :param label_column_name: The column name of the label
     :param settings: Settings dictionary
     :param multi_label: True if multi label classification, False otherwise
     :return: Data Frame with test image paths and labels
@@ -177,7 +181,6 @@ def get_classification_dataset(
         workspace=ws,
     )
 
-    label_column_name = settings.get(SettingLiterals.LABEL_COLUMN_NAME, None)
     test_dataset_wrapper = AmlDatasetWrapper(
         test_tabular_ds,
         multilabel=multi_label,
@@ -189,14 +192,14 @@ def get_classification_dataset(
         # labels: {test_dataset_wrapper.num_classes}"
     )
 
-    df = pd.DataFrame(columns=[ImageDataFrameParams.IMAGE_COLUMN_NAME, ImageDataFrameParams.LABEL_COLUMN_NAME])
+    df = pd.DataFrame(columns=input_column_names + [label_column_name])
     for index in range(len(test_dataset_wrapper)):
         image_path = test_dataset_wrapper.get_image_full_path(index)
         if is_valid_image(image_path):
             # sending image_paths instead of base64 encoded string as oss flavor doesnt take bytes as input.
             df = df.append({
-                ImageDataFrameParams.IMAGE_COLUMN_NAME: image_path,
-                ImageDataFrameParams.LABEL_COLUMN_NAME: test_dataset_wrapper.label_at_index(index)
+                input_column_names[0]: image_path,
+                label_column_name: test_dataset_wrapper.label_at_index(index)
             }, ignore_index=True)
 
     return df
@@ -204,23 +207,19 @@ def get_classification_dataset(
 
 def get_object_detection_dataset(
     test_mltable: str,
+    input_column_names: List[str],
+    label_column_name: str,
     settings: Dict = {},
     masks_required: bool = False,
-) -> Tuple[RuntimeDetectionDatasetAdapter, RuntimeDetectionDatasetAdapter]:
+) -> pd.DataFrame:
     """Return training and validation dataset for object detection and instance segmentation task from mltable.
 
-    :param training_mltable: The training mltable path
-    :type training_mltable: str
-    :param object_detection_dataset: The dataset adapter class name to be used for creating dataset objects.
-    :type object_detection_dataset: RuntimeDetectionDatasetAdapter
+    :param test_mltable: The path to the prediction input mltable
+    :param input_column_names: The column names of the model inputs
+    :param label_column_name: The column name of the label
     :param settings: Settings dictionary
-    :type settings: Dict
-    :param validation_mltable: The validation mltable path
-    :type validation_mltable: str
     :param masks_required: mask required or not for segmentation. Optional, default False
-    :type masks_required: bool
-    :return: Training dataset, validation dataset
-    :rtype: Tuple[RuntimeDetectionDatasetAdapter, RuntimeDetectionDatasetAdapter]
+    :return: Data Frame with test image paths and labels
     """
     mltable = _combine_mltables(test_mltable, test_mltable)
 
@@ -253,9 +252,7 @@ def get_object_detection_dataset(
         f"# test images: {len(test_dataset)}, # labels: {test_dataset.num_classes}"
     )
     test_dataset_wrapper = RuntimeDetectionDatasetAdapter(test_dataset)
-    df = pd.DataFrame(columns=[ImageDataFrameParams.IMAGE_COLUMN_NAME,
-                               ImageDataFrameParams.LABEL_COLUMN_NAME,
-                               ImageDataFrameParams.IMAGE_META_INFO])
+    df = pd.DataFrame(columns=input_column_names + [label_column_name])
 
     counter = 0
     for index in range(len(test_dataset_wrapper)):
@@ -265,29 +262,33 @@ def get_object_detection_dataset(
         if is_valid_image(image_path):
             counter += 1
             df = df.append({
-                ImageDataFrameParams.IMAGE_COLUMN_NAME: base64.encodebytes(read_image(image_path)).decode("utf-8"),
-                ImageDataFrameParams.LABEL_COLUMN_NAME: label,
-                ImageDataFrameParams.IMAGE_META_INFO: image_meta_info,
-                ImageDataFrameParams.TEXT_PROMPT: ". ".join(test_dataset.classes)
+                input_column_names[0]: base64.encodebytes(read_image(image_path)).decode("utf-8"),
+                input_column_names[1]: image_meta_info,
+                input_column_names[2]: ". ".join(test_dataset.classes),
+                label_column_name: label,
             }, ignore_index=True)
 
     logger.info(f"Total number of valid images: {counter}")
     return df
 
 
-def get_image_dataset(task_type, test_mltable, settings={}):
+def get_image_dataset(task_type, test_mltable, input_column_names, label_column_name, settings={}):
     """
     Return test dataset for image tasks from mltable.
 
-    :param testing_mltable: The training mltable path
+    :param task_type: The type of the prediction task
+    :param test_mltable: The path to the prediction input mltable
+    :param input_column_names: The column names of the model inputs
+    :param label_column_name: The column name of the label
     :param settings: Settings dictionary
-    :param multi_label: True if multi label classification, False otherwise
-    :return: Data Frame with test image paths and labels
+    :return: Data Frame with image paths and labels
     """
     if task_type in [constants.TASK.IMAGE_CLASSIFICATION, constants.TASK.IMAGE_CLASSIFICATION_MULTILABEL]:
         multi_label = True if task_type == constants.TASK.IMAGE_CLASSIFICATION_MULTILABEL else False
         return get_classification_dataset(
             testing_mltable=test_mltable,
+            input_column_names=input_column_names,
+            label_column_name=label_column_name,
             settings=settings,
             multi_label=multi_label,
         )
@@ -295,6 +296,8 @@ def get_image_dataset(task_type, test_mltable, settings={}):
         masks_required = True if task_type == constants.TASK.IMAGE_INSTANCE_SEGMENTATION else False
         return get_object_detection_dataset(
             test_mltable=test_mltable,
+            input_column_names=input_column_names,
+            label_column_name=label_column_name,
             settings=settings,
             masks_required=masks_required,
         )
diff --git a/assets/training/model_evaluation/src/model_prediction.py b/assets/training/model_evaluation/src/model_prediction.py
index 51ffb321ba..ef5027ccf7 100644
--- a/assets/training/model_evaluation/src/model_prediction.py
+++ b/assets/training/model_evaluation/src/model_prediction.py
@@ -127,7 +127,9 @@ def load_data(self, test_data):
         if self.extra_y_test_cols is not None:
             all_cols += self.extra_y_test_cols
 
-        data, file_ext = read_model_prediction_data(test_data, self.task, self.batch_size)
+        data, file_ext = read_model_prediction_data(
+            test_data, self.input_column_names, self.label_column_name, self.task, self.batch_size
+        )
         data = map(prepare_data, data, repeat(self.task), repeat(all_cols), repeat(self.label_column_name),
                    repeat(False), repeat(self.extra_y_test_cols), repeat(self.batch_size), repeat(file_ext))
         return data  # X_test, y_test
diff --git a/assets/training/model_evaluation/src/utils.py b/assets/training/model_evaluation/src/utils.py
index 620eb8b1fc..ea432957c7 100644
--- a/assets/training/model_evaluation/src/utils.py
+++ b/assets/training/model_evaluation/src/utils.py
@@ -632,11 +632,15 @@ def _get_file_extension(file_path):
     return os.path.splitext(file_path)[1].lower()
 
 
-def read_model_prediction_data(file_path, task=None, batch_size=None, nrows=None):
+def read_model_prediction_data(
+    file_path, input_column_names, label_column_name, task=None, batch_size=None, nrows=None
+):
     """Util function for reading test data for model prediction.
 
     Args:
         file_path (_type_): _description_
+        input_column_names (List[str])): Name of input columns.
+        label_column_name (str): Name of label column.
         task (_type_): _description_
         batch_size (_type_): _description_
         nrows (_type_): _description_
@@ -672,7 +676,10 @@ def read_model_prediction_data(file_path, task=None, batch_size=None, nrows=None
 
         # Read the dataset from the MLTable.
         from image_dataset import get_image_dataset
-        df = get_image_dataset(task_type=task, test_mltable=file_path)
+        df = get_image_dataset(
+            task_type=task, test_mltable=file_path,
+            input_column_names=input_column_names, label_column_name=label_column_name
+        )
         data = iter([df])
         file_ext = SupportedFileExtensions.IMAGE
 
@@ -1095,16 +1102,41 @@ def parse_input_ground_truth_col(col_name):
     return col_name, extra_cols
 
 
-def get_column_names(args, data):
-    """Get Column names from test data."""
+def get_sample_data_and_column_names(args):
+    """Get sample data and column names based on the specified arguments."""
+    data_path = args[ArgumentLiterals.DATA]
     task = args[ArgumentLiterals.TASK]
     if task in constants.IMAGE_TASKS:
-        input_column_names = [ImageDataFrameParams.IMAGE_COLUMN_NAME]
-        label_column_name = ImageDataFrameParams.LABEL_COLUMN_NAME
+        if args[ArgumentLiterals.INPUT_COLUMN_NAMES]:
+            input_column_names = args[ArgumentLiterals.INPUT_COLUMN_NAMES]
+        else:
+            if task in [constants.TASK.IMAGE_GENERATION]:
+                input_column_names = [ImageDataFrameParams.GENERATION_PROMPT]
+            else:
+                input_column_names = [ImageDataFrameParams.IMAGE_COLUMN_NAME]
+                if task in [constants.TASK.IMAGE_OBJECT_DETECTION, constants.TASK.IMAGE_INSTANCE_SEGMENTATION]:
+                    input_column_names.extend([ImageDataFrameParams.IMAGE_META_INFO, ImageDataFrameParams.TEXT_PROMPT])
+
+        if args[ArgumentLiterals.LABEL_COLUMN_NAME]:
+            if len(args[ArgumentLiterals.LABEL_COLUMN_NAME]) != 1:
+                message = "Must specify only one label column for vision tasks."
+                exception = get_azureml_exception(
+                    ArgumentValidationException, ArgumentParsingError, None, error=message
+                )
+                log_traceback(exception, logger)
+                raise exception
+
+            label_column_name = args[ArgumentLiterals.LABEL_COLUMN_NAME][0]
+        else:
+            label_column_name = ImageDataFrameParams.LABEL_COLUMN_NAME
+
         extra_y_test_cols = None
-        if task in [constants.TASK.IMAGE_OBJECT_DETECTION, constants.TASK.IMAGE_INSTANCE_SEGMENTATION]:
-            input_column_names.extend([ImageDataFrameParams.IMAGE_META_INFO, ImageDataFrameParams.TEXT_PROMPT])
+
+        sample_data, _ = read_model_prediction_data(data_path, task, input_column_names, label_column_name)
+
     else:
+        sample_data, _ = read_model_prediction_data(data_path, task, [], "", nrows=1)
+
         # If input_column_names are not sent as argument we are retaining all columns
         label_column_name = args[ArgumentLiterals.LABEL_COLUMN_NAME]
         if label_column_name is None:
@@ -1118,14 +1150,16 @@ def get_column_names(args, data):
 
         input_column_names = args[ArgumentLiterals.INPUT_COLUMN_NAMES]
         if input_column_names is None or len(input_column_names) == 0:
-            input_column_names = list(data.columns)
+            input_column_names = list(sample_data.columns)
             if label_column_name is not None and label_column_name in input_column_names:
                 input_column_names.remove(label_column_name)
             if extra_y_test_cols is not None:
                 for col in extra_y_test_cols:
                     if col in input_column_names:
                         input_column_names.remove(col)
-    return input_column_names, label_column_name, extra_y_test_cols
+
+    sample_data = list(sample_data)[0]
+    return sample_data, input_column_names, label_column_name, extra_y_test_cols
 
 
 def openai_init(llm_config, **openai_params):
diff --git a/assets/training/model_evaluation/src/validation.py b/assets/training/model_evaluation/src/validation.py
index 007bc4388e..bd665640c7 100644
--- a/assets/training/model_evaluation/src/validation.py
+++ b/assets/training/model_evaluation/src/validation.py
@@ -8,8 +8,9 @@
     ArgumentValidationException,
 )
 from constants import ALL_TASKS, TASK, ArgumentLiterals
+from image_constants import SettingLiterals
 from logging_utilities import get_logger, log_traceback, get_azureml_exception
-from utils import assert_and_raise, read_config, read_config_str, read_model_prediction_data, get_column_names
+from utils import assert_and_raise, read_config, read_config_str, get_sample_data_and_column_names
 from error_definitions import (
     InvalidTaskType,
     InvalidModel,
@@ -228,15 +229,19 @@ def validate_and_get_columns(args):
     Args:
         args (_type_): _description_
     """
-    logger.info("Reading top row in data for validation.")
-    data, _ = read_model_prediction_data(args[ArgumentLiterals.DATA], args[ArgumentLiterals.TASK], nrows=1)
-    data = list(data)[0]
-    input_column_names, label_column_name, extra_y_test_cols = get_column_names(args, data)
-
-    validate_input_column_names(input_column_names, data)
+    logger.info("Reading top row in data for column name extraction and validation.")
+    data, input_column_names, label_column_name, extra_y_test_cols = get_sample_data_and_column_names(args)
 
     task = args[ArgumentLiterals.TASK]
     config = args[ArgumentLiterals.CONFIG]
+
+    if task in constants.IMAGE_TASKS:
+        # Vision datasets must have an image_url and a label column. The input columns for model prediction will be
+        # constructed from these two (pass through in most of the cases).
+        validate_input_column_names([SettingLiterals.IMAGE_URL, SettingLiterals.LABEL], data)
+    else:
+        validate_input_column_names(input_column_names, data)
+
     if task == TASK.TEXT_GENERATION:
         if config.get(constants.TextGenerationColumns.SUBTASKKEY, "") == constants.SubTask.CODEGENERATION:
             # Ensure that user always has "," in label_col_name

From 52d814c0949266f426cab2b316580cfde429b329 Mon Sep 17 00:00:00 2001
From: Radu-Mihai Dondera <rdondera@microsoft.com>
Date: Wed, 5 Jun 2024 11:22:00 -0700
Subject: [PATCH 2/8] Bring back changes to generate MLTable for JSONL input.

---
 assets/training/model_evaluation/src/utils.py | 34 +++++++++++++++++--
 1 file changed, 32 insertions(+), 2 deletions(-)

diff --git a/assets/training/model_evaluation/src/utils.py b/assets/training/model_evaluation/src/utils.py
index 3434f8df49..7fb6cd43c4 100644
--- a/assets/training/model_evaluation/src/utils.py
+++ b/assets/training/model_evaluation/src/utils.py
@@ -12,6 +12,7 @@
 import json
 import openai
 import glob
+import tempfile
 from typing import Union
 
 from constants import (
@@ -22,7 +23,7 @@
                              get_target_from_connection,
                              get_metadata_from_connection)
 from logging_utilities import get_logger, log_traceback
-from mltable import load
+from mltable import DataType, from_json_lines_files, load
 from task_factory.base import BasePredictor
 from task_factory.tabular.classification import TabularClassifier
 from task_factory.text.classification import TextClassifier
@@ -653,6 +654,29 @@ def read_model_prediction_data(
         _type_: _description_
     """
     if task in constants.IMAGE_TASKS:
+        try:
+            # If the input file is a JSONL, then generate an MLTable for it.
+            if _get_file_extension(file_path) == ".jsonl":
+                # Make the MLTable object, converting the image_url column.
+                generated_mltable = True
+                table = from_json_lines_files([{"file": file_path}])
+                table = table.convert_column_types({"image_url": DataType.to_stream()})
+
+                # Save the MLTable object to a temporary file.
+                temporary_directory = tempfile.TemporaryDirectory()
+                file_path = temporary_directory.name
+                table.save(file_path)
+            else:
+                # The input file is an MLTable and a new MLTable does not need to be generated.
+                generated_mltable = False
+
+        except Exception as e:
+            message = "Could not generate MLTable for JSONL file."
+            exception = get_azureml_exception(DataLoaderException, BadInputData, e, error=message)
+            log_traceback(exception, logger, message)
+            raise exception
+
+        # Read the dataset from the MLTable.
         from image_dataset import get_image_dataset
         df = get_image_dataset(
             task_type=task, test_mltable=file_path,
@@ -660,8 +684,14 @@ def read_model_prediction_data(
         )
         data = iter([df])
         file_ext = SupportedFileExtensions.IMAGE
+
+        # If a new MLTable was generated, delete it.
+        if generated_mltable:
+            temporary_directory.cleanup()
+
     else:
         data, file_ext = read_data(file_path, batch_size, nrows)
+
     return data, file_ext
 
 
@@ -723,7 +753,7 @@ def read_dataframe(file_path, batch_size=None, nrows=None):
     Returns:
         _type_: _description_
     """
-    file_extension = os.path.splitext(file_path)[1].lower()
+    file_extension = _get_file_extension(file_path)
     logger.info("Detected File Format: {}".format(file_extension))
     if batch_size:
         nrows = None

From 3b3f9bc4492e067d6848bfa240adff657c476691 Mon Sep 17 00:00:00 2001
From: Radu-Mihai Dondera <rdondera@microsoft.com>
Date: Wed, 5 Jun 2024 12:50:16 -0700
Subject: [PATCH 3/8] Remove reference to image generation task.

---
 assets/training/model_evaluation/src/image_dataset.py | 2 ++
 assets/training/model_evaluation/src/utils.py         | 9 +++------
 2 files changed, 5 insertions(+), 6 deletions(-)

diff --git a/assets/training/model_evaluation/src/image_dataset.py b/assets/training/model_evaluation/src/image_dataset.py
index 4245624e35..b0a6b4ab1a 100644
--- a/assets/training/model_evaluation/src/image_dataset.py
+++ b/assets/training/model_evaluation/src/image_dataset.py
@@ -275,6 +275,8 @@ def get_object_detection_dataset(
 def get_image_dataset(task_type, test_mltable, input_column_names, label_column_name, settings={}):
     """
     Return test dataset for image tasks from mltable.
+    Important details: for vision datasets, the MLTable must have columns "image_url" and "label". For some tasks, the
+    output Pandas dataframe may have other column names to respect the model input expectations.
 
     :param task_type: The type of the prediction task
     :param test_mltable: The path to the prediction input mltable
diff --git a/assets/training/model_evaluation/src/utils.py b/assets/training/model_evaluation/src/utils.py
index 7fb6cd43c4..c1feb4a63c 100644
--- a/assets/training/model_evaluation/src/utils.py
+++ b/assets/training/model_evaluation/src/utils.py
@@ -1112,12 +1112,9 @@ def get_sample_data_and_column_names(args):
         if args[ArgumentLiterals.INPUT_COLUMN_NAMES]:
             input_column_names = args[ArgumentLiterals.INPUT_COLUMN_NAMES]
         else:
-            if task in [constants.TASK.IMAGE_GENERATION]:
-                input_column_names = [ImageDataFrameParams.GENERATION_PROMPT]
-            else:
-                input_column_names = [ImageDataFrameParams.IMAGE_COLUMN_NAME]
-                if task in [constants.TASK.IMAGE_OBJECT_DETECTION, constants.TASK.IMAGE_INSTANCE_SEGMENTATION]:
-                    input_column_names.extend([ImageDataFrameParams.IMAGE_META_INFO, ImageDataFrameParams.TEXT_PROMPT])
+            input_column_names = [ImageDataFrameParams.IMAGE_COLUMN_NAME]
+            if task in [constants.TASK.IMAGE_OBJECT_DETECTION, constants.TASK.IMAGE_INSTANCE_SEGMENTATION]:
+                input_column_names.extend([ImageDataFrameParams.IMAGE_META_INFO, ImageDataFrameParams.TEXT_PROMPT])
 
         if args[ArgumentLiterals.LABEL_COLUMN_NAME]:
             if len(args[ArgumentLiterals.LABEL_COLUMN_NAME]) != 1:

From 70eea52afef03a0117335084ae67f20fd85f7907 Mon Sep 17 00:00:00 2001
From: Radu-Mihai Dondera <rdondera@microsoft.com>
Date: Wed, 5 Jun 2024 12:59:54 -0700
Subject: [PATCH 4/8] Delint.

---
 assets/training/model_evaluation/src/image_dataset.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/assets/training/model_evaluation/src/image_dataset.py b/assets/training/model_evaluation/src/image_dataset.py
index b0a6b4ab1a..b141846f22 100644
--- a/assets/training/model_evaluation/src/image_dataset.py
+++ b/assets/training/model_evaluation/src/image_dataset.py
@@ -273,8 +273,8 @@ def get_object_detection_dataset(
 
 
 def get_image_dataset(task_type, test_mltable, input_column_names, label_column_name, settings={}):
-    """
-    Return test dataset for image tasks from mltable.
+    """Return test dataset for image tasks from mltable.
+
     Important details: for vision datasets, the MLTable must have columns "image_url" and "label". For some tasks, the
     output Pandas dataframe may have other column names to respect the model input expectations.
 

From 68ec1acdd767b4d541af3891c18fcb14d7b80d0f Mon Sep 17 00:00:00 2001
From: Radu-Mihai Dondera <rdondera@microsoft.com>
Date: Wed, 5 Jun 2024 15:14:21 -0700
Subject: [PATCH 5/8] Update call to read_model_prediction_data() in
 evaluate_model.py.

---
 assets/training/model_evaluation/src/evaluate_model.py | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/assets/training/model_evaluation/src/evaluate_model.py b/assets/training/model_evaluation/src/evaluate_model.py
index a8782d2a4c..18bfc3e3a9 100644
--- a/assets/training/model_evaluation/src/evaluate_model.py
+++ b/assets/training/model_evaluation/src/evaluate_model.py
@@ -124,7 +124,9 @@ def load_data(self, test_data, label_column_name, input_column_names=None):
         all_cols = list(input_column_names)
         if label_column_name is not None:
             all_cols += [label_column_name]
-        data, _ = read_model_prediction_data(test_data, self.task, self.batch_size)
+        data, _ = read_model_prediction_data(
+            test_data, input_column_names, label_column_name, self.task, self.batch_size
+        )
         data = map(prepare_data, data, repeat(self.task), repeat(all_cols), repeat(label_column_name),
                    repeat(False), repeat(list()), repeat(self.batch_size))
         return data  # X_test, y_test

From 04c37bf2d88fc2a319d5e90883867b2e59a9a64e Mon Sep 17 00:00:00 2001
From: Radu-Mihai Dondera <rdondera@microsoft.com>
Date: Fri, 7 Jun 2024 15:40:21 -0700
Subject: [PATCH 6/8] Delint.

---
 .../src/azureml/model/mgmt/processors/common/vision_utils.py  | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/assets/training/model_management/src/azureml/model/mgmt/processors/common/vision_utils.py b/assets/training/model_management/src/azureml/model/mgmt/processors/common/vision_utils.py
index 795c3d1810..e932e98425 100644
--- a/assets/training/model_management/src/azureml/model/mgmt/processors/common/vision_utils.py
+++ b/assets/training/model_management/src/azureml/model/mgmt/processors/common/vision_utils.py
@@ -8,9 +8,11 @@
 import pandas as pd
 import base64
 import io
+import os
 import re
 import requests
 import torch
+import uuid
 from ast import literal_eval
 import numpy as np
 
@@ -23,6 +25,7 @@
 # Uncomment the following line for mlflow debug mode
 # logging.getLogger("mlflow").setLevel(logging.DEBUG)
 
+
 def save_image(output_folder: str, img: PIL.Image.Image, format: str) -> str:
     """
     Save image in a folder designated for batch output and return image file path.
@@ -39,6 +42,7 @@ def save_image(output_folder: str, img: PIL.Image.Image, format: str) -> str:
     img.save(os.path.join(output_folder, filename), format=format)
     return filename
 
+
 def get_pil_image(image: bytes) -> PIL.Image.Image:
     """
     Convert image bytes to PIL image.

From 9bb6ea7f0f8143cfef606861c551a82e8d8718f8 Mon Sep 17 00:00:00 2001
From: Radu-Mihai Dondera <rdondera@microsoft.com>
Date: Fri, 7 Jun 2024 15:41:23 -0700
Subject: [PATCH 7/8] Delint.

---
 .../src/azureml/model/mgmt/processors/common/vision_utils.py  | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/assets/training/model_management/src/azureml/model/mgmt/processors/common/vision_utils.py b/assets/training/model_management/src/azureml/model/mgmt/processors/common/vision_utils.py
index e932e98425..e4925475f9 100644
--- a/assets/training/model_management/src/azureml/model/mgmt/processors/common/vision_utils.py
+++ b/assets/training/model_management/src/azureml/model/mgmt/processors/common/vision_utils.py
@@ -27,8 +27,8 @@
 
 
 def save_image(output_folder: str, img: PIL.Image.Image, format: str) -> str:
-    """
-    Save image in a folder designated for batch output and return image file path.
+    """Save image in a folder designated for batch output and return image file path.
+
     :param output_folder: directory path where we need to save files
     :type output_folder: str
     :param img: image object

From ddd38ec00363b9efd385e3bd1ec1a9476eee8a3a Mon Sep 17 00:00:00 2001
From: Radu-Mihai Dondera <rdondera@microsoft.com>
Date: Tue, 11 Jun 2024 09:24:03 -0700
Subject: [PATCH 8/8] Increment the version of the model evaluation pipeline.

---
 .../model_evaluation/components/pipeline_component/spec.yaml    | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/assets/training/model_evaluation/components/pipeline_component/spec.yaml b/assets/training/model_evaluation/components/pipeline_component/spec.yaml
index c53eaf41ae..7d39c31480 100644
--- a/assets/training/model_evaluation/components/pipeline_component/spec.yaml
+++ b/assets/training/model_evaluation/components/pipeline_component/spec.yaml
@@ -1,6 +1,6 @@
 $schema: https://azuremlschemas.azureedge.net/latest/pipelineComponent.schema.json
 name: model_evaluation_pipeline
-version: 0.0.28
+version: 0.0.29
 type: pipeline
 display_name: Model Evaluation Pipeline
 description: Pipeline component for model evaluation for supported tasks. \