Classification

Bases: BaseModel

Use a foundation classification model to auto-label data.

Source code in autodistill/classification/classification_base_model.py

@dataclass
class ClassificationBaseModel(BaseModel):
    """
    Use a foundation classification model to auto-label data.
    """

    ontology: CaptionOntology

    @abstractmethod
    def predict(self, input: str) -> sv.Classifications:
        """
        Run inference on the model.
        """
        pass

    def label(
        self,
        input_folder: str,
        extension: str = ".jpg",
        output_folder: str | None = None,
    ) -> sv.ClassificationDataset:
        """
        Label a dataset and save it in a classification folder structure.
        """
        if output_folder is None:
            output_folder = input_folder + "_labeled"

        os.makedirs(output_folder, exist_ok=True)

        image_paths = glob.glob(input_folder + "/*" + extension)
        detections_map = {}

        progress_bar = tqdm(image_paths, desc="Labeling images")
        for f_path in progress_bar:
            progress_bar.set_description(desc=f"Labeling {f_path}", refresh=True)

            detections = self.predict(f_path)
            detections_map[f_path] = detections

        dataset = sv.ClassificationDataset(
            self.ontology.classes(), image_paths, detections_map
        )

        train_cs, test_cs = dataset.split(
            split_ratio=0.7, random_state=None, shuffle=True
        )
        test_cs, valid_cs = test_cs.split(
            split_ratio=0.5, random_state=None, shuffle=True
        )

        train_cs.as_folder_structure(root_directory_path=output_folder + "/train")

        test_cs.as_folder_structure(root_directory_path=output_folder + "/test")

        valid_cs.as_folder_structure(root_directory_path=output_folder + "/valid")

        print("Labeled dataset created - ready for distillation.")
        return dataset

`label(input_folder, extension='.jpg', output_folder=None)` ¶

Label a dataset and save it in a classification folder structure.

Source code in autodistill/classification/classification_base_model.py

def label(
    self,
    input_folder: str,
    extension: str = ".jpg",
    output_folder: str | None = None,
) -> sv.ClassificationDataset:
    """
    Label a dataset and save it in a classification folder structure.
    """
    if output_folder is None:
        output_folder = input_folder + "_labeled"

    os.makedirs(output_folder, exist_ok=True)

    image_paths = glob.glob(input_folder + "/*" + extension)
    detections_map = {}

    progress_bar = tqdm(image_paths, desc="Labeling images")
    for f_path in progress_bar:
        progress_bar.set_description(desc=f"Labeling {f_path}", refresh=True)

        detections = self.predict(f_path)
        detections_map[f_path] = detections

    dataset = sv.ClassificationDataset(
        self.ontology.classes(), image_paths, detections_map
    )

    train_cs, test_cs = dataset.split(
        split_ratio=0.7, random_state=None, shuffle=True
    )
    test_cs, valid_cs = test_cs.split(
        split_ratio=0.5, random_state=None, shuffle=True
    )

    train_cs.as_folder_structure(root_directory_path=output_folder + "/train")

    test_cs.as_folder_structure(root_directory_path=output_folder + "/test")

    valid_cs.as_folder_structure(root_directory_path=output_folder + "/valid")

    print("Labeled dataset created - ready for distillation.")
    return dataset

`predict(input)` `abstractmethod` ¶

Run inference on the model.

Source code in autodistill/classification/classification_base_model.py

@abstractmethod
def predict(self, input: str) -> sv.Classifications:
    """
    Run inference on the model.
    """
    pass

Classification

label(input_folder, extension='.jpg', output_folder=None) ¶

predict(input) abstractmethod ¶

`label(input_folder, extension='.jpg', output_folder=None)` ¶

`predict(input)` `abstractmethod` ¶