oumi.core.inference

oumi.core.inference#

Inference module for the Oumi (Open Universal Machine Intelligence) library.

This module provides base classes for model inference in the Oumi framework.

class oumi.core.inference.BaseInferenceEngine(model_params: ModelParams, *, generation_params: GenerationParams | None = None)[source]#

Bases: ABC

Base class for running model inference.

apply_chat_template(conversation: Conversation, **tokenizer_kwargs) → str[source]#

Applies the chat template to the conversation.

Parameters:

Returns:

The conversation with the chat template applied.

Return type:

str

abstractmethod get_supported_params() → set[str][source]#

Returns a set of supported generation parameters for this engine.

Override this method in derived classes to specify which parameters are supported.

infer(input: list[Conversation] | None = None, inference_config: InferenceConfig | None = None) → list[Conversation][source]#

Runs model inference.

Parameters:

input – A list of conversations to run inference on. Optional.
inference_config – Parameters for inference. If not specified, a default config is inferred.

Returns:

Inference output.

Return type:

List[Conversation]