oumi.core.evaluation.utils

oumi.core.evaluation.utils#

Submodules#

oumi.core.evaluation.utils.platform_prerequisites module#

oumi.core.evaluation.utils.platform_prerequisites.check_prerequisites(evaluation_backend: EvaluationBackend, task_name: str | None = None) → None[source]#

Check whether the evaluation backend prerequisites are satisfied.

Parameters:

evaluation_backend – The evaluation backend that the task will run.
task_name (for LM Harness backend only) – The name of the task to run.

Raises:

RuntimeError – If the evaluation backend prerequisites are not satisfied.

oumi.core.evaluation.utils.save_utils module#

oumi.core.evaluation.utils.save_utils.save_evaluation_output(backend_name: str, task_params: EvaluationTaskParams, evaluation_result: EvaluationResult, base_output_dir: str | None, config: EvaluationConfig | None) → None[source]#

Writes configuration settings and evaluation outputs to files.