From 34e7336cb2c43ab299890d77685784e1add5cae0 Mon Sep 17 00:00:00 2001
From: Wes Brewer <brewerwh@ornl.gov>
Date: Fri, 12 Sep 2025 17:16:44 -0700
Subject: [PATCH] Breakup workload.py into workloads/*.py

---
 main.py                        |    2 +-
 raps/engine.py                 |    2 +-
 raps/workload.py               | 1005 --------------------------------
 raps/workloads/__init__.py     |   75 +++
 raps/workloads/basic.py        |  419 +++++++++++++
 raps/workloads/constants.py    |   13 +
 raps/workloads/distribution.py |  188 ++++++
 raps/workloads/live.py         |   39 ++
 raps/workloads/multitenant.py  |  154 +++++
 raps/workloads/utils.py        |  159 +++++
 10 files changed, 1049 insertions(+), 1007 deletions(-)
 delete mode 100644 raps/workload.py
 create mode 100644 raps/workloads/__init__.py
 create mode 100644 raps/workloads/basic.py
 create mode 100644 raps/workloads/constants.py
 create mode 100644 raps/workloads/distribution.py
 create mode 100644 raps/workloads/live.py
 create mode 100644 raps/workloads/multitenant.py
 create mode 100644 raps/workloads/utils.py

diff --git a/main.py b/main.py
index 7c38960..a90e3d4 100644
--- a/main.py
+++ b/main.py
@@ -4,7 +4,7 @@ ExaDigiT Resource Allocator & Power Simulator (RAPS)
 import argparse
 from raps.helpers import check_python_version
 from raps.run_sim import run_sim_add_parser, run_parts_sim_add_parser, show_add_parser
-from raps.workload import run_workload_add_parser
+from raps.workloads import run_workload_add_parser
 from raps.telemetry import run_telemetry_add_parser
 
 check_python_version()
diff --git a/raps/engine.py b/raps/engine.py
index c569bd0..74ccc92 100644
--- a/raps/engine.py
+++ b/raps/engine.py
@@ -34,7 +34,7 @@ from raps.network import (
 from raps.telemetry import Telemetry
 from raps.cooling import ThermoFluidsModel
 from raps.flops import FLOPSManager
-from raps.workload import Workload, continuous_job_generation
+from raps.workloads import Workload, continuous_job_generation
 from raps.account import Accounts
 from raps.downtime import Downtime
 from raps.weather import Weather
diff --git a/raps/workload.py b/raps/workload.py
deleted file mode 100644
index 2a630b2..0000000
--- a/raps/workload.py
+++ /dev/null
@@ -1,1005 +0,0 @@
-"""
-Module for generating workload traces and jobs.
-
-This module provides functionality for generating random workload traces and
-jobs for simulation and testing purposes.
-
-Attributes
-----------
-TRACE_QUANTA : int
-    The time interval in seconds for tracing workload utilization.
-MAX_NODES_PER_JOB : int
-    The maximum number of nodes required for a job.
-JOB_NAMES : list
-    List of possible job names for random job generation.
-CPUS_PER_NODE : int
-    Number of CPUs per node.
-GPUS_PER_NODE : int
-    Number of GPUs per node.
-MAX_WALL_TIME : int
-    Maximum wall time for a job in seconds.
-MIN_WALL_TIME : int
-    Minimum wall time for a job in seconds.
-JOB_END_PROBS : list
-    List of probabilities for different job end states.
-
-"""
-from raps.utils import (
-    truncated_normalvariate_int,
-    truncated_normalvariate_float,
-    determine_state, next_arrival,
-    next_arrival_byconfargs,
-    truncated_weibull,
-    truncated_weibull_float,
-    WorkloadData,
-)
-import math
-import random
-import numpy as np
-import matplotlib.pyplot as plt
-from raps.telemetry import Telemetry
-from raps.job import job_dict, Job
-from raps.utils import create_file_indexed, SubParsers, pydantic_add_args
-from raps.sim_config import SingleSimConfig
-
-
-JOB_NAMES = ["LAMMPS", "GROMACS", "VASP", "Quantum ESPRESSO", "NAMD",
-             "OpenFOAM", "WRF", "AMBER", "CP2K", "nek5000", "CHARMM",
-             "ABINIT", "Cactus", "Charm++", "NWChem", "STAR-CCM+",
-             "Gaussian", "ANSYS", "COMSOL", "PLUMED", "nekrs",
-             "TensorFlow", "PyTorch", "BLAST", "Spark", "GAMESS",
-             "ORCA", "Simulink", "MOOSE", "ELK"]
-
-ACCT_NAMES = ["ACT01", "ACT02", "ACT03", "ACT04", "ACT05", "ACT06", "ACT07",
-              "ACT08", "ACT09", "ACT10", "ACT11", "ACT12", "ACT13", "ACT14"]
-
-MAX_PRIORITY = 500000
-
-
-class Workload:
-    def __init__(self, args, *configs):
-        """ Initialize Workload with multiple configurations.  """
-        self.partitions = [config['system_name'] for config in configs]
-        self.config_map = {config['system_name']: config for config in configs}
-        self.args = args
-
-    def generate_jobs(self):
-        # This function calls the job generation function as specified by the workload keyword.
-        # The respective funciton of this class is called.
-        jobs = getattr(self, self.args.workload)(args=self.args)
-        timestep_end = int(math.ceil(max([job.end_time for job in jobs])))
-        return WorkloadData(
-            jobs=jobs,
-            telemetry_start=0, telemetry_end=timestep_end,
-            start_date=self.args.start,
-        )
-
-    def compute_traces(self,
-                       cpu_util: float,
-                       gpu_util: float,
-                       expected_run_time: int,
-                       trace_quanta: int
-                       ) -> tuple[np.ndarray, np.ndarray]:
-        """ Compute CPU and GPU traces based on mean CPU & GPU utilizations and wall time. """
-        cpu_trace = cpu_util * np.ones(int(expected_run_time) // trace_quanta)
-        gpu_trace = gpu_util * np.ones(int(expected_run_time) // trace_quanta)
-        return (cpu_trace, gpu_trace)
-
-    def job_arrival_distribution_draw_poisson(self, args, config):
-        return next_arrival_byconfargs(config, args)
-
-    def job_size_distribution_draw_uniform(self, args, config):
-        min_v = 1
-        max_v = config['MAX_NODES_PER_JOB']
-        if (args.jobsize_is_power_of is not None):
-            base = args.jobsize_is_power_of
-            possible_jobsizes = [base ** exp for exp in range(min_v, int(math.floor(math.log(max_v, base))))]
-            selection = random.randint(0, len(possible_jobsizes) - 1)
-            number = possible_jobsizes[selection]
-        elif (args.jobsize_is_of_degree is not None):
-            exp = args.jobsize_is_of_degree
-            possible_jobsizes = [base ** exp for base in range(min_v, int(math.floor(pow(max_v, 1 / exp))))]
-            selection = random.randint(0, len(possible_jobsizes) - 1)
-            number = possible_jobsizes[selection]
-        else:
-            number = random.randint(1, config['MAX_NODES_PER_JOB'])
-        return number
-
-    def job_size_distribution_draw_weibull(self, args, config):
-        min_v = 1
-        max_v = config['MAX_NODES_PER_JOB']
-        if (args.jobsize_is_power_of is not None):
-            base = args.jobsize_is_power_of
-            possible_jobsizes = [base ** exp for exp in range(min_v, int(math.floor(math.log(max_v, base))))]
-            scale = math.log(args.jobsize_weibull_scale, base)
-            shape = math.log(args.jobsize_weibull_shape, base)
-            selection = truncated_weibull(scale, shape, 0, len(possible_jobsizes) - 1)
-            number = possible_jobsizes[selection]
-        elif (args.jobsize_is_of_degree is not None):
-            exp = args.jobsize_is_of_degree
-            possible_jobsizes = [base ** exp for base in range(min_v, int(math.floor(pow(max_v, 1 / exp))))]
-            scale = math.pow(args.jobsize_weibull_scale, 1 / exp)
-            shape = math.pow(args.jobsize_weibull_shape, 1 / exp)
-            selection = truncated_weibull(scale, shape, 0, len(possible_jobsizes) - 1)
-            number = possible_jobsizes[selection]
-        else:
-            number = truncated_weibull(args.jobsize_weibull_scale, args.jobsize_weibull_shape,
-                                       1, config['MAX_NODES_PER_JOB'])
-        return number
-
-    def job_size_distribution_draw_normal(self, args, config):
-        min_v = 1
-        max_v = config['MAX_NODES_PER_JOB']
-        if (args.jobsize_is_power_of is not None):
-            base = args.jobsize_is_power_of
-            possible_jobsizes = [base ** exp for exp in range(min_v, int(math.floor(math.log(max_v, base))))]
-            mean = math.log(args.jobsize_normal_mean, base)
-            stddev = math.log(args.jobsize_normal_stddev, base)  # (len(possible_jobsizes) / (max_v - min_v))
-            selection = truncated_normalvariate_int(mean, stddev, 0, len(possible_jobsizes) - 1)
-            number = possible_jobsizes[selection - 1]
-        elif (args.jobsize_is_of_degree is not None):
-            exp = args.jobsize_is_of_degree
-            possible_jobsizes = [base ** exp for base in range(min_v, int(math.floor(pow(max_v, 1 / exp))))]
-            mean = math.pow(args.jobsize_normal_mean, 1 / exp)
-            stddev = math.pow(args.jobsize_normal_stddev, 1 / exp)
-            selection = truncated_weibull(mean, stddev, 0, len(possible_jobsizes) - 1)
-            number = possible_jobsizes[selection]
-        else:
-            number = truncated_normalvariate_int(
-                args.jobsize_normal_mean, args.jobsize_normal_stddev, 1, config['MAX_NODES_PER_JOB'])
-        return number
-
-    def cpu_utilization_distribution_draw_uniform(self, args, config):
-        return random.uniform(0.0, config['CPUS_PER_NODE'])
-
-    def cpu_utilization_distribution_draw_normal(self, args, config):
-        return truncated_normalvariate_float(args.cpuutil_normal_mean,
-                                             args.cpuutil_normal_stddev,
-                                             0.0, config['CPUS_PER_NODE'])
-
-    def cpu_utilization_distribution_draw_weibull(self, args, config):
-        return truncated_weibull_float(args.cpuutil_weibull_scale,
-                                       args.cpuutil_weibull_shape,
-                                       0.0, config['CPUS_PER_NODE'])
-
-    def gpu_utilization_distribution_draw_uniform(self, args, config):
-        return random.uniform(0.0, config['GPUS_PER_NODE'])
-
-    def gpu_utilization_distribution_draw_normal(self, args, config):
-        return truncated_normalvariate_float(args.gpuutil_normal_mean,
-                                             args.gpuutil_normal_stddev,
-                                             0.0, config['GPUS_PER_NODE'])
-
-    def gpu_utilization_distribution_draw_weibull(self, args, config):
-        return truncated_weibull_float(args.gpuutil_weibull_scale,
-                                       args.gpuutil_weibull_shape,
-                                       0.0, config['GPUS_PER_NODE'])
-
-    def wall_time_distribution_draw_uniform(self, args, config):
-        return random.uniform(config['MIN_WALL_TIME'], config['MAX_WALL_TIME'])
-
-    def wall_time_distribution_draw_normal(self, args, config):
-        return max(1, truncated_normalvariate_int(float(args.walltime_normal_mean),
-                   float(args.walltime_normal_stddev), config['MIN_WALL_TIME'],
-                   config['MAX_WALL_TIME']) / 3600 * 3600)
-
-    def wall_time_distribution_draw_weibull(self, args, config):
-        return truncated_weibull(args.walltime_weibull_scale,
-                                 args.walltime_weibull_shape,
-                                 config['MIN_WALL_TIME'], config['MAX_WALL_TIME'])
-
-    def generate_jobs_from_distribution(self, *,
-                                        job_arrival_distribution_to_draw_from,
-                                        job_size_distribution_to_draw_from,
-                                        cpu_util_distribution_to_draw_from,
-                                        gpu_util_distribution_to_draw_from,
-                                        wall_time_distribution_to_draw_from,
-                                        args
-                                        ) -> list[list[any]]:
-        jobs = []
-        partition = random.choice(self.partitions)
-        config = self.config_map[partition]
-        for job_index in range(args.numjobs):
-            submit_time = int(job_arrival_distribution_to_draw_from(args, config))
-            start_time = submit_time
-            nodes_required = job_size_distribution_to_draw_from(args, config)
-            name = random.choice(JOB_NAMES)
-            account = random.choice(ACCT_NAMES)
-            cpu_util = cpu_util_distribution_to_draw_from(args, config)
-            if "CORES_PER_CPU" in config:
-                cpu_cores_required = random.randint(0, config["CORES_PER_CPU"])
-            else:
-                cpu_cores_required = None
-            gpu_util = gpu_util_distribution_to_draw_from(args, config)
-            if "GPUS_PER_NODE" in config:
-                if isinstance(gpu_util, list):
-                    gpu_units_required = random.randint(0, max(config["GPUS_PER_NODE"], math.ceil(max(gpu_util))))
-                else:
-                    gpu_units_required = random.randint(0, max(config["GPUS_PER_NODE"], math.ceil(gpu_util)))
-            wall_time = wall_time_distribution_to_draw_from(args, config)
-            end_time = start_time + wall_time
-            time_limit = max(wall_time, wall_time_distribution_to_draw_from(args, config))
-            end_state = determine_state(config['JOB_END_PROBS'])
-            cpu_trace = cpu_util  # self.compute_traces(cpu_util, gpu_util, wall_time, config['TRACE_QUANTA'])
-            gpu_trace = gpu_util  # self.compute_traces(cpu_util, gpu_util, wall_time, config['TRACE_QUANTA'])
-            priority = random.randint(0, MAX_PRIORITY)
-            net_tx, net_rx = None, None
-            job_info = job_dict(nodes_required=nodes_required, name=name,
-                                account=account, cpu_trace=cpu_trace,
-                                gpu_trace=gpu_trace, ntx_trace=net_tx,
-                                nrx_trace=net_rx, end_state=end_state,
-                                id=job_index, priority=priority,
-                                partition=partition,
-                                submit_time=submit_time,
-                                time_limit=time_limit,
-                                start_time=start_time,
-                                end_time=end_time,
-                                expected_run_time=wall_time, trace_time=wall_time,
-                                trace_start_time=0, trace_end_time=wall_time,
-                                cpu_cores_required=cpu_cores_required,
-                                gpu_units_required=gpu_units_required,
-                                trace_quanta=config['TRACE_QUANTA']
-                                )
-            job = Job(job_info)
-            jobs.append(job)
-        return jobs
-
-    # Test for random 'reasonable' AI jobs
-    def randomAI(self, **kwargs):
-        args = kwargs.get('args', None)
-        jobs = []
-        for i in range(args.numjobs):
-            draw = random.randint(0, 10)
-            if draw == 0:
-                et = random.randint(7200, 28800)
-                nr = random.choice([128, 256, 512, 1024, 1280, 1792, 2048])
-                new_job = Job(job_dict(nodes_required=nr,
-                                       name="LLM",
-                                       account="llmUser",
-                                       end_state="Success",
-                                       id=random.randint(1, 99999),
-                                       cpu_trace=0.1,
-                                       gpu_trace=(random.uniform(0.55, 0.8) *
-                                                  self.config_map[self.args.system]['GPUS_PER_NODE']),
-                                       ntx_trace=None,
-                                       nrx_trace=None,
-                                       submit_time=0,
-                                       time_limit=random.randint(43200, 43200),
-                                       start_time=0,
-                                       end_time=et,
-                                       expected_run_time=et))
-            else:
-                new_job = Job(job_dict(nodes_required=1,
-                                       name="LLM",
-                                       account="llmUser",
-                                       end_state="Success",
-                                       id=random.randint(1, 99999),
-                                       cpu_trace=1,
-                                       gpu_trace=(0.2 * self.config_map[self.args.system]['GPUS_PER_NODE']),
-                                       ntx_trace=None,
-                                       nrx_trace=None,
-                                       submit_time=0,
-                                       time_limit=43200,
-                                       start_time=0,
-                                       end_time=7200,
-                                       expected_run_time=random.randint(60, 7200)))
-            jobs.append(new_job)
-        return jobs
-
-    def synthetic(self, **kwargs):
-        args = kwargs.get('args', None)
-        print(args)
-        total_jobs = args.numjobs
-        orig_job_size_distribution = args.jobsize_distribution
-        orig_wall_time_distribution = args.walltime_distribution
-        orig_cpuutil_distribution = args.cpuutil_distribution
-        orig_gpuutil_distribution = args.gpuutil_distribution
-        jobs = []
-        if len(args.jobsize_distribution) != 1 and sum(args.multimodal) != 1.0:
-            raise Exception(f"Sum of --multimodal != 1.0 : {args.multimodal} == {sum(args.multimodal)}")
-        for i, (jsdist, wtdist, cudist, gudist, percentage) in enumerate(zip(args.jobsize_distribution,
-                                                                             args.walltime_distribution,
-                                                                             args.cpuutil_distribution,
-                                                                             args.gpuutil_distribution,
-                                                                             args.multimodal)):
-
-            args.numjobs = math.floor(total_jobs * percentage)
-            args.jobsize_distribution = jsdist
-            args.walltime_distribution = wtdist
-            args.cpuutil_distribution = cudist
-            args.gpuutil_distribution = gudist
-
-            job_arrival_distribution_to_draw_from = self.job_arrival_distribution_draw_poisson
-            match args.jobsize_distribution:
-                case "uniform":
-                    job_size_distribution_to_draw_from = self.job_size_distribution_draw_uniform
-                case "normal":
-                    job_size_distribution_to_draw_from = self.job_size_distribution_draw_normal
-                case "weibull":
-                    job_size_distribution_to_draw_from = self.job_size_distribution_draw_weibull
-                case _:
-                    raise NotImplementedError(args.jobsize_distribution)
-
-            match args.walltime_distribution:
-                case "weibull":
-                    wall_time_distribution_to_draw_from = self.wall_time_distribution_draw_weibull
-                case "normal":
-                    wall_time_distribution_to_draw_from = self.wall_time_distribution_draw_normal
-                case "uniform":
-                    wall_time_distribution_to_draw_from = self.wall_time_distribution_draw_uniform
-                case _:
-                    raise NotImplementedError(args.walltime_distribution)
-
-            match args.cpuutil_distribution:
-                case "uniform":
-                    cpu_util_distribution_to_draw_from = self.cpu_utilization_distribution_draw_uniform
-                case "normal":
-                    cpu_util_distribution_to_draw_from = self.cpu_utilization_distribution_draw_normal
-                case "weibull":
-                    cpu_util_distribution_to_draw_from = self.cpu_utilization_distribution_draw_weibull
-                case _:
-                    raise NotImplementedError(args.cpuutil_distribution)
-
-            match args.gpuutil_distribution:
-                case "uniform":
-                    gpu_util_distribution_to_draw_from = self.gpu_utilization_distribution_draw_uniform
-                case "normal":
-                    gpu_util_distribution_to_draw_from = self.gpu_utilization_distribution_draw_normal
-                case "weibull":
-                    gpu_util_distribution_to_draw_from = self.gpu_utilization_distribution_draw_weibull
-                case _:
-                    raise NotImplementedError(args.gpuutil_distribution)
-
-            new_jobs = self.generate_jobs_from_distribution(
-                job_arrival_distribution_to_draw_from=job_arrival_distribution_to_draw_from,
-                job_size_distribution_to_draw_from=job_size_distribution_to_draw_from,
-                cpu_util_distribution_to_draw_from=cpu_util_distribution_to_draw_from,
-                gpu_util_distribution_to_draw_from=gpu_util_distribution_to_draw_from,
-                wall_time_distribution_to_draw_from=wall_time_distribution_to_draw_from,
-                args=args)
-            next_arrival(0, reset=True)
-            jobs.extend(new_jobs)
-        args.numjobs = total_jobs
-        args.jobsize_distribution = orig_job_size_distribution
-        args.cpuutil_distribution = orig_cpuutil_distribution
-        args.gpuutil_distribution = orig_gpuutil_distribution
-        args.walltime_distribution = orig_wall_time_distribution
-        return jobs
-
-    def generate_random_jobs(self, args) -> list[list[any]]:
-        """ Generate random jobs with specified number of jobs. """
-
-        partition = random.choice(self.partitions)
-        config = self.config_map[partition]
-
-        # time_delta = args.time_delta  # Unused
-        downscale = args.downscale
-
-        config['MIN_WALL_TIME'] = config['MIN_WALL_TIME'] * downscale
-        config['MAX_WALL_TIME'] = config['MAX_WALL_TIME'] * downscale
-        jobs = []
-        for job_index in range(args.numjobs):
-            # Randomly select a partition
-            # Get the corresponding config for the selected partition
-            nodes_required = random.randint(1, config['MAX_NODES_PER_JOB'])
-            name = random.choice(JOB_NAMES)
-            account = random.choice(ACCT_NAMES)
-            cpu_util = random.random() * config['CPUS_PER_NODE']
-            gpu_util = random.random() * config['GPUS_PER_NODE']
-            mu = (config['MAX_WALL_TIME'] + config['MIN_WALL_TIME']) / 2
-            sigma = (config['MAX_WALL_TIME'] - config['MIN_WALL_TIME']) / 6
-            wall_time = (truncated_normalvariate_int(
-                mu, sigma, config['MIN_WALL_TIME'], config['MAX_WALL_TIME']) // (3600 * downscale) * (3600 * downscale))
-            time_limit = (truncated_normalvariate_int(mu, sigma, wall_time,
-                          config['MAX_WALL_TIME']) // (3600 * downscale) * (3600 * downscale))
-            # print(f"wall_time: {wall_time//downscale}")
-            # print(f"time_limit: {time_limit//downscale}")
-            end_state = determine_state(config['JOB_END_PROBS'])
-            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, wall_time, config['TRACE_QUANTA'])
-            priority = random.randint(0, MAX_PRIORITY)
-            net_tx, net_rx = None, None
-
-            # Jobs arrive according to Poisson process
-            time_to_next_job = int(next_arrival_byconfargs(config, args))
-            # wall_time = wall_time * downscale
-            # time_limit = time_limit * downscale
-
-            job_info = job_dict(nodes_required=nodes_required, name=name,
-                                account=account, cpu_trace=cpu_trace,
-                                gpu_trace=gpu_trace, ntx_trace=net_tx,
-                                nrx_trace=net_rx, end_state=end_state,
-                                id=job_index, priority=priority,
-                                partition=partition,
-                                submit_time=time_to_next_job - 100,
-                                time_limit=time_limit,
-                                start_time=time_to_next_job,
-                                end_time=time_to_next_job + wall_time,
-                                expected_run_time=wall_time, trace_time=wall_time,
-                                trace_start_time=0, trace_end_time=wall_time,
-                                trace_quanta=config['TRACE_QUANTA'] * downscale,
-                                downscale=downscale
-                                )
-            job = Job(job_info)
-            jobs.append(job)
-        return jobs
-
-    def random(self, **kwargs):
-        """ Generate random workload """
-        args = kwargs.get('args', None)
-        return self.generate_random_jobs(args=args)
-
-    def peak(self, **kwargs):
-        """Peak power test for multiple partitions"""
-        jobs = []
-
-        # Iterate through each partition and get its configuration
-        for partition in self.partitions:
-            # Fetch the config for the current partition
-            config = self.config_map[partition]
-
-            # Generate traces based on partition-specific configuration
-            cpu_util = config['CPUS_PER_NODE']
-            gpu_util = config['GPUS_PER_NODE']
-            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 10800, config['TRACE_QUANTA'])
-            net_tx, net_rx = None, None
-
-            job_time = len(gpu_trace) * config['TRACE_QUANTA']
-            # Create job info for this partition
-            job_info = job_dict(nodes_required=config['AVAILABLE_NODES'],
-                                # Down nodes, therefore doesnt work list(range(config['AVAILABLE_NODES'])),
-                                scheduled_nodes=[],
-                                name=f"Max Test {partition}",
-                                account=ACCT_NAMES[0],
-                                cpu_trace=cpu_trace,
-                                gpu_trace=gpu_trace,
-                                ntx_trace=net_tx,
-                                nrx_trace=net_rx,
-                                end_state='COMPLETED',
-                                id=None,
-                                priority=100,
-                                partition=partition,
-                                time_limit=job_time + 1,
-                                start_time=0,
-                                end_time=job_time,
-                                expected_run_time=job_time,
-                                trace_time=job_time,
-                                trace_start_time=0,
-                                trace_end_time=job_time,
-                                trace_quanta=config['TRACE_QUANTA']
-                                )
-            job = Job(job_info)
-            jobs.append(job)  # Add job to the list
-
-        return jobs
-
-    def idle(self, **kwargs):
-        jobs = []
-        # Iterate through each partition and get its configuration
-        for partition in self.partitions:
-            # Fetch the config for the current partition
-            config = self.config_map[partition]
-
-            # Generate traces based on partition-specific configuration
-            cpu_util, gpu_util = 0, 0
-            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 10800, config['TRACE_QUANTA'])
-            net_tx, net_rx = None, None
-
-            job_time = len(gpu_trace) * config['TRACE_QUANTA']
-            # Create job info for this partition
-            job_info = job_dict(
-                nodes_required=config['AVAILABLE_NODES'],
-                name=f"Idle Test {partition}",
-                account=ACCT_NAMES[0],
-                cpu_trace=cpu_trace,
-                gpu_trace=gpu_trace,
-                ntx_trace=net_tx,
-                nrx_trace=net_rx,
-                end_state='COMPLETED',
-                scheduled_nodes=[],  # list(range(config['AVAILABLE_NODES'])),
-                id=None,
-                priority=100,
-                partition=partition,
-                time_limit=job_time + 1,
-                submit_time=0,
-                start_time=0,
-                end_time=job_time,
-                expected_run_time=job_time,
-                trace_time=job_time,
-                trace_start_time=0,
-                trace_end_time=job_time,
-                trace_quanta=config['TRACE_QUANTA'])
-            job = Job(job_info)
-            jobs.append(job)  # Add job to the list
-
-        return jobs
-
-    def benchmark(self, **kwargs):
-        """Benchmark tests for multiple partitions"""
-
-        # List to hold jobs for all partitions
-        jobs = []
-        account = ACCT_NAMES[0]
-        # Iterate through each partition and its config
-        for partition in self.partitions:
-            # Fetch partition-specific configuration
-            config = self.config_map[partition]
-            net_tx, net_rx = None, None
-
-            # Max test
-            cpu_util, gpu_util = 1, 4
-            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 10800, config['TRACE_QUANTA'])
-
-            job_time = len(gpu_trace) * config['TRACE_QUANTA']
-
-            job_info = job_dict(
-                nodes_required=config['AVAILABLE_NODES'],
-                scheduled_nodes=[],  # Explicit scheduled nodes will not work due to down nodes
-                name=f"Max Test {partition}",
-                account=account,
-                cpu_trace=cpu_trace,
-                gpu_trace=gpu_trace,
-                ntx_trace=net_tx,
-                nrx_trace=net_rx,
-                end_state='COMPLETED',
-                id=None,
-                priority=100,
-                partition=partition,
-                submit_time=0,
-                time_limit=job_time + 1,
-                start_time=0,
-                end_time=job_time,
-                expected_run_time=job_time,
-                trace_time=job_time,
-                trace_start_time=0,
-                trace_end_time=job_time,
-                trace_missing_values=False,
-                trace_quanta=config['TRACE_QUANTA'])
-            job = Job(job_info)
-            jobs.append(job)
-
-            # OpenMxP run
-            cpu_util, gpu_util = 0, 4
-            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 3600, config['TRACE_QUANTA'])
-            job_time = len(gpu_trace) * config['TRACE_QUANTA']
-
-            job_info = job_dict(
-                nodes_required=config['AVAILABLE_NODES'],
-                scheduled_nodes=[],  # Explicit scheduled nodes will not work due to down nodes
-                name=f"OpenMxP {partition}",
-                account=account,
-                cpu_trace=cpu_trace,
-                gpu_trace=gpu_trace,
-                ntx_trace=net_tx,
-                nrx_trace=net_rx,
-                end_state='COMPLETED',
-                id=None,
-                priority=100,
-                partition=partition,
-                submit_time=0,
-                time_limit=job_time + 1,
-                start_time=10800,
-                end_time=14200,
-                expected_run_time=job_time,
-                trace_time=job_time,
-                trace_start_time=0,
-                trace_end_time=job_time,
-                trace_missing_values=False,
-                trace_quanta=config['TRACE_QUANTA'])
-            job = Job(job_info)
-            jobs.append(job)
-
-            # HPL run
-            cpu_util, gpu_util = 0.33, 0.79 * 4  # based on 24-01-18 run
-            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 3600, config['TRACE_QUANTA'])
-            job_time = len(gpu_trace) * config['TRACE_QUANTA']
-            job_info = job_dict(
-                nodes_required=config['AVAILABLE_NODES'],
-                scheduled_nodes=[],  # Explicit scheduled nodes will not work due to down nodes
-                name=f"HPL {partition}",
-                account=account,
-                cpu_trace=cpu_trace,
-                gpu_trace=gpu_trace,
-                ntx_trace=net_tx,
-                nrx_trace=net_rx,
-                end_state='COMPLETED',
-                id=None,
-                priority=100,
-                partition=partition,
-                submit_time=0,
-                time_limit=job_time + 1,
-                start_time=14200,
-                end_time=17800,
-                expected_run_time=job_time,
-                trace_time=job_time,
-                trace_start_time=0,
-                trace_end_time=job_time,
-                trace_missing_values=False,
-                trace_quanta=config['TRACE_QUANTA'])
-            job = Job(job_info)
-            jobs.append(job)
-
-            # Idle test
-            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 3600, config['TRACE_QUANTA'])
-            job_time = len(gpu_trace) * config['TRACE_QUANTA']
-            job_info = job_dict(
-                nodes_required=config['AVAILABLE_NODES'],
-                scheduled_nodes=[],  # Explicit scheduled nodes will not work due to down nodes
-                name=f"Idle Test {partition}",
-                account=account,
-                cpu_trace=cpu_trace,
-                gpu_trace=gpu_trace,
-                ntx_trace=net_tx,
-                nrx_trace=net_rx,
-                end_state='COMPLETED',
-                id=None,
-                priority=100,
-                partition=partition,
-                submit_time=0,
-                time_limit=job_time + 1,
-                start_time=17800,
-                end_time=21400,
-                expected_run_time=job_time,
-                trace_time=job_time,
-                trace_start_time=0,
-                trace_end_time=job_time,
-                trace_missing_values=False,
-                trace_quanta=config['TRACE_QUANTA'])
-            job = Job(job_info)
-            jobs.append(job)
-
-        return jobs
-
-    def multitenant(self, **kwargs):
-        """
-        Generate deterministic jobs to validate multitenant scheduling & power.
-
-        usage example:
-
-            python main.py run-multi-part -x mit_supercloud -w multitenant
-
-        Parameters
-        ----------
-        mode : str
-            One of:
-              - 'ONE_JOB_PER_NODE_ALL_CORES'
-              - 'TWO_JOBS_PER_NODE_SPLIT'
-              - 'STAGGERED_JOBS_PER_NODE'
-        wall_time : int
-            Duration (seconds) of each job (default: 3600)
-        trace_quanta : int
-            Sampling interval for traces; defaults to config['TRACE_QUANTA']
-
-        Returns
-        -------
-        list[dict]
-            List of job_dict entries.
-        """
-        mode = kwargs.get('mode', 'TWO_JOBS_PER_NODE_SPLIT')
-        wall_time = kwargs.get('wall_time', 3600)
-
-        jobs = []
-
-        for partition in self.partitions:
-            cfg = self.config_map[partition]
-            trace_quanta = kwargs.get('trace_quanta', cfg['TRACE_QUANTA'])
-
-            cores_per_cpu = cfg.get('CORES_PER_CPU', 1)
-            cpus_per_node = cfg.get('CPUS_PER_NODE', 1)
-            cores_per_node = cores_per_cpu * cpus_per_node
-            gpus_per_node = cfg.get('GPUS_PER_NODE', 0)
-
-            n_nodes = cfg['AVAILABLE_NODES']
-
-            def make_trace(cpu_util, gpu_util):
-                return self.compute_traces(cpu_util, gpu_util, wall_time, trace_quanta)
-
-            job_id_ctr = 0
-
-            if mode == 'ONE_JOB_PER_NODE_ALL_CORES':
-                # Each node runs one job that consumes all cores/GPUs
-                for nid in range(n_nodes):
-                    cpu_trace, gpu_trace = make_trace(cores_per_node, gpus_per_node)
-                    jobs.append(Job(job_dict(
-                        nodes_required=1,
-                        cpu_cores_required=cores_per_node,
-                        gpu_units_required=gpus_per_node,
-                        name=f"MT_full_node_{partition}_{nid}",
-                        account=random.choice(ACCT_NAMES),
-                        cpu_trace=cpu_trace,
-                        gpu_trace=gpu_trace,
-                        ntx_trace=[], nrx_trace=[],
-                        end_state='COMPLETED',
-                        id=job_id_ctr,
-                        priority=random.randint(0, MAX_PRIORITY),
-                        partition=partition,
-                        submit_time=0,
-                        time_limit=wall_time,
-                        start_time=0,
-                        end_time=wall_time,
-                        expected_run_time=wall_time,
-                        trace_time=wall_time,
-                        trace_start_time=0,
-                        trace_end_time=wall_time,
-                        trace_quanta=cfg['TRACE_QUANTA']
-                    )))
-                    job_id_ctr += 1
-
-            elif mode == 'TWO_JOBS_PER_NODE_SPLIT':
-                # Two jobs per node: split CPU/GPU roughly in half
-                for nid in range(n_nodes):
-                    cpu_a = cores_per_node // 2
-                    cpu_b = cores_per_node - cpu_a
-                    gpu_a = gpus_per_node // 2
-                    gpu_b = gpus_per_node - gpu_a
-
-                    for idx, (c_req, g_req, tag) in enumerate([(cpu_a, gpu_a, 'A'),
-                                                               (cpu_b, gpu_b, 'B')]):
-                        cpu_trace, gpu_trace = make_trace(c_req, g_req)
-                        jobs.append(Job(job_dict(
-                            nodes_required=1,  # still one node; multitenant RM packs cores
-                            cpu_cores_required=c_req,
-                            gpu_units_required=g_req,
-                            name=f"MT_split_node_{partition}_{nid}_{tag}",
-                            account=random.choice(ACCT_NAMES),
-                            cpu_trace=cpu_trace,
-                            gpu_trace=gpu_trace,
-                            ntx_trace=[], nrx_trace=[],
-                            end_state='COMPLETED',
-                            id=job_id_ctr,
-                            priority=random.randint(0, MAX_PRIORITY),
-                            partition=partition,
-                            submit_time=0,
-                            time_limit=wall_time,
-                            start_time=0,
-                            end_time=wall_time,
-                            expected_run_time=wall_time,
-                            trace_time=wall_time,
-                            trace_start_time=0,
-                            trace_end_time=wall_time,
-                            trace_quanta=cfg['TRACE_QUANTA']
-                        )))
-                        job_id_ctr += 1
-
-            elif mode == 'STAGGERED_JOBS_PER_NODE':
-                # Three jobs per node, staggered starts: 0, wall_time/3, 2*wall_time/3
-                offsets = [0, wall_time // 3, 2 * wall_time // 3]
-                cpu_each = cores_per_node // 3 or 1
-                gpu_each = max(1, gpus_per_node // 3) if gpus_per_node else 0
-
-                for nid in range(n_nodes):
-                    for k, offset in enumerate(offsets):
-                        cpu_trace, gpu_trace = make_trace(cpu_each, gpu_each)
-                        jobs.append(Job(job_dict(
-                            nodes_required=1,
-                            cpu_cores_required=cpu_each,
-                            gpu_units_required=gpu_each,
-                            name=f"MT_stagger_node_{partition}_{nid}_{k}",
-                            account=random.choice(ACCT_NAMES),
-                            cpu_trace=cpu_trace,
-                            gpu_trace=gpu_trace,
-                            ntx_trace=[], nrx_trace=[],
-                            end_state='COMPLETED',
-                            id=job_id_ctr,
-                            priority=random.randint(0, MAX_PRIORITY),
-                            partition=partition,
-                            submit_time=offset,
-                            time_limit=wall_time,
-                            start_time=offset,
-                            end_time=offset + wall_time,
-                            expected_run_time=wall_time,
-                            trace_time=wall_time,
-                            trace_start_time=0,
-                            trace_end_time=wall_time,
-                            trace_quanta=cfg['TRACE_QUANTA']
-                        )))
-                        job_id_ctr += 1
-            else:
-                raise ValueError(f"Unknown multitenant mode: {mode}")
-
-        return jobs
-
-
-def plot_job_hist(jobs, config=None, dist_split=None, gantt_nodes=False):
-    # put args.multimodal in dist_split!
-    split = [1.0]
-    num_dist = 1
-    if dist_split:
-        num_dist = len(dist_split)
-        split = dist_split
-
-    y = [y.nodes_required for y in jobs]
-    x = [x.expected_run_time for x in jobs]
-    x2 = [x.time_limit for x in jobs]
-    fig_m = plt.figure()
-    gs = fig_m.add_gridspec(30, 1)
-    gs0 = gs[0:20].subgridspec(500, 500, hspace=0, wspace=0)
-    gs1 = gs[24:].subgridspec(1, 1)
-
-    ax_top = fig_m.add_subplot(gs0[:])
-    ax_top.axis('off')
-    ax_top.set_title('Job Distribution')
-
-    ax_bot = fig_m.add_subplot(gs1[:])
-    ax_bot.axis('off')
-    ax_bot.set_title('Submit Time + Wall Time')
-
-    # ax0 = fig_m.add_subplot(gs[:2,:])
-    # ax1 = fig_m.add_subplot(gs[2:,:])
-
-    # gss = gridspec.GridSpec(5, 5, figure=ax0)
-    # fig, axs = plt.subplots(2, 2, gridspec_kw={'width_ratios': (4, 1), 'height_ratios': (1, 4)})
-    axs = []
-    col = []
-    col.append(fig_m.add_subplot(gs0[:100, :433]))
-    col.append(fig_m.add_subplot(gs0[:100, 433:]))
-    axs.append(col.copy())
-    col = []
-    col.append(fig_m.add_subplot(gs0[100:, :433]))
-    col.append(fig_m.add_subplot(gs0[100:, 433:]))
-    axs.append(col.copy())
-
-    ax_b = fig_m.add_subplot(gs1[:, :])
-
-    # Create scatter plot
-    for i in range(len(x)):
-        axs[1][0].plot([x[i], x2[i]], [y[i], y[i]], color='lightblue', zorder=1)
-    axs[1][0].scatter(x2, y, marker='.', c='lightblue', zorder=2)
-    axs[1][0].scatter(x, y, zorder=3)
-
-    cpu_util = [x.cpu_trace for x in jobs]
-    if isinstance(cpu_util[0], np.ndarray):
-        cpu_util = np.concatenate(cpu_util).ravel()
-    elif isinstance(cpu_util[0], list):
-        cpu_util = [sum(part) / len(part) for part in cpu_util]
-    gpu_util = [x.gpu_trace for x in jobs]
-    if isinstance(gpu_util[0], np.ndarray):
-        gpu_util = np.concatenate(gpu_util).ravel()
-    elif isinstance(gpu_util[0], list):
-        gpu_util = [sum(part) / len(part) for part in gpu_util]
-    if not all([x == 0 for x in gpu_util]):
-        axs[0][1].scatter(cpu_util, gpu_util, zorder=2, marker='.', s=0.2)
-        axs[0][1].hist(gpu_util, bins=100, orientation='horizontal', zorder=1, density=True, color='tab:purple')
-        axs[0][1].axhline(np.mean(gpu_util), color='r', linewidth=1, zorder=3)
-        axs[0][1].set(ylim=[0, config['GPUS_PER_NODE']])
-        axs[0][1].set_ylabel("gpu util")
-        axs[0][1].yaxis.set_label_coords(1.15, 0.5)
-        axs[0][1].yaxis.set_label_position("right")
-        axs[0][1].yaxis.tick_right()
-    else:
-        axs[0][1].set_yticks([])
-    axs[0][1].hist(cpu_util, bins=100, orientation='vertical', zorder=1, density=True, color='tab:cyan')
-    axs[0][1].axvline(np.mean(cpu_util), color='r', linewidth=1, zorder=3)
-    axs[0][1].set(xlim=[0, config['CPUS_PER_NODE']])
-    axs[0][1].set_xlabel("cpu util")
-    axs[0][1].xaxis.set_label_coords(0.5, 1.30)
-    axs[0][1].xaxis.set_label_position("top")
-    axs[0][1].xaxis.tick_top()
-    axs[0][0].hist(x2, bins=max(1, math.ceil(min(100, (max(x2) - min(x))))), orientation='vertical', color='lightblue')
-    axs[0][0].hist(x, bins=max(1, math.ceil(min(100, (max(x2) - min(x))))), orientation='vertical')
-    axs[1][0].sharex(axs[0][0])
-    axs[1][1].hist(y, bins=max(1, min(100, (max(y) - min(y)))), orientation='horizontal')
-    axs[1][0].sharey(axs[1][1])
-
-    # Remove ticks
-    axs[0][0].set_xticks([])
-    axs[1][1].set_yticks([])
-    axs[0][1].spines['top'].set_color('white')
-    axs[0][1].spines['right'].set_color('white')
-    axs[1][0].set_ylabel("nodes [N]")
-    axs[1][0].set_xlabel("wall time [hh:mm]")
-    minx_s = 0
-    maxx_s = math.ceil(max(x2))
-    x_label_mins = [n for n in np.arange(minx_s // 60, maxx_s // 60)]
-    x_label_ticks = [n * 60 for n in x_label_mins[0::60]]
-    x_label_str = [str(x1).zfill(2) + ":" + str(x2).zfill(2) for
-                   (x1, x2) in [(n // 60, n % 60) for
-                                n in x_label_mins[0::60]]]
-    axs[1][0].set_xticks(x_label_ticks, x_label_str)
-    miny = min(y)
-    maxy = max(y)
-    interval = max(1, maxy // 10)
-    y_ticks = np.arange(0, maxy, interval)
-    y_ticks[0] = miny
-    axs[1][0].set_yticks(y_ticks)
-
-    axs[0][0].tick_params(axis="x", labelbottom=False)
-    axs[1][1].tick_params(axis="y", labelleft=False)
-
-    # Submit_time and Wall_time
-    duration = [x.expected_run_time for x in jobs]
-    nodes_required = [x.nodes_required for x in jobs]
-    submit_t = [x.submit_time for x in jobs]
-
-    offset = 0
-    split_index = 0
-    split_offset = math.floor(len(x) * split[split_index])
-    if gantt_nodes:
-        if split[0] == 0.0:
-            ax_b.axhline(y=offset, color='red', linestyle='--', lw=0.5)
-            split_index += 1
-        for i in range(len(x)):
-            # ax_b.barh(i,duration[i], height=1.0, left=submit_t[i])
-            ax_b.barh(offset + nodes_required[i] / 2, duration[i], height=nodes_required[i], left=submit_t[i])
-            offset += nodes_required[i]
-            if i != len(x) - 1 and i == split_offset - 1 and split_index < len(split):
-                ax_b.axhline(y=offset, color='red', linestyle='--', lw=0.5)
-                split_index += 1
-                split_offset += math.floor(len(x) * split[split_index])
-                # ax_b.axhline(y=(len(x)/num_dist * i)-0.5, color='red', linestyle='--',lw=0.5)
-        if split[-1] == 0.0:
-            ax_b.axhline(y=offset, color='red', linestyle='--', lw=0.5)
-            split_index += 1
-        ax_b.set_ylabel("Jobs' acc. nodes")
-    else:
-        for i in range(len(x)):
-            ax_b.barh(i, duration[i], height=1.0, left=submit_t[i])
-        for i in range(1, num_dist):
-            if num_dist == 1:
-                break
-            ax_b.axhline(y=(len(x) * split[split_index]) - 0.5, color='red', linestyle='--', lw=0.5)
-            split_index += 1
-        ax_b.set_ylabel("Job ID")
-        # ax_b labels:
-    ax_b.set_xlabel("time [hh:mm]")
-    minx_s = 0
-    maxx_s = math.ceil(max([x.expected_run_time for x in jobs]) + max([x.submit_time for x in jobs]))
-    x_label_mins = [n for n in np.arange(minx_s // 60, maxx_s // 60)]
-    x_label_ticks = [n * 60 for n in x_label_mins[0::60]]
-    x_label_str = [str(x1).zfill(2) + ":" + str(x2).zfill(2) for
-                   (x1, x2) in [(n // 60, n % 60) for
-                                n in x_label_mins[0::60]]]
-
-    ax_b.set_xticks(x_label_ticks, x_label_str)
-    ax_b.yaxis.set_inverted(True)
-
-    plt.show()
-
-
-def run_workload_add_parser(subparsers: SubParsers):
-    from raps.run_sim import shortcuts
-    # TODO: Separate the arguments for this command
-    parser = subparsers.add_parser("workload", description="""
-        Saves workload as a snapshot.
-    """)
-    parser.add_argument("config_file", nargs="?", default=None, help="""
-        YAML sim config file, can be used to configure an experiment instead of using CLI
-        flags. Pass "-" to read from stdin.
-    """)
-    model_validate = pydantic_add_args(parser, SingleSimConfig, model_config={
-        "cli_shortcuts": shortcuts,
-    })
-    parser.set_defaults(impl=lambda args: run_workload(model_validate(args, {})))
-
-
-def run_workload(sim_config: SingleSimConfig):
-    args = sim_config.get_legacy_args()
-    args_dict = sim_config.get_legacy_args()
-    config = sim_config.system_configs[0].get_legacy()
-
-    if sim_config.replay:
-        td = Telemetry(**args_dict)
-        jobs = td.load_from_files(sim_config.replay).jobs
-    else:
-        workload = Workload(args, config)
-        jobs = getattr(workload, sim_config.workload)(args=sim_config.get_legacy_args())
-    plot_job_hist(jobs,
-                  config=config,
-                  dist_split=sim_config.multimodal,
-                  gantt_nodes=sim_config.gantt_nodes)
-
-    out = sim_config.get_output()
-    if out:
-        timestep_start = min([x.submit_time for x in jobs])
-        timestep_end = math.ceil(max([x.submit_time for x in jobs]) + max([x.expected_run_time for x in jobs]))
-        filename = create_file_indexed('wl', path=str(out), create=False, ending="npz").split(".npz")[0]
-        # savez_compressed add npz itself, but create_file_indexed needs to check for .npz to find existing files
-        np.savez_compressed(filename, jobs=jobs, timestep_start=timestep_start, timestep_end=timestep_end, args=args)
-        print(filename + ".npz")  # To std-out to show which npz was created.
-
-
-def continuous_job_generation(*, engine, timestep, jobs):
-    # print("if len(engine.queue) <= engine.continuous_workload.args.maxqueue:")
-    # print(f"if {len(engine.queue)} <= {engine.continuous_workload.args.maxqueue}:")
-    if len(engine.queue) <= engine.continuous_workload.args.maxqueue:
-        new_jobs = engine.continuous_workload.generate_jobs().jobs
-        jobs.extend(new_jobs)
diff --git a/raps/workloads/__init__.py b/raps/workloads/__init__.py
new file mode 100644
index 0000000..23d98df
--- /dev/null
+++ b/raps/workloads/__init__.py
@@ -0,0 +1,75 @@
+"""Workloads package init."""
+
+import math
+import numpy as np
+
+from raps.utils import WorkloadData, SubParsers
+from raps.utils import pydantic_add_args
+from raps.sim_config import SingleSimConfig
+
+from .basic import BasicWorkload
+from .constants import JOB_NAMES, ACCT_NAMES, MAX_PRIORITY
+from .distribution import DistributionWorkload
+from .live import continuous_job_generation, run_workload
+from .multitenant import MultitenantWorkload
+from .utils import plot_job_hist
+
+
+class BaseWorkload:
+    """Base class with common workload logic."""
+
+    def __init__(self, args, *configs):
+        self.partitions = [c['system_name'] for c in configs]
+        self.config_map = {c['system_name']: c for c in configs}
+        self.args = args
+
+    def generate_jobs(self):
+        jobs = getattr(self, self.args.workload)(args=self.args)
+        timestep_end = int(math.ceil(max([job.end_time for job in jobs])))
+        return WorkloadData(
+            jobs=jobs,
+            telemetry_start=0,
+            telemetry_end=timestep_end,
+            start_date=self.args.start,
+        )
+
+    def compute_traces(self,
+                       cpu_util: float,
+                       gpu_util: float,
+                       expected_run_time: int,
+                       trace_quanta: int
+                       ) -> tuple[np.ndarray, np.ndarray]:
+        """ Compute CPU and GPU traces based on mean CPU & GPU utilizations and wall time. """
+        cpu_trace = cpu_util * np.ones(int(expected_run_time) // trace_quanta)
+        gpu_trace = gpu_util * np.ones(int(expected_run_time) // trace_quanta)
+        return (cpu_trace, gpu_trace)
+        
+class Workload(
+    BaseWorkload,
+    DistributionWorkload,
+    BasicWorkload,
+    MultitenantWorkload
+):
+    """Final workload class with all workload types."""
+    pass
+
+__all__ = [
+    "Workload",
+    "JOB_NAMES", "ACCT_NAMES", "MAX_PRIORITY",
+]
+
+
+def run_workload_add_parser(subparsers: SubParsers):
+    from raps.run_sim import shortcuts
+    # TODO: Separate the arguments for this command
+    parser = subparsers.add_parser("workload", description="""
+        Saves workload as a snapshot.
+    """)
+    parser.add_argument("config_file", nargs="?", default=None, help="""
+        YAML sim config file, can be used to configure an experiment instead of using CLI
+        flags. Pass "-" to read from stdin.
+    """)
+    model_validate = pydantic_add_args(parser, SingleSimConfig, model_config={
+        "cli_shortcuts": shortcuts,
+    })
+    parser.set_defaults(impl=lambda args: run_workload(model_validate(args, {})))
diff --git a/raps/workloads/basic.py b/raps/workloads/basic.py
new file mode 100644
index 0000000..208af54
--- /dev/null
+++ b/raps/workloads/basic.py
@@ -0,0 +1,419 @@
+import math
+import random
+
+from raps.job import Job, job_dict
+from raps.utils import (
+    truncated_normalvariate_int,
+    determine_state,
+    next_arrival,
+    next_arrival_byconfargs,
+)
+
+from .constants import JOB_NAMES, ACCT_NAMES, MAX_PRIORITY
+
+class BasicWorkload:
+
+    # Test for random 'reasonable' AI jobs
+    def randomAI(self, **kwargs):
+        args = kwargs.get('args', None)
+        jobs = []
+        for i in range(args.numjobs):
+            draw = random.randint(0, 10)
+            if draw == 0:
+                et = random.randint(7200, 28800)
+                nr = random.choice([128, 256, 512, 1024, 1280, 1792, 2048])
+                new_job = Job(job_dict(nodes_required=nr,
+                                       name="LLM",
+                                       account="llmUser",
+                                       end_state="Success",
+                                       id=random.randint(1, 99999),
+                                       cpu_trace=0.1,
+                                       gpu_trace=(random.uniform(0.55, 0.8) *
+                                                  self.config_map[self.args.system]['GPUS_PER_NODE']),
+                                       ntx_trace=None,
+                                       nrx_trace=None,
+                                       submit_time=0,
+                                       time_limit=random.randint(43200, 43200),
+                                       start_time=0,
+                                       end_time=et,
+                                       expected_run_time=et))
+            else:
+                new_job = Job(job_dict(nodes_required=1,
+                                       name="LLM",
+                                       account="llmUser",
+                                       end_state="Success",
+                                       id=random.randint(1, 99999),
+                                       cpu_trace=1,
+                                       gpu_trace=(0.2 * self.config_map[self.args.system]['GPUS_PER_NODE']),
+                                       ntx_trace=None,
+                                       nrx_trace=None,
+                                       submit_time=0,
+                                       time_limit=43200,
+                                       start_time=0,
+                                       end_time=7200,
+                                       expected_run_time=random.randint(60, 7200)))
+            jobs.append(new_job)
+        return jobs
+
+    def synthetic(self, **kwargs):
+        args = kwargs.get('args', None)
+        print(args)
+        total_jobs = args.numjobs
+        orig_job_size_distribution = args.jobsize_distribution
+        orig_wall_time_distribution = args.walltime_distribution
+        orig_cpuutil_distribution = args.cpuutil_distribution
+        orig_gpuutil_distribution = args.gpuutil_distribution
+        jobs = []
+        if len(args.jobsize_distribution) != 1 and sum(args.multimodal) != 1.0:
+            raise Exception(f"Sum of --multimodal != 1.0 : {args.multimodal} == {sum(args.multimodal)}")
+        for i, (jsdist, wtdist, cudist, gudist, percentage) in enumerate(zip(args.jobsize_distribution,
+                                                                             args.walltime_distribution,
+                                                                             args.cpuutil_distribution,
+                                                                             args.gpuutil_distribution,
+                                                                             args.multimodal)):
+
+            args.numjobs = math.floor(total_jobs * percentage)
+            args.jobsize_distribution = jsdist
+            args.walltime_distribution = wtdist
+            args.cpuutil_distribution = cudist
+            args.gpuutil_distribution = gudist
+
+            job_arrival_distribution_to_draw_from = self.job_arrival_distribution_draw_poisson
+            match args.jobsize_distribution:
+                case "uniform":
+                    job_size_distribution_to_draw_from = self.job_size_distribution_draw_uniform
+                case "normal":
+                    job_size_distribution_to_draw_from = self.job_size_distribution_draw_normal
+                case "weibull":
+                    job_size_distribution_to_draw_from = self.job_size_distribution_draw_weibull
+                case _:
+                    raise NotImplementedError(args.jobsize_distribution)
+
+            match args.walltime_distribution:
+                case "weibull":
+                    wall_time_distribution_to_draw_from = self.wall_time_distribution_draw_weibull
+                case "normal":
+                    wall_time_distribution_to_draw_from = self.wall_time_distribution_draw_normal
+                case "uniform":
+                    wall_time_distribution_to_draw_from = self.wall_time_distribution_draw_uniform
+                case _:
+                    raise NotImplementedError(args.walltime_distribution)
+
+            match args.cpuutil_distribution:
+                case "uniform":
+                    cpu_util_distribution_to_draw_from = self.cpu_utilization_distribution_draw_uniform
+                case "normal":
+                    cpu_util_distribution_to_draw_from = self.cpu_utilization_distribution_draw_normal
+                case "weibull":
+                    cpu_util_distribution_to_draw_from = self.cpu_utilization_distribution_draw_weibull
+                case _:
+                    raise NotImplementedError(args.cpuutil_distribution)
+
+            match args.gpuutil_distribution:
+                case "uniform":
+                    gpu_util_distribution_to_draw_from = self.gpu_utilization_distribution_draw_uniform
+                case "normal":
+                    gpu_util_distribution_to_draw_from = self.gpu_utilization_distribution_draw_normal
+                case "weibull":
+                    gpu_util_distribution_to_draw_from = self.gpu_utilization_distribution_draw_weibull
+                case _:
+                    raise NotImplementedError(args.gpuutil_distribution)
+
+            new_jobs = self.generate_jobs_from_distribution(
+                job_arrival_distribution_to_draw_from=job_arrival_distribution_to_draw_from,
+                job_size_distribution_to_draw_from=job_size_distribution_to_draw_from,
+                cpu_util_distribution_to_draw_from=cpu_util_distribution_to_draw_from,
+                gpu_util_distribution_to_draw_from=gpu_util_distribution_to_draw_from,
+                wall_time_distribution_to_draw_from=wall_time_distribution_to_draw_from,
+                args=args)
+            next_arrival(0, reset=True)
+            jobs.extend(new_jobs)
+        args.numjobs = total_jobs
+        args.jobsize_distribution = orig_job_size_distribution
+        args.cpuutil_distribution = orig_cpuutil_distribution
+        args.gpuutil_distribution = orig_gpuutil_distribution
+        args.walltime_distribution = orig_wall_time_distribution
+        return jobs
+
+    def generate_random_jobs(self, args) -> list[list[any]]:
+        """ Generate random jobs with specified number of jobs. """
+
+        partition = random.choice(self.partitions)
+        config = self.config_map[partition]
+
+        # time_delta = args.time_delta  # Unused
+        downscale = args.downscale
+
+        config['MIN_WALL_TIME'] = config['MIN_WALL_TIME'] * downscale
+        config['MAX_WALL_TIME'] = config['MAX_WALL_TIME'] * downscale
+        jobs = []
+        for job_index in range(args.numjobs):
+            # Randomly select a partition
+            # Get the corresponding config for the selected partition
+            nodes_required = random.randint(1, config['MAX_NODES_PER_JOB'])
+            name = random.choice(JOB_NAMES)
+            account = random.choice(ACCT_NAMES)
+            cpu_util = random.random() * config['CPUS_PER_NODE']
+            gpu_util = random.random() * config['GPUS_PER_NODE']
+            mu = (config['MAX_WALL_TIME'] + config['MIN_WALL_TIME']) / 2
+            sigma = (config['MAX_WALL_TIME'] - config['MIN_WALL_TIME']) / 6
+            wall_time = (truncated_normalvariate_int(
+                mu, sigma, config['MIN_WALL_TIME'], config['MAX_WALL_TIME']) // (3600 * downscale) * (3600 * downscale))
+            time_limit = (truncated_normalvariate_int(mu, sigma, wall_time,
+                          config['MAX_WALL_TIME']) // (3600 * downscale) * (3600 * downscale))
+            # print(f"wall_time: {wall_time//downscale}")
+            # print(f"time_limit: {time_limit//downscale}")
+            end_state = determine_state(config['JOB_END_PROBS'])
+            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, wall_time, config['TRACE_QUANTA'])
+            priority = random.randint(0, MAX_PRIORITY)
+            net_tx, net_rx = None, None
+
+            # Jobs arrive according to Poisson process
+            time_to_next_job = int(next_arrival_byconfargs(config, args))
+            # wall_time = wall_time * downscale
+            # time_limit = time_limit * downscale
+
+            job_info = job_dict(nodes_required=nodes_required, name=name,
+                                account=account, cpu_trace=cpu_trace,
+                                gpu_trace=gpu_trace, ntx_trace=net_tx,
+                                nrx_trace=net_rx, end_state=end_state,
+                                id=job_index, priority=priority,
+                                partition=partition,
+                                submit_time=time_to_next_job - 100,
+                                time_limit=time_limit,
+                                start_time=time_to_next_job,
+                                end_time=time_to_next_job + wall_time,
+                                expected_run_time=wall_time, trace_time=wall_time,
+                                trace_start_time=0, trace_end_time=wall_time,
+                                trace_quanta=config['TRACE_QUANTA'] * downscale,
+                                downscale=downscale
+                                )
+            job = Job(job_info)
+            jobs.append(job)
+        return jobs
+
+    def random(self, **kwargs):
+        """ Generate random workload """
+        args = kwargs.get('args', None)
+        return self.generate_random_jobs(args=args)
+
+    def peak(self, **kwargs):
+        """Peak power test for multiple partitions"""
+        jobs = []
+
+        # Iterate through each partition and get its configuration
+        for partition in self.partitions:
+            # Fetch the config for the current partition
+            config = self.config_map[partition]
+
+            # Generate traces based on partition-specific configuration
+            cpu_util = config['CPUS_PER_NODE']
+            gpu_util = config['GPUS_PER_NODE']
+            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 10800, config['TRACE_QUANTA'])
+            net_tx, net_rx = None, None
+
+            job_time = len(gpu_trace) * config['TRACE_QUANTA']
+            # Create job info for this partition
+            job_info = job_dict(nodes_required=config['AVAILABLE_NODES'],
+                                # Down nodes, therefore doesnt work list(range(config['AVAILABLE_NODES'])),
+                                scheduled_nodes=[],
+                                name=f"Max Test {partition}",
+                                account=ACCT_NAMES[0],
+                                cpu_trace=cpu_trace,
+                                gpu_trace=gpu_trace,
+                                ntx_trace=net_tx,
+                                nrx_trace=net_rx,
+                                end_state='COMPLETED',
+                                id=None,
+                                priority=100,
+                                partition=partition,
+                                time_limit=job_time + 1,
+                                start_time=0,
+                                end_time=job_time,
+                                expected_run_time=job_time,
+                                trace_time=job_time,
+                                trace_start_time=0,
+                                trace_end_time=job_time,
+                                trace_quanta=config['TRACE_QUANTA']
+                                )
+            job = Job(job_info)
+            jobs.append(job)  # Add job to the list
+
+        return jobs
+
+    def idle(self, **kwargs):
+        jobs = []
+        # Iterate through each partition and get its configuration
+        for partition in self.partitions:
+            # Fetch the config for the current partition
+            config = self.config_map[partition]
+
+            # Generate traces based on partition-specific configuration
+            cpu_util, gpu_util = 0, 0
+            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 10800, config['TRACE_QUANTA'])
+            net_tx, net_rx = None, None
+
+            job_time = len(gpu_trace) * config['TRACE_QUANTA']
+            # Create job info for this partition
+            job_info = job_dict(
+                nodes_required=config['AVAILABLE_NODES'],
+                name=f"Idle Test {partition}",
+                account=ACCT_NAMES[0],
+                cpu_trace=cpu_trace,
+                gpu_trace=gpu_trace,
+                ntx_trace=net_tx,
+                nrx_trace=net_rx,
+                end_state='COMPLETED',
+                scheduled_nodes=[],  # list(range(config['AVAILABLE_NODES'])),
+                id=None,
+                priority=100,
+                partition=partition,
+                time_limit=job_time + 1,
+                submit_time=0,
+                start_time=0,
+                end_time=job_time,
+                expected_run_time=job_time,
+                trace_time=job_time,
+                trace_start_time=0,
+                trace_end_time=job_time,
+                trace_quanta=config['TRACE_QUANTA'])
+            job = Job(job_info)
+            jobs.append(job)  # Add job to the list
+
+        return jobs
+
+    def benchmark(self, **kwargs):
+        """Benchmark tests for multiple partitions"""
+
+        # List to hold jobs for all partitions
+        jobs = []
+        account = ACCT_NAMES[0]
+        # Iterate through each partition and its config
+        for partition in self.partitions:
+            # Fetch partition-specific configuration
+            config = self.config_map[partition]
+            net_tx, net_rx = None, None
+
+            # Max test
+            cpu_util, gpu_util = 1, 4
+            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 10800, config['TRACE_QUANTA'])
+
+            job_time = len(gpu_trace) * config['TRACE_QUANTA']
+
+            job_info = job_dict(
+                nodes_required=config['AVAILABLE_NODES'],
+                scheduled_nodes=[],  # Explicit scheduled nodes will not work due to down nodes
+                name=f"Max Test {partition}",
+                account=account,
+                cpu_trace=cpu_trace,
+                gpu_trace=gpu_trace,
+                ntx_trace=net_tx,
+                nrx_trace=net_rx,
+                end_state='COMPLETED',
+                id=None,
+                priority=100,
+                partition=partition,
+                submit_time=0,
+                time_limit=job_time + 1,
+                start_time=0,
+                end_time=job_time,
+                expected_run_time=job_time,
+                trace_time=job_time,
+                trace_start_time=0,
+                trace_end_time=job_time,
+                trace_missing_values=False,
+                trace_quanta=config['TRACE_QUANTA'])
+            job = Job(job_info)
+            jobs.append(job)
+
+            # OpenMxP run
+            cpu_util, gpu_util = 0, 4
+            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 3600, config['TRACE_QUANTA'])
+            job_time = len(gpu_trace) * config['TRACE_QUANTA']
+
+            job_info = job_dict(
+                nodes_required=config['AVAILABLE_NODES'],
+                scheduled_nodes=[],  # Explicit scheduled nodes will not work due to down nodes
+                name=f"OpenMxP {partition}",
+                account=account,
+                cpu_trace=cpu_trace,
+                gpu_trace=gpu_trace,
+                ntx_trace=net_tx,
+                nrx_trace=net_rx,
+                end_state='COMPLETED',
+                id=None,
+                priority=100,
+                partition=partition,
+                submit_time=0,
+                time_limit=job_time + 1,
+                start_time=10800,
+                end_time=14200,
+                expected_run_time=job_time,
+                trace_time=job_time,
+                trace_start_time=0,
+                trace_end_time=job_time,
+                trace_missing_values=False,
+                trace_quanta=config['TRACE_QUANTA'])
+            job = Job(job_info)
+            jobs.append(job)
+
+            # HPL run
+            cpu_util, gpu_util = 0.33, 0.79 * 4  # based on 24-01-18 run
+            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 3600, config['TRACE_QUANTA'])
+            job_time = len(gpu_trace) * config['TRACE_QUANTA']
+            job_info = job_dict(
+                nodes_required=config['AVAILABLE_NODES'],
+                scheduled_nodes=[],  # Explicit scheduled nodes will not work due to down nodes
+                name=f"HPL {partition}",
+                account=account,
+                cpu_trace=cpu_trace,
+                gpu_trace=gpu_trace,
+                ntx_trace=net_tx,
+                nrx_trace=net_rx,
+                end_state='COMPLETED',
+                id=None,
+                priority=100,
+                partition=partition,
+                submit_time=0,
+                time_limit=job_time + 1,
+                start_time=14200,
+                end_time=17800,
+                expected_run_time=job_time,
+                trace_time=job_time,
+                trace_start_time=0,
+                trace_end_time=job_time,
+                trace_missing_values=False,
+                trace_quanta=config['TRACE_QUANTA'])
+            job = Job(job_info)
+            jobs.append(job)
+
+            # Idle test
+            cpu_trace, gpu_trace = self.compute_traces(cpu_util, gpu_util, 3600, config['TRACE_QUANTA'])
+            job_time = len(gpu_trace) * config['TRACE_QUANTA']
+            job_info = job_dict(
+                nodes_required=config['AVAILABLE_NODES'],
+                scheduled_nodes=[],  # Explicit scheduled nodes will not work due to down nodes
+                name=f"Idle Test {partition}",
+                account=account,
+                cpu_trace=cpu_trace,
+                gpu_trace=gpu_trace,
+                ntx_trace=net_tx,
+                nrx_trace=net_rx,
+                end_state='COMPLETED',
+                id=None,
+                priority=100,
+                partition=partition,
+                submit_time=0,
+                time_limit=job_time + 1,
+                start_time=17800,
+                end_time=21400,
+                expected_run_time=job_time,
+                trace_time=job_time,
+                trace_start_time=0,
+                trace_end_time=job_time,
+                trace_missing_values=False,
+                trace_quanta=config['TRACE_QUANTA'])
+            job = Job(job_info)
+            jobs.append(job)
+
+        return jobs
diff --git a/raps/workloads/constants.py b/raps/workloads/constants.py
new file mode 100644
index 0000000..2ffb39e
--- /dev/null
+++ b/raps/workloads/constants.py
@@ -0,0 +1,13 @@
+"""Shared constants for workloads."""
+
+JOB_NAMES = [
+    "LAMMPS", "GROMACS", "VASP", "Quantum ESPRESSO", "NAMD",
+    "OpenFOAM", "WRF", "AMBER", "CP2K", "nek5000", "CHARMM",
+    "ABINIT", "Cactus", "Charm++", "NWChem", "STAR-CCM+",
+    "Gaussian", "ANSYS", "COMSOL", "PLUMED", "nekrs",
+    "TensorFlow", "PyTorch", "BLAST", "Spark", "GAMESS",
+    "ORCA", "Simulink", "MOOSE", "ELK"
+]
+
+ACCT_NAMES = [f"ACT{i:02d}" for i in range(1, 15)]
+MAX_PRIORITY = 500000
diff --git a/raps/workloads/distribution.py b/raps/workloads/distribution.py
new file mode 100644
index 0000000..8f3cc6f
--- /dev/null
+++ b/raps/workloads/distribution.py
@@ -0,0 +1,188 @@
+import math
+import random
+
+from raps.job import Job, job_dict
+from raps.utils import (
+    truncated_normalvariate_int,
+    truncated_normalvariate_float,
+    truncated_weibull,
+    truncated_weibull_float,
+    determine_state,
+    next_arrival_byconfargs,
+)
+
+from .constants import JOB_NAMES, ACCT_NAMES, MAX_PRIORITY
+
+class DistributionWorkload:
+
+    def job_arrival_distribution_draw_poisson(self, args, config):
+        return next_arrival_byconfargs(config, args)
+
+
+    def job_size_distribution_draw_uniform(self, args, config):
+        min_v = 1
+        max_v = config['MAX_NODES_PER_JOB']
+        if (args.jobsize_is_power_of is not None):
+            base = args.jobsize_is_power_of
+            possible_jobsizes = [base ** exp for exp in range(min_v, int(math.floor(math.log(max_v, base))))]
+            selection = random.randint(0, len(possible_jobsizes) - 1)
+            number = possible_jobsizes[selection]
+        elif (args.jobsize_is_of_degree is not None):
+            exp = args.jobsize_is_of_degree
+            possible_jobsizes = [base ** exp for base in range(min_v, int(math.floor(pow(max_v, 1 / exp))))]
+            selection = random.randint(0, len(possible_jobsizes) - 1)
+            number = possible_jobsizes[selection]
+        else:
+            number = random.randint(1, config['MAX_NODES_PER_JOB'])
+        return number
+
+
+    def job_size_distribution_draw_weibull(self, args, config):
+        min_v = 1
+        max_v = config['MAX_NODES_PER_JOB']
+        if (args.jobsize_is_power_of is not None):
+            base = args.jobsize_is_power_of
+            possible_jobsizes = [base ** exp for exp in range(min_v, int(math.floor(math.log(max_v, base))))]
+            scale = math.log(args.jobsize_weibull_scale, base)
+            shape = math.log(args.jobsize_weibull_shape, base)
+            selection = truncated_weibull(scale, shape, 0, len(possible_jobsizes) - 1)
+            number = possible_jobsizes[selection]
+        elif (args.jobsize_is_of_degree is not None):
+            exp = args.jobsize_is_of_degree
+            possible_jobsizes = [base ** exp for base in range(min_v, int(math.floor(pow(max_v, 1 / exp))))]
+            scale = math.pow(args.jobsize_weibull_scale, 1 / exp)
+            shape = math.pow(args.jobsize_weibull_shape, 1 / exp)
+            selection = truncated_weibull(scale, shape, 0, len(possible_jobsizes) - 1)
+            number = possible_jobsizes[selection]
+        else:
+            number = truncated_weibull(args.jobsize_weibull_scale, args.jobsize_weibull_shape,
+                                       1, config['MAX_NODES_PER_JOB'])
+        return number
+
+
+    def job_size_distribution_draw_normal(self, args, config):
+        min_v = 1
+        max_v = config['MAX_NODES_PER_JOB']
+        if (args.jobsize_is_power_of is not None):
+            base = args.jobsize_is_power_of
+            possible_jobsizes = [base ** exp for exp in range(min_v, int(math.floor(math.log(max_v, base))))]
+            mean = math.log(args.jobsize_normal_mean, base)
+            stddev = math.log(args.jobsize_normal_stddev, base)  # (len(possible_jobsizes) / (max_v - min_v))
+            selection = truncated_normalvariate_int(mean, stddev, 0, len(possible_jobsizes) - 1)
+            number = possible_jobsizes[selection - 1]
+        elif (args.jobsize_is_of_degree is not None):
+            exp = args.jobsize_is_of_degree
+            possible_jobsizes = [base ** exp for base in range(min_v, int(math.floor(pow(max_v, 1 / exp))))]
+            mean = math.pow(args.jobsize_normal_mean, 1 / exp)
+            stddev = math.pow(args.jobsize_normal_stddev, 1 / exp)
+            selection = truncated_weibull(mean, stddev, 0, len(possible_jobsizes) - 1)
+            number = possible_jobsizes[selection]
+        else:
+            number = truncated_normalvariate_int(
+                args.jobsize_normal_mean, args.jobsize_normal_stddev, 1, config['MAX_NODES_PER_JOB'])
+        return number
+
+
+    def cpu_utilization_distribution_draw_uniform(self, args, config):
+        return random.uniform(0.0, config['CPUS_PER_NODE'])
+
+
+    def cpu_utilization_distribution_draw_normal(self, args, config):
+        return truncated_normalvariate_float(args.cpuutil_normal_mean,
+                                             args.cpuutil_normal_stddev,
+                                             0.0, config['CPUS_PER_NODE'])
+
+
+    def cpu_utilization_distribution_draw_weibull(self, args, config):
+        return truncated_weibull_float(args.cpuutil_weibull_scale,
+                                       args.cpuutil_weibull_shape,
+                                       0.0, config['CPUS_PER_NODE'])
+
+
+    def gpu_utilization_distribution_draw_uniform(self, args, config):
+        return random.uniform(0.0, config['GPUS_PER_NODE'])
+
+
+    def gpu_utilization_distribution_draw_normal(self, args, config):
+        return truncated_normalvariate_float(args.gpuutil_normal_mean,
+                                             args.gpuutil_normal_stddev,
+                                             0.0, config['GPUS_PER_NODE'])
+
+
+    def gpu_utilization_distribution_draw_weibull(self, args, config):
+        return truncated_weibull_float(args.gpuutil_weibull_scale,
+                                       args.gpuutil_weibull_shape,
+                                       0.0, config['GPUS_PER_NODE'])
+
+
+    def wall_time_distribution_draw_uniform(self, args, config):
+        return random.uniform(config['MIN_WALL_TIME'], config['MAX_WALL_TIME'])
+
+
+    def wall_time_distribution_draw_normal(self, args, config):
+        return max(1, truncated_normalvariate_int(float(args.walltime_normal_mean),
+                   float(args.walltime_normal_stddev), config['MIN_WALL_TIME'],
+                   config['MAX_WALL_TIME']) / 3600 * 3600)
+
+
+    def wall_time_distribution_draw_weibull(self, args, config):
+        return truncated_weibull(args.walltime_weibull_scale,
+                                 args.walltime_weibull_shape,
+                                 config['MIN_WALL_TIME'], config['MAX_WALL_TIME'])
+
+
+    def generate_jobs_from_distribution(self, *,
+                                        job_arrival_distribution_to_draw_from,
+                                        job_size_distribution_to_draw_from,
+                                        cpu_util_distribution_to_draw_from,
+                                        gpu_util_distribution_to_draw_from,
+                                        wall_time_distribution_to_draw_from,
+                                        args
+                                        ) -> list[list[any]]:
+        jobs = []
+        partition = random.choice(self.partitions)
+        config = self.config_map[partition]
+        for job_index in range(args.numjobs):
+            submit_time = int(job_arrival_distribution_to_draw_from(args, config))
+            start_time = submit_time
+            nodes_required = job_size_distribution_to_draw_from(args, config)
+            name = random.choice(JOB_NAMES)
+            account = random.choice(ACCT_NAMES)
+            cpu_util = cpu_util_distribution_to_draw_from(args, config)
+            if "CORES_PER_CPU" in config:
+                cpu_cores_required = random.randint(0, config["CORES_PER_CPU"])
+            else:
+                cpu_cores_required = None
+            gpu_util = gpu_util_distribution_to_draw_from(args, config)
+            if "GPUS_PER_NODE" in config:
+                if isinstance(gpu_util, list):
+                    gpu_units_required = random.randint(0, max(config["GPUS_PER_NODE"], math.ceil(max(gpu_util))))
+                else:
+                    gpu_units_required = random.randint(0, max(config["GPUS_PER_NODE"], math.ceil(gpu_util)))
+            wall_time = wall_time_distribution_to_draw_from(args, config)
+            end_time = start_time + wall_time
+            time_limit = max(wall_time, wall_time_distribution_to_draw_from(args, config))
+            end_state = determine_state(config['JOB_END_PROBS'])
+            cpu_trace = cpu_util  # self.compute_traces(cpu_util, gpu_util, wall_time, config['TRACE_QUANTA'])
+            gpu_trace = gpu_util  # self.compute_traces(cpu_util, gpu_util, wall_time, config['TRACE_QUANTA'])
+            priority = random.randint(0, MAX_PRIORITY)
+            net_tx, net_rx = None, None
+            job_info = job_dict(nodes_required=nodes_required, name=name,
+                                account=account, cpu_trace=cpu_trace,
+                                gpu_trace=gpu_trace, ntx_trace=net_tx,
+                                nrx_trace=net_rx, end_state=end_state,
+                                id=job_index, priority=priority,
+                                partition=partition,
+                                submit_time=submit_time,
+                                time_limit=time_limit,
+                                start_time=start_time,
+                                end_time=end_time,
+                                expected_run_time=wall_time, trace_time=wall_time,
+                                trace_start_time=0, trace_end_time=wall_time,
+                                cpu_cores_required=cpu_cores_required,
+                                gpu_units_required=gpu_units_required,
+                                trace_quanta=config['TRACE_QUANTA']
+                                )
+            job = Job(job_info)
+            jobs.append(job)
+        return jobs
diff --git a/raps/workloads/live.py b/raps/workloads/live.py
new file mode 100644
index 0000000..974b369
--- /dev/null
+++ b/raps/workloads/live.py
@@ -0,0 +1,39 @@
+import math
+import numpy as np
+from raps.sim_config import SingleSimConfig
+from raps.telemetry import Telemetry
+from raps.utils import create_file_indexed
+from .utils import plot_job_hist
+
+def continuous_job_generation(self, *, engine, timestep, jobs):
+    # print("if len(engine.queue) <= engine.continuous_workload.args.maxqueue:")
+    # print(f"if {len(engine.queue)} <= {engine.continuous_workload.args.maxqueue}:")
+    if len(engine.queue) <= engine.continuous_workload.args.maxqueue:
+        new_jobs = engine.continuous_workload.generate_jobs().jobs
+        jobs.extend(new_jobs)
+
+
+def run_workload(sim_config: SingleSimConfig):
+    args = sim_config.get_legacy_args()
+    args_dict = sim_config.get_legacy_args()
+    config = sim_config.system_configs[0].get_legacy()
+
+    if sim_config.replay:
+        td = Telemetry(**args_dict)
+        jobs = td.load_from_files(sim_config.replay).jobs
+    else:
+        workload = Workload(args, config)
+        jobs = getattr(workload, sim_config.workload)(args=sim_config.get_legacy_args())
+    plot_job_hist(jobs,
+                  config=config,
+                  dist_split=sim_config.multimodal,
+                  gantt_nodes=sim_config.gantt_nodes)
+
+    out = sim_config.get_output()
+    if out:
+        timestep_start = min([x.submit_time for x in jobs])
+        timestep_end = math.ceil(max([x.submit_time for x in jobs]) + max([x.expected_run_time for x in jobs]))
+        filename = create_file_indexed('wl', path=str(out), create=False, ending="npz").split(".npz")[0]
+        # savez_compressed add npz itself, but create_file_indexed needs to check for .npz to find existing files
+        np.savez_compressed(filename, jobs=jobs, timestep_start=timestep_start, timestep_end=timestep_end, args=args)
+        print(filename + ".npz")  # To std-out to show which npz was created.
diff --git a/raps/workloads/multitenant.py b/raps/workloads/multitenant.py
new file mode 100644
index 0000000..61d7c32
--- /dev/null
+++ b/raps/workloads/multitenant.py
@@ -0,0 +1,154 @@
+import random
+from raps.job import Job, job_dict
+from .constants import ACCT_NAMES, MAX_PRIORITY
+
+class MultitenantWorkload:
+
+    def multitenant(self, **kwargs):
+        """
+        Generate deterministic jobs to validate multitenant scheduling & power.
+
+        usage example:
+
+            python main.py run-multi-part -x mit_supercloud -w multitenant
+
+        Parameters
+        ----------
+        mode : str
+            One of:
+              - 'ONE_JOB_PER_NODE_ALL_CORES'
+              - 'TWO_JOBS_PER_NODE_SPLIT'
+              - 'STAGGERED_JOBS_PER_NODE'
+        wall_time : int
+            Duration (seconds) of each job (default: 3600)
+        trace_quanta : int
+            Sampling interval for traces; defaults to config['TRACE_QUANTA']
+
+        Returns
+        -------
+        list[dict]
+            List of job_dict entries.
+        """
+        mode = kwargs.get('mode', 'TWO_JOBS_PER_NODE_SPLIT')
+        wall_time = kwargs.get('wall_time', 3600)
+
+        jobs = []
+
+        for partition in self.partitions:
+            cfg = self.config_map[partition]
+            trace_quanta = kwargs.get('trace_quanta', cfg['TRACE_QUANTA'])
+
+            cores_per_cpu = cfg.get('CORES_PER_CPU', 1)
+            cpus_per_node = cfg.get('CPUS_PER_NODE', 1)
+            cores_per_node = cores_per_cpu * cpus_per_node
+            gpus_per_node = cfg.get('GPUS_PER_NODE', 0)
+
+            n_nodes = cfg['AVAILABLE_NODES']
+
+            def make_trace(cpu_util, gpu_util):
+                return self.compute_traces(cpu_util, gpu_util, wall_time, trace_quanta)
+
+            job_id_ctr = 0
+
+            if mode == 'ONE_JOB_PER_NODE_ALL_CORES':
+                # Each node runs one job that consumes all cores/GPUs
+                for nid in range(n_nodes):
+                    cpu_trace, gpu_trace = make_trace(cores_per_node, gpus_per_node)
+                    jobs.append(Job(job_dict(
+                        nodes_required=1,
+                        cpu_cores_required=cores_per_node,
+                        gpu_units_required=gpus_per_node,
+                        name=f"MT_full_node_{partition}_{nid}",
+                        account=random.choice(ACCT_NAMES),
+                        cpu_trace=cpu_trace,
+                        gpu_trace=gpu_trace,
+                        ntx_trace=[], nrx_trace=[],
+                        end_state='COMPLETED',
+                        id=job_id_ctr,
+                        priority=random.randint(0, MAX_PRIORITY),
+                        partition=partition,
+                        submit_time=0,
+                        time_limit=wall_time,
+                        start_time=0,
+                        end_time=wall_time,
+                        expected_run_time=wall_time,
+                        trace_time=wall_time,
+                        trace_start_time=0,
+                        trace_end_time=wall_time,
+                        trace_quanta=cfg['TRACE_QUANTA']
+                    )))
+                    job_id_ctr += 1
+
+            elif mode == 'TWO_JOBS_PER_NODE_SPLIT':
+                # Two jobs per node: split CPU/GPU roughly in half
+                for nid in range(n_nodes):
+                    cpu_a = cores_per_node // 2
+                    cpu_b = cores_per_node - cpu_a
+                    gpu_a = gpus_per_node // 2
+                    gpu_b = gpus_per_node - gpu_a
+
+                    for idx, (c_req, g_req, tag) in enumerate([(cpu_a, gpu_a, 'A'),
+                                                               (cpu_b, gpu_b, 'B')]):
+                        cpu_trace, gpu_trace = make_trace(c_req, g_req)
+                        jobs.append(Job(job_dict(
+                            nodes_required=1,  # still one node; multitenant RM packs cores
+                            cpu_cores_required=c_req,
+                            gpu_units_required=g_req,
+                            name=f"MT_split_node_{partition}_{nid}_{tag}",
+                            account=random.choice(ACCT_NAMES),
+                            cpu_trace=cpu_trace,
+                            gpu_trace=gpu_trace,
+                            ntx_trace=[], nrx_trace=[],
+                            end_state='COMPLETED',
+                            id=job_id_ctr,
+                            priority=random.randint(0, MAX_PRIORITY),
+                            partition=partition,
+                            submit_time=0,
+                            time_limit=wall_time,
+                            start_time=0,
+                            end_time=wall_time,
+                            expected_run_time=wall_time,
+                            trace_time=wall_time,
+                            trace_start_time=0,
+                            trace_end_time=wall_time,
+                            trace_quanta=cfg['TRACE_QUANTA']
+                        )))
+                        job_id_ctr += 1
+
+            elif mode == 'STAGGERED_JOBS_PER_NODE':
+                # Three jobs per node, staggered starts: 0, wall_time/3, 2*wall_time/3
+                offsets = [0, wall_time // 3, 2 * wall_time // 3]
+                cpu_each = cores_per_node // 3 or 1
+                gpu_each = max(1, gpus_per_node // 3) if gpus_per_node else 0
+
+                for nid in range(n_nodes):
+                    for k, offset in enumerate(offsets):
+                        cpu_trace, gpu_trace = make_trace(cpu_each, gpu_each)
+                        jobs.append(Job(job_dict(
+                            nodes_required=1,
+                            cpu_cores_required=cpu_each,
+                            gpu_units_required=gpu_each,
+                            name=f"MT_stagger_node_{partition}_{nid}_{k}",
+                            account=random.choice(ACCT_NAMES),
+                            cpu_trace=cpu_trace,
+                            gpu_trace=gpu_trace,
+                            ntx_trace=[], nrx_trace=[],
+                            end_state='COMPLETED',
+                            id=job_id_ctr,
+                            priority=random.randint(0, MAX_PRIORITY),
+                            partition=partition,
+                            submit_time=offset,
+                            time_limit=wall_time,
+                            start_time=offset,
+                            end_time=offset + wall_time,
+                            expected_run_time=wall_time,
+                            trace_time=wall_time,
+                            trace_start_time=0,
+                            trace_end_time=wall_time,
+                            trace_quanta=cfg['TRACE_QUANTA']
+                        )))
+                        job_id_ctr += 1
+            else:
+                raise ValueError(f"Unknown multitenant mode: {mode}")
+
+        return jobs
diff --git a/raps/workloads/utils.py b/raps/workloads/utils.py
new file mode 100644
index 0000000..d673ddf
--- /dev/null
+++ b/raps/workloads/utils.py
@@ -0,0 +1,159 @@
+import math
+import numpy as np
+import matplotlib.pyplot as plt
+
+
+def plot_job_hist(jobs, config=None, dist_split=None, gantt_nodes=False):
+    # put args.multimodal in dist_split!
+    split = [1.0]
+    num_dist = 1
+    if dist_split:
+        num_dist = len(dist_split)
+        split = dist_split
+
+    y = [y.nodes_required for y in jobs]
+    x = [x.expected_run_time for x in jobs]
+    x2 = [x.time_limit for x in jobs]
+    fig_m = plt.figure()
+    gs = fig_m.add_gridspec(30, 1)
+    gs0 = gs[0:20].subgridspec(500, 500, hspace=0, wspace=0)
+    gs1 = gs[24:].subgridspec(1, 1)
+
+    ax_top = fig_m.add_subplot(gs0[:])
+    ax_top.axis('off')
+    ax_top.set_title('Job Distribution')
+
+    ax_bot = fig_m.add_subplot(gs1[:])
+    ax_bot.axis('off')
+    ax_bot.set_title('Submit Time + Wall Time')
+
+    # ax0 = fig_m.add_subplot(gs[:2,:])
+    # ax1 = fig_m.add_subplot(gs[2:,:])
+
+    # gss = gridspec.GridSpec(5, 5, figure=ax0)
+    # fig, axs = plt.subplots(2, 2, gridspec_kw={'width_ratios': (4, 1), 'height_ratios': (1, 4)})
+    axs = []
+    col = []
+    col.append(fig_m.add_subplot(gs0[:100, :433]))
+    col.append(fig_m.add_subplot(gs0[:100, 433:]))
+    axs.append(col.copy())
+    col = []
+    col.append(fig_m.add_subplot(gs0[100:, :433]))
+    col.append(fig_m.add_subplot(gs0[100:, 433:]))
+    axs.append(col.copy())
+
+    ax_b = fig_m.add_subplot(gs1[:, :])
+
+    # Create scatter plot
+    for i in range(len(x)):
+        axs[1][0].plot([x[i], x2[i]], [y[i], y[i]], color='lightblue', zorder=1)
+    axs[1][0].scatter(x2, y, marker='.', c='lightblue', zorder=2)
+    axs[1][0].scatter(x, y, zorder=3)
+
+    cpu_util = [x.cpu_trace for x in jobs]
+    if isinstance(cpu_util[0], np.ndarray):
+        cpu_util = np.concatenate(cpu_util).ravel()
+    elif isinstance(cpu_util[0], list):
+        cpu_util = [sum(part) / len(part) for part in cpu_util]
+    gpu_util = [x.gpu_trace for x in jobs]
+    if isinstance(gpu_util[0], np.ndarray):
+        gpu_util = np.concatenate(gpu_util).ravel()
+    elif isinstance(gpu_util[0], list):
+        gpu_util = [sum(part) / len(part) for part in gpu_util]
+    if not all([x == 0 for x in gpu_util]):
+        axs[0][1].scatter(cpu_util, gpu_util, zorder=2, marker='.', s=0.2)
+        axs[0][1].hist(gpu_util, bins=100, orientation='horizontal', zorder=1, density=True, color='tab:purple')
+        axs[0][1].axhline(np.mean(gpu_util), color='r', linewidth=1, zorder=3)
+        axs[0][1].set(ylim=[0, config['GPUS_PER_NODE']])
+        axs[0][1].set_ylabel("gpu util")
+        axs[0][1].yaxis.set_label_coords(1.15, 0.5)
+        axs[0][1].yaxis.set_label_position("right")
+        axs[0][1].yaxis.tick_right()
+    else:
+        axs[0][1].set_yticks([])
+    axs[0][1].hist(cpu_util, bins=100, orientation='vertical', zorder=1, density=True, color='tab:cyan')
+    axs[0][1].axvline(np.mean(cpu_util), color='r', linewidth=1, zorder=3)
+    axs[0][1].set(xlim=[0, config['CPUS_PER_NODE']])
+    axs[0][1].set_xlabel("cpu util")
+    axs[0][1].xaxis.set_label_coords(0.5, 1.30)
+    axs[0][1].xaxis.set_label_position("top")
+    axs[0][1].xaxis.tick_top()
+    axs[0][0].hist(x2, bins=max(1, math.ceil(min(100, (max(x2) - min(x))))), orientation='vertical', color='lightblue')
+    axs[0][0].hist(x, bins=max(1, math.ceil(min(100, (max(x2) - min(x))))), orientation='vertical')
+    axs[1][0].sharex(axs[0][0])
+    axs[1][1].hist(y, bins=max(1, min(100, (max(y) - min(y)))), orientation='horizontal')
+    axs[1][0].sharey(axs[1][1])
+
+    # Remove ticks
+    axs[0][0].set_xticks([])
+    axs[1][1].set_yticks([])
+    axs[0][1].spines['top'].set_color('white')
+    axs[0][1].spines['right'].set_color('white')
+    axs[1][0].set_ylabel("nodes [N]")
+    axs[1][0].set_xlabel("wall time [hh:mm]")
+    minx_s = 0
+    maxx_s = math.ceil(max(x2))
+    x_label_mins = [n for n in np.arange(minx_s // 60, maxx_s // 60)]
+    x_label_ticks = [n * 60 for n in x_label_mins[0::60]]
+    x_label_str = [str(x1).zfill(2) + ":" + str(x2).zfill(2) for
+                   (x1, x2) in [(n // 60, n % 60) for
+                                n in x_label_mins[0::60]]]
+    axs[1][0].set_xticks(x_label_ticks, x_label_str)
+    miny = min(y)
+    maxy = max(y)
+    interval = max(1, maxy // 10)
+    y_ticks = np.arange(0, maxy, interval)
+    y_ticks[0] = miny
+    axs[1][0].set_yticks(y_ticks)
+
+    axs[0][0].tick_params(axis="x", labelbottom=False)
+    axs[1][1].tick_params(axis="y", labelleft=False)
+
+    # Submit_time and Wall_time
+    duration = [x.expected_run_time for x in jobs]
+    nodes_required = [x.nodes_required for x in jobs]
+    submit_t = [x.submit_time for x in jobs]
+
+    offset = 0
+    split_index = 0
+    split_offset = math.floor(len(x) * split[split_index])
+    if gantt_nodes:
+        if split[0] == 0.0:
+            ax_b.axhline(y=offset, color='red', linestyle='--', lw=0.5)
+            split_index += 1
+        for i in range(len(x)):
+            # ax_b.barh(i,duration[i], height=1.0, left=submit_t[i])
+            ax_b.barh(offset + nodes_required[i] / 2, duration[i], height=nodes_required[i], left=submit_t[i])
+            offset += nodes_required[i]
+            if i != len(x) - 1 and i == split_offset - 1 and split_index < len(split):
+                ax_b.axhline(y=offset, color='red', linestyle='--', lw=0.5)
+                split_index += 1
+                split_offset += math.floor(len(x) * split[split_index])
+                # ax_b.axhline(y=(len(x)/num_dist * i)-0.5, color='red', linestyle='--',lw=0.5)
+        if split[-1] == 0.0:
+            ax_b.axhline(y=offset, color='red', linestyle='--', lw=0.5)
+            split_index += 1
+        ax_b.set_ylabel("Jobs' acc. nodes")
+    else:
+        for i in range(len(x)):
+            ax_b.barh(i, duration[i], height=1.0, left=submit_t[i])
+        for i in range(1, num_dist):
+            if num_dist == 1:
+                break
+            ax_b.axhline(y=(len(x) * split[split_index]) - 0.5, color='red', linestyle='--', lw=0.5)
+            split_index += 1
+        ax_b.set_ylabel("Job ID")
+        # ax_b labels:
+    ax_b.set_xlabel("time [hh:mm]")
+    minx_s = 0
+    maxx_s = math.ceil(max([x.expected_run_time for x in jobs]) + max([x.submit_time for x in jobs]))
+    x_label_mins = [n for n in np.arange(minx_s // 60, maxx_s // 60)]
+    x_label_ticks = [n * 60 for n in x_label_mins[0::60]]
+    x_label_str = [str(x1).zfill(2) + ":" + str(x2).zfill(2) for
+                   (x1, x2) in [(n // 60, n % 60) for
+                                n in x_label_mins[0::60]]]
+
+    ax_b.set_xticks(x_label_ticks, x_label_str)
+    ax_b.yaxis.set_inverted(True)
+
+    plt.show()
-- 
GitLab