Fixed dataloader CPU bottleneck for small batch sizes (#7659)

Co-authored-by: Glenn Jocher <glenn.jocher@ultralytics.com>
2025-10-28 12:25:39 +08:00 · 2024-01-19 16:49:54 +01:00 · 2024-01-19 16:49:54 +01:00 · c267bd3a0c
commit c267bd3a0c
parent 7a39ecd0d3
2 changed files with 2 additions and 5 deletions
--- a/ultralytics/data/build.py
+++ b/ultralytics/data/build.py
@ -107,7 +107,7 @@ def build_dataloader(dataset, batch, workers, shuffle=True, rank=-1):
    """Return an InfiniteDataLoader or DataLoader for training or validation set."""
    batch = min(batch, len(dataset))
    nd = torch.cuda.device_count()  # number of CUDA devices
-    nw = min([os.cpu_count() // max(nd, 1), batch, workers])  # number of workers
+    nw = min([os.cpu_count() // max(nd, 1), workers])  # number of workers
    sampler = None if rank == -1 else distributed.DistributedSampler(dataset, shuffle=shuffle)
    generator = torch.Generator()
    generator.manual_seed(6148914691236517205 + RANK)
--- a/ultralytics/engine/trainer.py
+++ b/ultralytics/engine/trainer.py
@ -332,10 +332,7 @@ class BaseTrainer:
            f'Image sizes {self.args.imgsz} train, {self.args.imgsz} val\n'
            f'Using {self.train_loader.num_workers * (world_size or 1)} dataloader workers\n'
            f"Logging results to {colorstr('bold', self.save_dir)}\n"
-            f'Starting training for '
-            f'{self.args.time} hours...'
-            if self.args.time
-            else f"{self.epochs} epochs..."
+            f'Starting training for ' + (f"{self.args.time} hours..." if self.args.time else f"{self.epochs} epochs...")
        )
        if self.args.close_mosaic:
            base_idx = (self.epochs - self.args.close_mosaic) * nb