Fix llama3 pretraining NeMo 2.0 script (NVIDIA#10307)

Signed-off-by: Hemil Desai <hemild@nvidia.com>
tbartley94 · Aug 31, 2024 · b698ae5 · b698ae5
1 parent 9a22005
commit b698ae5
Showing 1 changed file with 1 addition and 3 deletions.
diff --git a/examples/llm/run/llama3_pretraining.py b/examples/llm/run/llama3_pretraining.py
@@ -140,7 +140,7 @@ def main():
     # Uses configs from NeMo directly
     pretrain = MODEL_SIZE_MAPPING[args.size]["nemo"]["pretrain"](
         name=exp_name,
-        ckpt_dir=f"/{exp_name}/checkpoints",
+        ckpt_dir="/nemo_run/checkpoints",
     )
 
     # Overwrite the dataloader in the recipe to use your custom dataloader.
@@ -170,8 +170,6 @@ def main():
         executor = local_executor_torchrun(nodes=pretrain.trainer.num_nodes, devices=pretrain.trainer.devices)
 
     with run.Experiment(f"{exp_name}{args.tag}") as exp:
-        pretrain.log.dir = f"/{exp_name}/checkpoints"
-
         for i in range(1):
             exp.add(
                 pretrain,