Category: 论文阅读 | 果冻甜甜的

0%

论文阅读 Category

2026

01-16

AMPeD: An Analytical Model for Performance in Distributed Training of Transformers

2025

12-28

Reducing Energy Bloat in Large Model Training

12-28

Rail-only: A Low-Cost High-Performance Network for Training LLMs with Trillion Parameters

11-23

Reducing Activation Recomputation in Large Transformer Models

11-23

Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM

11-22

InstructCoder: Instruction Tuning Large Language Models for Code Editing

11-22

Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism

08-17

lumos:Efficient Performance Modeling and Estimation for Large-scale LLM Training