LLM-分布式训练工具(一):DeepSpeed【微软】【大模型分布式训练工具,实现ZeRO并行训练算法】【zero3配置将模型参数切分后分配到不同的显卡中,突破单张显卡容量不足以加载模型参数的限制】
2024-12-27 01:14 浏览:96
llama-factory是一个用于深度学习模型开发和训练的开源库,它提供了各种工具和功能来简化模型开发的流程。在llama-factory中,llm和lora是两种常用的模型类型,它们分别代表了不同的深度学习模型架构。