金融界 2024 年 11 月 30 日消息,国家知识产权局信息显示,浪潮云信息技术股份公司申请一项名为“大模型训练任务的 GPU 资源可视化方法及装置、介质、设备”的专利,公开号 CN 119046112 A,申请日期为 2024 年 8 月。
专利摘要显示,本发明提供一种大模型训练任务的 GPU 资源可视化方法及装置、介质、设备,该方法包括:接收大模型平台后端发送来的模型训练任务对应的任务 ID 和训练参数;根据所述训练参数,为所述模型训练任务选择对应的训练节点;在选择的所述训练节点上启动训练进程,以执行所述模型训练任务;在所述模型训练任务的执行过程中,通过 nvidia‑smi 命令查询所述任务 ID 对应的 GPU 消耗资源定时将查询到的 GPU 消耗资源反馈给所述大模型平台后端,以使所述大模型平台后端将所述GPU 消耗资源反馈给大模型平台进行可视化展示。本发明可以实现 GPU消耗资源可视化,进而可以帮助管理和优化 GPU 资源。
正文完
发表至: IT专栏
2024-12-02