4.4_nvidia-smi
4.4 nvidia-smi
nvidia-smi意指英伟达系统管理的接口,用于管理英伟达特斯拉服务器级GPU板的运行环境。它可以报告GPU的状态和GPU执行的控制信息,例如是否启用ECC以及在一个给定的GPU上可以创建多少CUDA上下文。
当nvidia-smi由--help(-h)选项调用时,它会产生一个用法消息。消息中除了简要说明其目的和命令行选项外,还给出了一个所支持的产品列表。特斯拉服务器系列和Quadro系列的GPU是被完全支持的,而 GeForce系列的GPU只能得到部分支持。
nvidia-smi支持的许多GPU板包含多个GPU。nvidia-smi把每个GPU板称为“单元”。一些操作,如切换LED(发光二极管)的状态,仅在每个单元的意义下可用。
nvidia-smi有几种操作模式。如果没有提供其他命令行参数,它会给出可用GPU的摘要,可以使用表4-11中的命令行选项进一步处理。其他可选用的命令行选项包括以下几种内容:
表4-11 nvidia-smi列表选项
列表:--list-gpus(-L)选项显示可用的GPU和其UUID的列表。对所列信息可以使用附加选项进一步细化,附加选项汇总于表4-11中。
·查询:--query(-q)选项显示GPU或“单元”信息。对所查询信息可以使用附加选项进一步细化,附加选项汇总于表4-12中。
表4-12 nvidia-smi查询选项
·文档类型定义(DTD):--tdd选项产生nvidia-smi的XML格式输出的文档类型定义。可选的--filename(-f)选项可以指定输出文件;--unit(-u)选项使得GPU板(而不是GPU)的DTD被写入文件。
·设备修改:表4-13中指定的选项可用于设置GPU的持久化状态,比如是否启用ECC(纠错检查)。
表4-13 nvidia-smi设备修改选项
· “单元”修改:--toggle-led选项可以设定为0/GREEN或1/AMBER。--id(-i)选项可以用来指定目标单元。