LSF作业管理系统
在上一篇文章中,我们简要介绍了PBS作业管理系统,现在我们将介绍LSF作业管理系统。
LSF (Load Sharing Facility)是一种广泛使用的作业管理系统,具有高吞吐量和灵活配置的优点。通过LSF集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。
使用bsub提交作业有三种方式:
您可以在bsub的命令行中直接输入完整的参数来提交作业,例如:
使用的参数描述如下:
这种方法更适合提交简单的作业,更复杂的作业控制需要编写作业脚本。
LSF作业脚本本质上也是一个shell脚本,其中bsub作业参数可以用以#BSUB开头的行来表示。以下是LSF工作脚本的示例:
参数描述如下:
使用以下命令提交作业脚本:
在终端输入bsub,回车进入bsub交互环境,可以输入作业参数,执行作业程序。在bsub交互式环境中,可以一次提交具有相同参数的多个作业,例如:
使用Ctrl+D退出bsub交互环境。
您可以使用bjobs命令查看用户正在运行的作业:
使用作业的-l参数和JOBID查看作业的详细信息:
使用bkill命令中止作业:
上面简单介绍了LSF作业管理系统,我们将在下一篇文章中介绍SLURM资源管理系统。