LSF作业管理系统

在上一篇文章中,我们简要介绍了PBS作业管理系统,现在我们将介绍LSF作业管理系统。

LSF (Load Sharing Facility)是一种广泛使用的作业管理系统,具有高吞吐量和灵活配置的优点。通过LSF集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。

使用bsub提交作业有三种方式:

您可以在bsub的命令行中直接输入完整的参数来提交作业,例如:

使用的参数描述如下:

这种方法更适合提交简单的作业,更复杂的作业控制需要编写作业脚本。

LSF作业脚本本质上也是一个shell脚本,其中bsub作业参数可以用以#BSUB开头的行来表示。以下是LSF工作脚本的示例:

参数描述如下:

使用以下命令提交作业脚本:

在终端输入bsub,回车进入bsub交互环境,可以输入作业参数,执行作业程序。在bsub交互式环境中,可以一次提交具有相同参数的多个作业,例如:

使用Ctrl+D退出bsub交互环境。

您可以使用bjobs命令查看用户正在运行的作业:

使用作业的-l参数和JOBID查看作业的详细信息:

使用bkill命令中止作业:

上面简单介绍了LSF作业管理系统,我们将在下一篇文章中介绍SLURM资源管理系统。