当前位置:首页 > IBM Platform LSF家族安装和配置简介 V1.0
exit 0
在lsf.conf中定义LSB_ESUB_METHOD=”project”
2.10 配置资源管理elim示例
2.10.1 汇报home目录空闲大小
编辑elim文件elim.home,放置在$LSF_SERVERDIR下面。chmod为可执行。 #!/bin/sh
while true ; do
home=`df -k /home | tail -1 | awk '{printf \$4/(1024*1024)}'`
echo 1 home $home sleep 30 done
2.10.2 汇报root进程数目
编辑elim.root,放置在$LSF_SERVERDIR下面。chmod为可执行。 #!/bin/sh
while true ; do
root=`ps -ef | grep -v grep | grep -c ^root` echo 1 rootprocs $root sleep 30 done
2.10.3 汇报应用程序许可证数目 #!/bin/sh lic_X=0 ; num=0 while true ; do
# only want the master to gather lic_X if [ \
lic_X=`lmstat –a –c lic_X.dat | grep ...`>&2 fi
# only want training8, training1 to gather simpton licenses
13 | Page
if [ \ –o \
num=`lmstat –a –c simpton_lic.dat | grep ...`>&2 fi
# all hosts including master, will gather the following root=`ps –efw | grep –v grep | grep –c root`>>1&2 tmp=`df –k /var/tmp | grep var | awk '{print $4 /1024}'`>&2
if [ \
echo 4 lic_X $lic_X simpton $num rtprc $root tmp $tmp else
echo 3 simpton $num rtprc $root tmp $tmp fi
# the same INTERVAL values defined in lsf.shared sleep 60 done
2.10.4 测试elim脚本
直接运行./elim.root查看elim输出是否正确。
2.10.5 添加资源定义和资源地图
在lsf.shared文件中添加rootprocs 定义,并在lsf.cluster resources Map中添加资源和节点的映射关系。
使能配置:lsadmin reconfig; badmin reconfig 2.10.6 查看资源数目 lsload –l
3 LSF命令行集成应用示例
本节例举几个应用的不同集成方式。使用spooling文件或者bsub命令行都可以自由转换。
14 | Page
3.1 CFD++集成(spooling file)
3.1.1 CFD++安装和许可证 安装路径:ln-3620-4
许可证:/gpfs/software/cfdpp/mbin/Metacomp.lic 许可证服务器:ln-3620-4 启动许可证服务器:
[hpcadmin@mn-3650 jessi]$ ssh ln-3620-4
Last login: Tue Mar 26 19:19:24 2013 from mn-3650.private.dns.zone [hpcadmin@ln-3620-4 ~]$ /gpfs/software/cfdpp/mbin/lmgrd -c /gpfs/software/cfdpp/mbin/Metacomp.lic 确认许可证服务器是否正常运行:
/gpfs/software/cfdpp/mbin/lmutil lmstat -a -c /gpfs/software/cfdpp/mbin/Metacomp.lic 3.1.2 集成许可证管理elim
添加elim方法:(elim全集群只需运行一个,因此只在头节点放置elim脚本即可) 在头节点:cd $LSF_SERVERDIR 添加如下文件:elim.lic:
[root@mn-3650 jessi]# cd $LSF_SERVERDIR [root@mn-3650 etc]# pwd
/opt/lsf/8.3/linux2.6-glibc2.3-x86_64/etc [root@mn-3650 etc]# cat elim.lic #!/bin/sh totallicences=`/gpfs/software/cfdpp/mbin/lmutil lmstat -a -c /gpfs/software/cfdpp/mbin/Metacomp.lic |grep \ while true do usedlicences=`/gpfs/software/cfdpp/mbin/lmutil lmstat -a -c /gpfs/software/cfdpp/mbin/Metacomp.lic | /bin/grep \ -f13` cfd_lic=$(( ${totallicences}-${usedlicences} )) echo \ /bin/sleep 30 done 15 | Page
[root@mn-3650 etc]# chmod a+x elim.lic 修改如下的配置文件:
[root@mn-3650 etc]# vi $LSF_ENVDIR/lsf.shared 添加如下一行:
cfd_lic Numeric 30 Y (CFD++ License) [root@mn-3650 etc]# vi $LSF_ENVDIR/lsf.cluster 在resourcemap一段添加如下一行: Begin ResourceMap
RESOURCENAME LOCATION cfd_lic [all] hostid [default] …
[root@mn-3650 etc]# lsadmin reconfig; badmin reconfig 3.1.3 添加CFD++ job starter
如果使用spooling file可不用添加。(Portal集成方式使用) 添加jobstarter可执行文件:
[hpcadmin@mn-3650 jessi]$ cat /opt/lsf/jobstarter/cfd_starter #!/bin/sh MPI_RUN=/gpfs/software/cfdpp/hpmpi/bin/mpirun case \ SINGLE_PRESSION) CFD_CMD=/gpfs/software/cfdpp/mbin/mcfd.11.1/r4_hpmpimcfd ;; DOUBLE_PRESSION) CFD_CMD=/gpfs/software/cfdpp/mbin/mcfd.11.1/hpmpimcfd ;; esac CMD=\ eval \ 16 | Page
共分享92篇相关文档