我在服务器上使用Sun GridEngine(Rocks Cluster)来运行远程作业。
当我尝试用qdel删除作业时,它经常按预期工作,但是qdel会删除几乎所有find的东西。
例如,在今天的某个时候,我有77个正在运行的工作:
[znorg @ server MD] $ qstat
作业ID先前的名称用户状态提交/开始在队列槽ja-task-ID
-------------------------------------------------- -------------------------------------------------- -------------
7711 0.55500 shg_oAll_c znorg dr 10/30/2012 13:49:07 [email protected] 1
7712 0.55500 shg_oCAB_c znorg dr 10/30/2012 13:49:07 [email protected] 1
7873 0.55500 a1h3l_prdA znorg r 11/08/2012 13:37:22 [email protected] 1
7874 0.55500 a1t8k_obsA znorg r 11/08/2012 13:37:22 [email protected] 1
7875 0.55500 a1t8k_prdA znorg r 11/08/2012 13:37:37 [email protected] 1
7877 0.55500 a3zr8_prdA znorg r 11/08/2012 13:37:37 [email protected] 1
7878 0.55500 b1nez_obsA znorg r 11/08/2012 13:37:52 [email protected] 1
7880 0.55500 b2j73_obsA znorg r 11/08/2012 13:37:52 [email protected] 1
(......)
7955 0.55500 b2qcp_prdE znorg r 11/08/2012 13:44:07 [email protected] 1
7956 0.55500 c3o2e_obsE znorg r 11/08/2012 13:44:22 [email protected] 1
7960 0.55500 c3zzp_obsE znorg r 11/08/2012 13:44:37 [email protected] 1
7995 0.55500 s1enh_prdA znorg r 11/22/2012 16:06:24 [email protected] 1
7996 0.55500 s1igd_prdA znorg r 11/22/2012 16:06:39 [email protected] 1
7997 0.55500 s1ixs_prdA znorg r 11/22/2012 16:06:39 [email protected] 1
(......)
8008 0.55500 s1igd_prdD znorg r 11/22/2012 16:07:39 [email protected] 1
8009 0.55500 s1ixs_prdD znorg r 11/22/2012 16:07:39 [email protected] 1
8010 0.55500 s1shg_prdD znorg r 11/22/2012 16:07:39 [email protected] 1
我想删除最近的16个工作,所以我input:
[znorg @ server MD] $ qdel 7995 7996 7997 7998 7999 8000 8001 8002 8003 8004 8005 8006 8007 8008 8009 8010
其中返回:
znorg已经注册了作业7995删除 znorg已经注册了作业7996删除 znorg注册了作业7997删除 znorg注册了作业7998进行删除 znorg已将作业7999注册为删除 znorg已经注册了作业8000删除 znorg已经注册了作业8001以供删除 znorg已经注册了作业8002以供删除 znorg已经注册了作业8003以供删除 znorg已经注册了作业8004以供删除 znorg已经注册了作业8005以供删除 znorg已经注册了作业8006以供删除 znorg已经注册了作业8007以供删除 znorg已经注册了作业8008以供删除 znorg已经注册了作业8009以供删除 znorg已经注册了作业8010以供删除
到目前为止,看起来像预期的那样。
但是当我再次检查时,几乎所有其他的工作都没有了:
[znorg @ server MD] $ qstat
作业ID先前的名称用户状态提交/开始在队列槽ja-task-ID
-------------------------------------------------- -------------------------------------------------- -------------
7712 0.55500 shg_oCAB_c znorg dr 10/30/2012 13:49:07 [email protected] 1
7893 0.55500 a1t8k_prdB znorg r 11/08/2012 13:39:07 [email protected] 1
7929 0.55500 a1t8k_prdD znorg r 11/08/2012 13:42:07 [email protected] 1
难道我做错了什么? 这里会发生什么?
看来工作完成了。 我没有看到你的qdel命令有什么问题。 而最后你得到的数字看起来不是qdel动作。 你可以检查一些工作信息:
qacct -o znorg -j Job-ID