Intereting Posts

如何防止在syslog注册crontab日志？ batch file删除最近3天未修改的文件夹的内容？如何远程安装，configuration和维护SNMP？自动虚拟主机文件夹在Apache 2.2 使用30GB数据备份Web服务器的最佳方法是什么？ VPC内部路由如何在Linux中configurationVMWare Workstation以接受RDP连接哪些服务需要正确configurationPTRlogging？ 5.5.0 smtp; 554交易失败的垃圾邮件未排队我在哪里开始重新：我的物理应用程序服务器移动到虚拟机？更好的方式来查看Windows证书比MMC？在写入文件夹的php脚本中运行system（）命令需要什么权限？ Mongodb：页面文件太小，在Win2012上v2.6.4 如何将apache虚拟主机redirect到另一台服务器？任何最新的教程，如何在Debian上使用虚拟用户来设置Postfix + Dovecot？

如何编写一个shell脚本来从文件中的一个位置进行search，而不是从文件开头再次开始

我正在尝试编写一个shell脚本，以便在使用for循环的数百万行的大文件中查找重复性单词后存储的值。 find重复的单词之后，我如何让脚本在文件中的当前行之后开始search，以便循环迭代时不会从文件的开始处开始search。

简单地说，如何在文件中查找当前行，以及如何在循环重新迭代时从该行开始search，而不是从头开始search。

我可以运行多less个并行控制器，有没有限制，或者我们需要运行，取决于我们的CPU和RAM的利用率。

如果程序启动成功，这就是我在日志文件中查找的内容。

要查找当前文件大小，您可以使用：

current_pos=$(stat -c "%s" file)

然后你使用输出

 tail -c +$current_pos file

从记住的位置开始search。

但是，当你读取文件大小（也是当你search的时候）最后一行是不完整的。这取决于写入文件的程序。