有什么办法,我可以validation页面的内容,如果它们存在吗? 就像我打开google.com,如果其网页内容中有“错误”,那么我可以知道该网页打开不正确。 (我已经知道如何检查页面状态码检查,如200,400,404或500等),我实际上有兴趣获取和比较页面的内容与string,并采取所需的行动,基于该string
我不知道如何使用curl转储格式化的Web文件。 如果您只是使用curl下载网站,并在其中进行stringsearch,则最终可能会得到错误的结果。 所有的html标签,JavaScript代码…将被search。
您可以尝试使用lynx ,文本命令行浏览器,将-dump选项设置为格式化输出,然后执行grep来查找string匹配。
root@localhost:/t# lynx -dump www.google.com | grep -i "Feeling Lucky" Google Search I'm Feeling Lucky [12]Advanced search