如何为多字节连字符重写unicode字节序列

我们有一些Adobe PDF文件将连字符格式化为%E2%80%90的情况。 请参阅http://forums.adobe.com/message/2807241这是由我猜的Calibri字体造成的。

所以这些pdf文件已经发布,链接不起作用所以我认为国防部重写会来救援。

我跟着这个post在这里mod_ReWrite删除部分的url,但我似乎无法search根据这个问题的%字符。

还有什么我可以做的吗?

这是我想要使用的重写规则:

RewriteRule ^foo%(.+)bar /foo-bar [L,R=301] 

我也试过这个,它不工作

 RewriteRule ^foo%E2%80%90bar /foo-bar [L,R=301] 

有任何想法吗?

使用这个问题的答案,我能够想出这个固定我自己的unicode-hyphen-links-in-pdfs问题的.htaccess规则:

 # for janky pdfs with links using unicode hyphens RewriteRule ^([^_]*)\x25E2\x2580\x2590([^_]*_.*) $1-$2 [N] RewriteRule ^([^_]*)\x25E2\x2580\x2590([^_]*)$ /$1-$2 [L,R=301] 

从文档 :

…它被应用到请求的(%-decoded)URLpath…

因此,请使用UTF-8编码文件中的实际字符。