使用拆分而不破坏编码

我需要分割一个文件。 我通常使用split但这次我需要有原始相同的编码types的split文件。 我有原来的:

 eianni@ianni-desktop:~/Desktop$ file FCAna.txt FCAna.txt: ISO-8859 text, with CRLF line terminators 

而新的是:

 eianni@ianni-desktop:~/Desktop$ file xaa xaa: ISO-8859 text, with CRLF line terminators eianni@ianni-desktop:~/Desktop$ file xab xab: Non-ISO extended-ASCII text, with CRLF line terminators 

第二个是不行的。 我该如何解决这个问题? 执行的命令是

 split --lines=1588793 FCAna.txt 

我认为这可能是file工作方式。 从手册页阅读:

ASCII,ISO-8859-x,非ISO 8位扩展ASCII字符集(如Macintosh和IBM PC系统上使用的那些字符集),UTF-8编码的Unicode,UTF-16编码的Unicode和EBCDIC字符集可以通过构成每个集合中的可打印文本的字节的不同范围和序列来区分。

我对这个陈述的解释是, file确定所使用的编码的能力是基于文本文件中是否有某些可用的字符使得编码是明显的。 因此,对于UTF,可以使用字节的大小或是否存在BOM 。 您的原始文本文件可能使用了只能用扩展的ASCII字符集(英镑符号(£)可能?)编码的字符,因此file确定它是ISO 8859文件。 但是现在文件被拆分了,那个符号只出现在第一个文件中,而不是第二个。 您应该能够通过在文本中search“扩展”字符并在不同点处分裂来testing这个假设。

作为一个testing,我做了以下几点:

 [root@blah ~]# echo "this is a test of text encoding" > test_encoding.txt [root@blah ~]# file test_encoding.txt test_encoding.txt: ASCII text [root@blah ~]# echo "£" >> test_encoding.txt [root@blah ~]# file test_encoding.txt test_encoding.txt: ISO-8859 text [root@blah ~]# 

是否有理由需要文件报告的文件编码匹配?

这是一个线路terminal问题。 也许告诉拆分与-l选项一起打破?