让Netatalk支持双字节和多字节字符集
一、 问题出现通过安装samba 和netatalk,实现了PC与苹果机通过Linux共享的问题。但是苹果机传中文文件名到Linux, 但是Linux及windows却看不见中文;PC存中文文件名在共享路径,苹果机看得见,但却无法拷备,错误返回:文件找不到。列表举例描述如下:
PC(Linux)文件名 操作: 由苹果机拷贝文件 苹果机 (Mac OS)
Abc Abc
Abc Abc
:0B:0B 薄(HEX 0x0B0x0B)
薄(HEX 0x0B0x0B) 看得见文件名,但是找不到文件
二、 分析问题
由上表可见,
当文件名中的字符都在美国标准ASC码(码值小于或等于0x7F)则可以正常显示。
当文件名中的字符不在美国标准ASC码(码值大于0x7F小于0xFF)则不能正常显示。
Netatalk 有没有自已的解决办法呢?
我查看它的配置文件/etc/atalk/AppleVolumes.default
很幸运,我看见它有一个codepage参数,形式如下
codepage=文件名 文件是在nls 路径下
我想这下可解决了,我立即作起实验来。
第一次codepage=936
第二次codepage=cp936
注:cp936是GB2312-1980的代码页
nls 是 nls(National Language Sopport)子系统它是基于ASC的提供国际化本地化的一种机制。只要通过正确的字符映射表就可以正确处理本地语言编码了。
结果如何?全部失败。
结论:Netatalk另有一套nls机制来解决本地化问题。
三、解决问题
1. 目标
PC[Linux]下的文件名 操作(由苹果机拷贝文件) 苹果机[MAX OS]下的文件名
薄(HEX 0x0B0x0B) , 薄(HEX 0x0B0x0B)
2. 查找路径nls
找到路径/usr/lib/atalk/nls
其中有三个文件maccode.437, maccode.850,maccode.iso8550-1
用这些codepage来试,都不行。中文在苹果机看比原来还糟,当然了映射的不对嘛!
3. 上网找一找,也没有支持中文的maccode
4. 只有自己做一个了。
5. 用二进制查看器分别查看了maccode.437,maccode.850,iso8550-1找出了规律。因为十分简单,不必细说。有兴趣的朋友,可以自己去看看。
6. 我首先用GB2312的编码来作实验。大家都很熟悉,它的编码范围是0xA1----0xFE,思想再简单不过了,就是让中文编码的ASC码在传送后保持不变即可。
7. 实验成功。
8. 扩展。我查阅了亚洲文字集的编码(双字节编码或多字节编码)范围。认为将映射扩大到 0x80----0xFE应该可以支持所有的亚州文字。
标准 编码范围 最小值 最大值
GB2312-1989 第一个字节:0xA1----0xF7 0xA1 0xFE
第二个字节:0xA1----0xFE
GBK 第一个字节:0x81----0xFE 0x40 0xFE
第二个字节:0x40----0x7E
0x80-----0xFE
BIG-5 第一个字节:0x81-0xFE 0x40 0xFE
第二个字节:0x40-0x7E
0x81----0xFE
Shift-JIS 第一个字节:0x81-0x9F
0xE0-0xFC 0x40 0xFC
第二个字节:0x40―0xfc(少0x7F)
KSC-5601-1987 第一个字节:0x81-0xFE 0x41 0xFE
第二个字节: 0x41-0x5A,
0x61-0x7A,
0x81-0xFE
由于当ASC码小于0x7F都可以正常转化,所以我们可以不去理它,只考虑ASC码大于0x80以上的。得到映射范围是0x80----0xFE.
四、 如何使用maccode.Asia
1.找到nls路径, 例如,我的机是/usr/lib/atalk/nls
2.将maccode.Asia拷贝下去
3.找到appletalk的配置文件AppleVolumes.default并修改之。 例如:我的机上是/etc/atalk/AppleVolumes.default
例如:/mnt/appletalk是你共享给苹果机的路径
你原来写 /mnt/appletalk
现在加一点 /mnt/appletalk codepage=maccode.Asia存盘即可.