用户可以在文本文件中定义一批词或短语,通过导入程序将它们导入到紫光拼音输入法的当前用户词库中。
注意:自定义词库内容导入后,所导入的词不能批量删除。
建议用户在导入自定义词库前,先备份当前用户的词库。
使用程序菜单中紫光拼音输入法菜单中“用户词库文本导入”菜单项,启动用户自定义词库文本的导入程序。
使用本程序时,先浏览或键入用户自定义词文件名,然后按“开始导入”按钮进行导入操作。
选中“记录导入操作的错误信息到文件C:\Addwords.log中”选项时,导入操作中将对错误信息进行记录,导入完成后您可以打开文件C:\Addwords.log进行查看。
导入完成后,将弹出对话框显示从自定义词文件中读入的行数和处理的词数。导入过程中,仅对定义正确的词进行处理;词库中已有的词不会重复导入。
用户自定义词的文件必须是文本文件,每个词分行定义。
自定义词的文本文件必须是DOS/Windows文本编码格式,如果是Unicode或UNIX等其它文本格式,请使用文本转换工具进行转换。
词定义的格式为:
[中文词和短语] [拼音串] [词频数]
中文词和短语只能使用中文字、全角和中文符号,有效长度为2到9个汉字。
拼音串以英文单引号或空格隔开;拼音串中的汉字个数必须和中文词部分的汉字个数一致;拼音串可省略,省略时导入程序自动生成拼音串,多音字则按读音的拼音串顺序使用第一种读音。
词频数有效范围从1到100,数越大表示该词越常用;词频数可省略,省略时词频设置为1。
当词定义格式中省略拼音串时,导入程序自动查找汉字的读音,将会使导入过程延长。
以下结合示例说明定义格式。
示例:
#紫光拼音输入法,用户自定义词文件
#人名
阿土仔 a'tu'zai 10
令狐冲 100
我是谁
#其它
甲A jia'a
沙尘暴 sha chen bao 80
#错误示例
甲B jia'bi
假A
★ xing
中招 zhon'zhao
紫霞 zhi'zhun'bao 20
说明:
1. 以英文符号"#"开始的行是注释,词定义文件中也可以有空行。
2. "令狐冲"的词频为100,表示该词很常用,该词省略拼音串,由导入程序生成。
3. "我是谁"的定义可以省略拼音串和词频数,词频设置为1;其中谁是一个多音字,既读"shui"也读"shei",导入程序生成拼音串时,将使用排在前面的"shei",得到"wo'shi'shei"。
4. 中文词可以使用全角或中文符号,如"甲A"中的"A"是全角符号。
5. 拼音串可以用空格隔开,例如"沙尘暴"的拼音串定义。
6. 以上示例中,"#错误示例"部分为定义错误的词,导入过程中将忽略对这些词的处理。
7. "甲B"定义错误的原因是使用了英文符号"B"。
8. "假A"定义错误的原因是没有给出拼音串,而导入程序无法找到全角符号"A"的拼音读音。
9. 星号"★"定义错误是没有满足中文词2到9个汉字的有效长度要求。
10. "中招"定义错误是使用了非法的拼音"zhon"。
11. "紫霞"定义错误是拼音串说明该词有三个汉字,而中文词为两个汉字。
选中“记录导入操作的错误信息到文件C:\Addwords.log中”选项时,导入操作中将对错误信息进行记录。记录文件中将记录第几行和错误情况。
错误情况包括:
词定义格式不对 - 词定义不符合格式要求。
拼音串错误 - 拼音串不合法
插入自定义词到词库中时出错 - 插入词到词库时出错
用户自定义词库导入程序支持从微软拼音输入法的用户自造词文本文件中导入词。
注意:
用户自定义词库导入程序要求自定义词的文本文件必须是DOS/Windows(ANSI)的文本编码格式。从微软拼音输入法的用户自造词文本文件导入之前,请确认该文件为DOS/Windows文本编码格式。如果是Unicode文本格式,请使用文本转换工具将其转换为DOS/Windows文本编码格式。
在Windows 2000中,微软拼音输入法2.0使用Unicode格式保存用户自造词文本文件,您可以使用记事本打开该文件,使用“另存为...”功能并选择ANSI编码,即可将该文本文件转换为DOS/Windows文本编码格式。
用户自定义词库不宜过长,建议一个用户自定义词库不要超过10,000条词。否则导入程序可能因为为导入词库分配的空间不够而出错。
如果用户自定义词库中的词非常多,建议分为几个用户自定义词库文本文件,逐个进行导入。