简体中文输入法用户指导手册
II. 输入窗口区域
预编辑区
状态区
候选词查找区
辅助窗口
III. 输入法基本功能
1. 开启/关闭输入法IV. 输入法辅助工具
2. 选择输入法
3. 循环切换输入法
4. 切换全角/半角模式
5. 切换中/英文标点模式
1. 选择工具菜单
2. 输入法状态设置工具
3. 输入法属性设置工具
4. 虚拟键盘PC键盘5. 输入法帮助
常用符号键盘
希腊字符键盘
俄文字符键盘
注音字符键盘
中文标点符号键盘
数字符号键盘
数学符号键盘
制表符键盘
特殊符号键盘
V. 输入法功能描述
1. Sun拼音输入法
2. 新全拼/新双拼输入法
3. 全拼输入法
4. 双拼输入法
5. 英汉输入法
6. 内码输入法
7. 五笔输入法
VI. 码表输入法接口
1. 接口简介
2. 创建码表
3. 码表转换成二进制格式
4. 码表转换成文本格式
5. 创建新的码表输入法
预编辑区: 高亮度(如反显或下划线)显示输入区。
状态区: 指示当前输入状态的区域。
候选词查找区: 显示可供选择的选项的区域。
辅助窗口: 用于输入法管理的辅助窗口。
再次键入 [Control+Spacebar] ,中文输入法关闭, 回到英文状态,
辅助条关闭。
然后从菜单中选择您想要使用的输入法。
表示输入系统处于全角字符状态。
表示输入系统处于半角字符状态。
当系统处于全角字符状态时, 输入键的全角字符将被提交给应用系统。
例如: 全角状态下输入'a', 其全角字符将被提交给应用系统。 如下:
表示输入系统处于中文标点模式。
表示输入系统处于英文标点模式。
当系统处于中文标点模式时, 并且输入一个英文标点键时,其相应的中文标点将被提交给应用系统。
例如: 中文标点模式下输入'$', 简体中文货币符号“¥”将被提交给应用系统。 如下:
英文标点键包括: . / <> :;'"\$!^&_-
英文标点键与中文标点符号的对应表如下:
!
-> !
"
-> “
$
-> ¥
&
-> ─
'
-> ‘
(
-> (
)
-> )
,
-> ,
.
-> 。
:
-> :
;
-> ;
>
-> 》
<
-> 《
?
-> ?
@
-> @
\
-> 、
^
-> …
_
-> __
这些辅助工具包括:
然后从菜单中选择一项您想使用的输入法工具。
用鼠标从工具菜单中选中“首选项”项, 输入法状态设置工具显示如下:
选定某些输入法后,点击“确定” 或“应用”按钮, 输入法选择设定将被系统置为有效。
选定的第一个输入法即为用户的缺省输入法。
这时, 在应用系统窗口中键入 [Control+Spacebar]
开启输入法,缺省输入法将被置为当前输入法;
使用这个选项设置工具, 您可以设置输入法的属性。 设置完后, 点击“确定”
或“应用”按钮, 输入法选项设定将被系统置为有效。
对于基于码表的输入法, 有以下四个选项可以设置:
- 如该选项被选中: 当每输入一个正常键,输入法引擎将立即搜索码表并在候选词查找区中显示匹配的候选词。
- 如该选项未被选中: 当每输入一个正常键,输入法引擎不立即搜索码表, 只有当用户键入空格键后, 输入法引擎才搜索码表并在候选词查找区中显示匹配的候选词。
这个选项能够帮助用户学习这个输入法, 如告诉用户某个汉字在该输入法中对应什么外码。
- 如该选项被选中:在候选词查找区中的每个选项后都显示这个候选词的外码。
- 如该选项未被选中:则在候选词查找区中的每个选项后都不显示这个候选词的外码。
- 如该选项被选中:当只有一个候选词对应该外码时, 输入法直接将该候选词提交给应用系统。
- 如该选项未被选中:则当只有一个候选词对应该外码时, 输入法不直接将该候选词提交给应用系统, 而是将该候选词显示在候选词查找区。
- 如该选项被选中: 当每输入一个正常键, 其对应的键对应字符将显示在预编辑区。
- 如该选项未被选中:则当每输入一个正常键, 其对应的键对应字符将不显示在预编辑区, 而是这个字符本身。
简体中文环境支持以下的虚拟键盘:
用户可以点击虚拟键盘上的按钮来输入该按钮上的字符。 PC键盘图示如下:
- PC键盘
- 常用符号键盘
- 希腊字符键盘
- 俄文字符键盘
- 注音字符键盘
- 中文标点符号键盘
- 数字符号键盘
- 数学符号键盘
- 制表符键盘
- 特殊符号键盘
键入 [Control+spcaebar] 开启或关闭中文输入法。
键入 [Control+Shift] 循环地切换中文输入法。
输入拼音
选择候选
修改拼音
修改音节切分
可以人工输入'符号来强制分割音节。例如,输入"xian"缺省将得到一个音节
"xian",而输入"xi'an"将会得到"xi'an"两个音节。
出了用空格或数字键1来提交转换后的汉字串外,还可以用Enter键提交用户原有的
ASCII输入串。例如输入"www.oracle.com"后再回车,将可以得到"www.oracle.com"。
基于拼音的输入法在中国大陆非常流行,目前有很多基于拼音的输入法, 其中就有新全拼和新双拼。
新全拼及新双拼输入法有以下功能:
新双拼特性
双拼是全拼的一种简化形式, 比全拼复杂, 但输入比全拼快。 新双拼支持新全拼的所有特性、键盘定义 以及字典文件。
下表是新双拼输入法支持的键盘映射:
键位 | 定义 |
i | ch |
u | sh |
v | zh |
a | a |
b | ou |
c | iao |
d | uang, iang |
e | e |
f | en |
g | eng |
h | ang |
i | i |
j | an |
k | ao |
l | ai |
m | ian |
n | in |
o | o, uo |
p | un |
q | iu |
r | uan, er |
d | iong, ong |
t | ue |
u | u |
v | v, ui |
w | ua, ia |
x | ie |
y | uai, ing |
z | ei |
一个拼音字串对应多个汉字,候选词查找区显示所有匹配该拼音字串的汉字。
用户可以键入点号(.) 或 [PageDown] 键来显示下页候选字, 键入逗号(,)
或 [PageUp] 键来显示上页候选字; 然后键入某候选字前的数字标号键来输入该候选字。
例如:对于汉字 “张” ,其全拼为"zhang",而双拼为 "vh"。
双拼输入法中键位与声母/韵母的关系如下:
键位 | 声母/韵母定义 |
i | ch |
u | sh |
v | zh |
a | a |
b | b |
c | iao |
d | uang, iang |
e | e |
f | en |
g | eng |
h | ang |
i | i |
j | an |
k | ao |
l | ai |
m | ian |
n | in |
o | o, uo |
p | un |
q | iu |
r | uan, er |
s | iong, ong |
t | ue |
u | u |
v | v, ui, ue |
w | ua, ia |
x | ie |
y | uai |
z | ei |
; | ing |
一个双拼字串对应多个汉字,候选词查找区显示所有匹配该双拼字串的汉字。 用户可以键入点号(.) 或 [PageDown ] 键来显示下页候选字, 键入逗号(,) 或 [PageUp] 键来显示上页候选字; 然后键入某候选字前的数字标号键来输入该候选字。
如果一个英文单词对应多个中文词组,候选词查找区显示所有匹配该英文单词的中文词组。 用户可以键入点号(.) 或 [PageDown] 键来显示下页候选词, 键入逗号(,) 或 [PageUp] 键来显示上页候选词; 然后键入某候选字前的数字标号键来输入该候选词。
五笔输入法的最大特点就是用户可以快速输入汉字, 因为一个五笔码很少对应多个汉字; 而且由于五笔输入法是基于字形编码的汉字输入方法, 所以几乎所有中文字,日文字,韩文字都可以用五笔来编码, 而基于拼音的输入法则不行。
关于五笔编码规则, 可参考 王码公司网站 。
王码五笔输入法支持如下功能:
支持GB18030字符集。 支持简码。 支持容错码。 支持步进式识别码三级输入法。 支持 “z/Z”作为帮助键。 支持词组输入及可选专业词库。 支持字词联想。 支持属性设置。
(1) 支持GB18030字符集。
GB18030汉字集是国家2000年颁布的一个强制性汉字编码标准, 其编码长度为1~4个字节。其中包括:
现有GB18030汉字集包括27533个汉字, 其中21003个双字节汉字, 6530个四字节汉字。五笔输入法能够输入所有这些汉字。
- 单字节,其值从0到0x7F。
- 双字节,第一个字节的值从0x81到0xFE,第二个字节的值从0x40到0xFE(不包括0x7F)。
- 四字节,第一个字节的值从0x81到0xFE,第二个字节的值从0x30到0x39,第三个字节的值从0x81到0xFE, 第四个字节的值从 0x30到0x39。
另外, 五笔输入法同时也支持GB2312, GBK字符集。 用户可以以“拉杆天线”式来切换字集。
王码五笔输入法将GB18030分为若干个字集: GB2312, GBK, GB18030。 其中GB2312字集包括6763个常用汉字, GBK字集包括21003个汉字, GB18030字集包括27533个汉字。
用户在输入过程中,可以象“拉杆天线”一样,任意切换字集。 如:
(2) 支持简码。
常用的汉字,除可以按它的全码输入外,多数都还可以只取其最前边的一至三个字根,再加空格键输入。也就是只取其全码的最前边的一个、二个或三个码,再加打 空格键(表示输入结束),形成所谓一、二、三级简码,从而提高了输入速度。
(3) 支持容错码。
“容错码”的涵义是:“容易”编错,但“容许”编错的码。
容错码的设置,是为了照顾不同的取码习惯,使他们用容易编错的码,照样可以打出所要的字来。
例如: “长”字的标准五笔码为: “tayi”。 但用户也可以输入“atyi”来输入该字。
“atyi”即为该字的容错码。
(4) 支持步进式识别码三级输入法。
王码五笔字型的关键技术之一就是“末笔字型识别码”。 为帮助初学者尽快掌握这一技术, 五笔输入法支持“步进式C,B,A三级学习法”。 C级指不带识别码即可输入, B级指只有左右型的汉字带识别码, A级则指三种字型(凡不足4码的字)都带识别码。 “三级学习法” 为初学者从“初级阶段”向“高级阶段”步进式提高提供了极大的便利。
例如: 在C级状态下, 输入: “tkg”, 再打一下空格键, 汉字:“和”、“程”,
将被列出。但在A级状态下,输入“tkg", 则汉字“和”被直接提交给系统。
(5) 支持 “z/Z”作为帮助键。
当输入汉字时, 如果不知道其五笔编码, 或不知道某个字根在哪个键上时, 或不知道“识别码”时, 都可以用“万能学习键Z”来代替你不知道的那个输入码。
例如: 输入“azzd”, 则所有五笔编码中以“a”开头并以“d”结尾的字将被列出。
(6) 支持词组输入及可选专业词库。
王码五笔输入法支持词组输入,其中包括9万多条基本词汇,另外还为用户配有11个专业词库。用户可以根据自己的专业领域来选择相应的专业词库。
专业词库如下(各有3000 - 20000条词):
例如: 当用户选择“医药卫生”专业词库时, 输入:“mino”, 一些医学词组将被列出以供选择。 如图:交通运输 电脑家电 经济金融 农业机械 医药卫生 矿业冶金 外贸旅游 军事国防 法律美学 地名库 成语库
(7) 支持字词联想。
当用户输入一个汉字或词时, 以该字或词开头的词组将被列出以供选择。
例如: 用户输入: “iuxx”, 汉字“滋”自动被提交给应用程序,
并且以“滋”开头的词组将被列出以供选择。
(8) 支持属性设置。
王码五笔输入法可以设置如下属性:
例如: 设置汉字字集, 如图:
例如: 设置专业词库, 如图:
例如: 设置识别码模式, 如图:
下面例图就是一个码表文件的例子:
[ Description ]
UUID:
english-chinese-7e7186dc-8327-4d06-a73b-8e8f7341366b
Version: 10
Author: Ervin Yan
<Ervin.Yan@Sun.Com>
Copyright: Copyright (c) 2005, 2010 Oracle and/or its affiliates
IconPath: EnCh.xpm
Name: 英汉
Encode: UTF-8
UsedCodes:
-ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz
WildChar: *?
MaxCodes: 15
[ Function_Key ]
PageUp: ,<
PageDown: .>
[ Options ]
KeyByKey_Mode: ON
HelpInfo_Mode: ON
AutoSelect_Mode: OFF
KeyPrompt_Mode: ON
SelectKey_Mode: Number
[ Phrase ]
about 关于 周围
一个码表文件包含以下几个功能描述段:
每个段的描述如下:
- [ Description ] 段
- [ Comment ] 段
- [ Key_Prompt ] 段
- [ Function_Key ] 段
- [ Phrase ] 段
- [ Single ] 段
- [ Options ] 段
因此该段包含以下几项:
(1). "Name:", 描述码表的中文名。
(2). "Encode:", 描述码表使用的编码,该值可以是UTF-8, GB, GB2312,
GBK, GB18030, EUC_TW, BIG5, BIG5HK.
(3). "WildChar:", 描述输入码元的匹配符, 缺省值是 '*' 和 '?'。
(4). "UsedCodes:", 描述合法的输入码元。
(5). "MaxCodes:" , 描述最长码元。
因此该段包含以下几项:
(1). "PageUp:"
(2). "PageDown:"
(3). "BackSpace:"
(4). "ClearAll:"
注意: '^' 代表 [ Control ] 键, 例如: '^N'
代表 '[Control+N ]' 键.
因此该段包含以下几项:
(1). "HelpInfo_Mode:" 可选值: "ON"
或 "OFF"
(2). "KeyByKey_Mode:" 可选值: "ON" 或 "OFF"
(3). "KeyPrompt_Mode:" 可选值: "ON" 或 "OFF"
(4). "AutoSelect_Mode:" 可选值: "ON" 或 "OFF"
(5). "SelectKey_Mode:" 可选值: "Number", "Lower"
或 "Upper"
每行格式如下:
键元序列 汉字序列
注意: "汉字序列" 表示一串没有空格隔开的汉字列表。
每行格式如下:
键元序列 词组1 词组2
词组3 ...
该工具 "txt2bin" 位于目录: " /usr/lib/iiim/le/cle/utils"
命令语法为:
# /usr/lib/iiim/le/cle/utils/txt2bin
source_codetable_file
binary_codetable_file
该工具 "bin2txt" 位于目录: " /usr/lib/iiim/le/cle/utils/"
命令语法为:
# /usr/lib/iiim/le/cle/utils/bin2txt
binary_codetable_file
source_codetable_file
按照上面所描述的码表格式准备一个码表源文件。
(2). 将该码表源文件转换成二进制格式。
使用工具 "txt2bin" 将该码表源文件转换成二进制格式。
命令语法为:
# /usr/lib/iiim/le/cle/utils/txt2bin
source_codetable_file
binary_codetable_file
(3). 将该二进制格式的码表文件拷备到目录: " /usr/lib/iiiim/le/cle/input_methods/data "。
(4). 将该码表信息加入到输入法配置文件中。 输入法配置文件为:" /usr/lib/iiim/le/cle/le_config.xml ".
(5). 重新启动输入法服务器 (iiimd), 然后重新登录。
重新启动输入法服务器 (iiimd), 需要以 root 身份运行如下命令:
# /etc/init.d/iiimd restart
然后, 新输入法就可以使用了。