2023年12月29日發(fā)(作者:罪惡的靈魂)
五種筆畫(huà)
漢字共有28種基本筆畫(huà),歸納為五種。具體情形如下表:
由于折筆形態(tài)繁多,可進(jìn)一步細(xì)分為兩類(lèi):一類(lèi)為左折,一類(lèi)為右折。
上表左邊的11種折為左折,右邊的11種折為右折。
區(qū)分兩種折的方法是:順時(shí)針折為左折,逆時(shí)針折為右折,以尾折為準(zhǔn)。
例如:“于”字的豎鉤為左折,“電”字的豎彎鉤為右折。
末筆補(bǔ)碼
補(bǔ)碼主要用于分解重碼。補(bǔ)碼的存在是由漢字?jǐn)?shù)量多的特點(diǎn)所決定的。
大家都知道,傳統(tǒng)五筆的“末筆字型交叉識(shí)別碼”就是一種特型的補(bǔ)碼。如果不用補(bǔ)碼,那些構(gòu)字部件少的常用字在編碼時(shí),就更容易出現(xiàn)重碼。只有用補(bǔ)碼,才能有效分解重碼。
現(xiàn)代五筆的補(bǔ)碼是如何確定的?其功能如何?
現(xiàn)代五筆的補(bǔ)碼比任何輸入法的補(bǔ)碼都容易掌握,就是采取單字的首音作為補(bǔ)碼,“怕”字的補(bǔ)碼是“P”,“宋”字的補(bǔ)碼是“S”,“江”字的補(bǔ)碼是“J”,“人民幣”三字的補(bǔ)碼分別是R、M、B,就是這樣簡(jiǎn)單。
用單字的首音作為補(bǔ)碼,共涉及23個(gè)鍵位(少I(mǎi)UV三鍵),比末筆字型交叉識(shí)別碼定義的15個(gè)鍵位多出8個(gè),因而分解重碼的作用大得多。此23個(gè)鍵位分布在熱鍵區(qū),易用性、均衡性俱佳。
現(xiàn)代五筆字詞輸入概況
示 例
單字拆分
單字全碼
單字簡(jiǎn)碼
全句編碼
社
礻土 S
LTS
LT
會(huì)
化
服
務(wù)
體
系
人二厶 H
亻匕 H
月卩又 F
夂力 W
亻木一 T
丿幺小 X
IDYH
ILH
NBYF
ONW
IMST
RXUX
ID
ILH
NB
ON
IM
RX
LIIR(取“社”、“會(huì)”、“化”、“系”四字首碼)
1、社:對(duì)照字根表,“礻”部件在L鍵上,“土”部件在T鍵上,而“社”字的補(bǔ)碼為S。所以社字的全碼打法是LTS,也可用簡(jiǎn)碼輸入,那么只打LT兩碼,敲空格鍵“社”字上屏。
2、會(huì):對(duì)照字根表,“人”部件在I鍵上,“二”部件在D鍵上,“厶”部件在Y鍵上,而“會(huì)”字的補(bǔ)碼為H。所以社字的全碼打法是IDYH,也可用簡(jiǎn)碼輸入,那么只打ID兩碼,敲空格鍵“會(huì)”字上屏。
3、體:對(duì)照字根表,“亻”部件在I鍵上,“木”部件在M鍵上,“一”部件在S鍵上,而“體”字的補(bǔ)碼為T(mén)。所以體字的全碼打法是IMST,也可用簡(jiǎn)碼輸入,那么只打IM兩碼,敲空格鍵“體”字上屏。
4、系:對(duì)照字根表,“丿”部件在R鍵上,“幺”部件在X鍵上,“小”部件在U鍵上,而“系”字的補(bǔ)碼為X。所以系字的全碼打法是RXUX,也可用簡(jiǎn)碼輸入,那么只打RX兩碼,敲空格鍵“系”字上屏。
5、“社會(huì)化服務(wù)體系”七字也可以作為詞組輸入,根據(jù)多字詞的輸入規(guī)則,取“社”、“會(huì)”、“化”、“系”四字首碼,即輸入LIIR,“社會(huì)化服務(wù)體系”上屏(要確定碼表里存在這樣一條詞組)。
提示:
1、字詞編碼是根據(jù)部件在字根表上的位置結(jié)合編碼規(guī)則來(lái)確定的。
2、實(shí)際輸入時(shí),并不提倡輸入單字完整碼,應(yīng)以簡(jiǎn)碼與詞組輸入為主。
3、最后一位音碼,并不常用,只用于分解單字重碼,功能上可以輕松取代末筆字型交叉識(shí)別碼,在單字輸入的時(shí)候起“畫(huà)龍點(diǎn)睛”的作用。
字根表及其規(guī)律
現(xiàn)代五筆字根表內(nèi)含5種主要記憶規(guī)則:
①筆畫(huà)部件的分布:米字型+雙折。
米字型規(guī)則的具體解釋是:
一橫、二橫、三橫按米字橫的走向設(shè)置在SDF橫線上;一豎、二豎、三豎按豎的走向設(shè)置在EDC豎線上;一撇、二撇、三撇按撇的走向設(shè)置在RDX斜線上;一點(diǎn)(含捺)、二點(diǎn)、三點(diǎn)按捺的走向設(shè)置在WDV斜線上,從而構(gòu)成“米”字型。
“左折”代表任意的順時(shí)針折,設(shè)置在 J 鍵上,“右折”代表任意的逆時(shí)針折,設(shè)置在 L 鍵上。
米字型處于左手輸入?yún)^(qū)核心部位,歸納了四種筆畫(huà)部件。雙折處于右手輸入?yún)^(qū)核心部位,歸納了第五種筆畫(huà)“折”的兩種類(lèi)型。
“D”鍵是米字型四種筆畫(huà)部件的交匯點(diǎn)?!癊DC”為“米”字的對(duì)稱(chēng)軸,將點(diǎn)撇對(duì)稱(chēng)分割。此軸有順口溜形容:“蘿卜菜心晾樹(shù)(豎)干,小二當(dāng)家挑重?fù)?dān),田上做工長(zhǎng)出米,四面方框匯山川”。
②形近、形似的字根聚集在同一鍵位上。如下表:
③部件與所在鍵位字母形似。如“丁”在 J 鍵上、“乚”在 L 鍵上?!摆狻痹?B 鍵上、“乂”在 X 鍵上、“尸”在 P 鍵 上、“匚”在 C 鍵上、“巾”在 M上、“艸”在 H 鍵上、“之”在 Z 鍵上。
④部件與所在鍵位字母音托?!翱谀就潦帜藦V舟”8部件分別在“K M T S
Y N G Z”8個(gè)鍵位上。
⑤字根的鍵盤(pán)分布注重方位特性。按地圖左西右東的方位,“西”部件在西邊,因此設(shè)置在A鍵上,“七”部件(東字頭,意味東)在東邊,因此設(shè)置在L鍵上,正所謂:女(如)來(lái)大弗居住西方,王母娘娘居住東方。宀、、在上,灬、、豕在下,纟、弓、 忄在左,夂、戔、在右,均是從方位角度考慮設(shè)置的,需用心體會(huì),加深記憶。
需要硬記的字根僅6對(duì),它們是:“十門(mén)”在G上,“火雨”在O上,“八小”在U上,“蟲(chóng)”在Y上、“礻衤”在L上,“目”在P上。至此,字根記憶完畢。
單字全碼的輸入
▓普通字的輸入(占GB2312字符集總量98.8%):
如:“風(fēng)”字可拆分為“幾”、“乂”。
對(duì)照字根表,“幾”部件在 B 鍵上、“乂”部件在 X 鍵上,且“風(fēng)”字讀音的首字母是 F ,那么“風(fēng)”字的完整輸入碼就是:BXF。
又如:“度”字可拆分為“廣”、“廿”、“又”。
對(duì)照字根表,“廣”部件在 G 鍵上、“廿”部件在 H 鍵上、“又”部件在
Y 鍵上,且“度”字讀音的首字母是 D ,那么“度”字的完整輸入碼就是GHYD。
再如:趙薇的“薇”字,按部件可拆分為“艸”、“彳”、“山”、“一”、“幾”、“夂”。
對(duì)照字根表,“艸”部件在 H 鍵上、“彳”部件在 D 鍵上、“夂”部件在
O 鍵上,且“薇”字讀音的首字母是 W ,那么“薇”字的完整輸入碼就是HDOW。
普通字的輸入規(guī)則概括為:取單字一、二、末3個(gè)部件碼(不足3碼只取前2碼)與1個(gè)音的補(bǔ)碼。
▓鍵面字的輸入(占GB2312字符集總量0.8%):
鍵面字本身就是字根,不存在拆分的問(wèn)題,其輸入方法為主碼后依次鍵入該字的單筆畫(huà)(不足四碼補(bǔ)以音碼)。
如“氣”字,輸入主根“氣”后,再依次輸入“丿、一、一”三筆畫(huà)。
再如“廠”字,輸入主根“廠”后,再依次輸入“一、丿”及“廠”字的首音“C”。
▓鍵名字的輸入(共26個(gè),占GB2312字符集總量0.4%):
鍵名字是從鍵面字中獨(dú)立出來(lái)的、作為鍵名而特別定義其編碼的漢字。
其輸入方法為連擊該鍵4次。如“口”字,連擊4次“K”即可。
提示:本節(jié)只為說(shuō)明完整碼的輸入規(guī)則,實(shí)際中,應(yīng)以簡(jiǎn)碼、詞組輸入為主,單字完整碼只在必要時(shí)才輸入。
單字簡(jiǎn)碼的輸入
▓單字一級(jí)簡(jiǎn)碼的輸入
只取該字常規(guī)編碼中的第一碼叫作該字的一級(jí)簡(jiǎn)碼。本輸入法共設(shè)置26個(gè)一級(jí)簡(jiǎn)碼字:
一級(jí)簡(jiǎn)碼漢字輸入方法為:該字所處的鍵位+空格鍵,如“中”字,打一“K”和空格鍵,該字就會(huì)被錄入。
▓單字二級(jí)簡(jiǎn)碼的輸入
只取該字常規(guī)編碼中的前兩碼叫作該字的二級(jí)簡(jiǎn)碼。
二級(jí)簡(jiǎn)碼漢字輸入方法為:該字編碼的前兩碼+空格鍵。如:“明”字,打“F、N”后加一空格鍵,該字就會(huì)被錄入。
二級(jí)簡(jiǎn)碼字是從國(guó)標(biāo)漢字中按一定條件篩選出的使用頻度較高的漢字(含個(gè)別低頻字)。
本輸入法共有669個(gè)二級(jí)簡(jiǎn)碼字:
阿 啊報(bào) 陂伯 布車(chē) 陳慈 此到 道睹 杜販 防父 婦狗 構(gòu)貴 國(guó)胡 虎活 火技 季降 礁進(jìn) 經(jīng)殼 可樂(lè) 離林 淋馬 碼孟 彌南 難跑 皰企 氣驅(qū) 蠼入 色時(shí) 實(shí)爽 水他 踏統(tǒng) 圖味 文匣 下欣 杏陽(yáng) 楊銀 引愛(ài) 安碑 備部 財(cái)闖 襯從 存燈 等堆 隊(duì)妨 仿負(fù) 干骨 故果 過(guò)戶 花或 獲濟(jì) 加腳 叫玖 酒克 客李 理琳 鈴螞 埋迷 密呢 能培 賠千 鉛取 去殺 曬史 駛說(shuō) 司臺(tái) 太土 吐聞 問(wèn)先 锨胸 秀樣 腰應(yīng) 英按 八奔 苯菜 參城 吃忖 措鄧 底奪 朵訪 放鋼 皋怪 關(guān)哈 漢淮 歡圾 璣佳 家接 節(jié)局 舉肯 庫(kù)力 歷陵 齡賣(mài) 忙棉 面你 睨佩 埤前 錢(qián)全 權(quán)艄 蛇世 市四 松談 譚推 駝吳 吾銜 縣須 需咬 藥嬰 迎吧 把必 碧藏 層持 赤錯(cuò) 達(dá)地 點(diǎn)垛 二肥 費(fèi)革 格觀 官好 耗還 幻雞 激假 奸潔 結(jié)鋸 決垮 跨立 利另 劉貓 冒妙 明年 鳥(niǎo)脾 篇欠 橋泉 確設(shè) 社示 式宋 蘇逃 討外 晚五 武現(xiàn) 線續(xù) 宣也 業(yè)潁 影白 百避 邊叉 猹蟲(chóng) 崇答 打電 阽發(fā) 乏分 份個(gè) 各管 貫合 何換 黃及 級(jí)間 艱她 姐軍 均塊 快栗 蠣流 六貌 么鳴 模脲 農(nóng)騙 迫且 清群 然審 升事 恃訴 素特 疼萬(wàn) 汪務(wù) 西鄉(xiāng) 相學(xué) 循葉 衣用 優(yōu)擺 敗砭 辨衩 產(chǎn)出 初大 單店 吊罰 凡奮 風(fēng)給 根光 廣狠 紅煌 蝗即 極減 檢斤 金峻 開(kāi)寬 狂聯(lián) 臉龍 露沒(méi) 嵋牟 謀努 女破 鋪情 請(qǐng)染 讓生 圣收 手算 雖提 體王 往析 蜥消 銷(xiāo)壓 呀醫(yī) 沂由 猶版 辦表 冰長(zhǎng) 場(chǎng)怵 船膽 但東 懂礬 反佛 敷公 供獷 規(guī)宏 洪灰 回疾 幾簡(jiǎn) 見(jiàn)僅 錦堪 坎困 啦遼 聊盧 路猸 美某 目杷 怕普 七慶 秋認(rèn) 日失 詩(shī)蔬 蜀隨 碎天 腆危 圍習(xí) 喜小 械嚴(yán) 研迤 胰游 友半 包兵 并唱 鈔吹 春黨 檔動(dòng) 都犯 飯怫 服宮 共硅 鬼后 忽匯 會(huì)計(jì) 記建 江盡 勁看 銬臘 蠟嘹 燎呂 綠昧 門(mén)內(nèi) 奶拍 排圻 騎求 區(qū)戎 如施 獅術(shù) 刷孫 所條 聽(tīng)委 衛(wèi)戲 系心 忻掩 眼椅 憶于 愉保
缽
炒
綽
刀
獨(dú)
范
府
勾
柜
惚
婚
紀(jì)
匠
妗
科
來(lái)
鐐
麻
們
男
派
琦
曲
茹
十
雙
索
同
位
蝦
昕
驗(yàn)
因
玉
育
則
證
重
阻
預(yù)
擇
政
州
組
域
責(zé)
之
周
祖
遇
增
支
豬
最
元
揸
織
燭
左
員 原
炸 粘
執(zhí) 直
主 屬
作
源
展
職
著
約
張
植
琢
月
招
只
資
鑰
找
紙
子
悅
召
祉
字
閱
照
志
自
臟
這
制
綜
早
珍
質(zhì)
總
澡
鎮(zhèn)
終
走
灶
爭(zhēng)
種
足
提示:加強(qiáng)二級(jí)簡(jiǎn)碼字的訓(xùn)練,可以促進(jìn)單字的錄入速度。
詞組的輸入
▓二字詞──取每個(gè)字的前兩碼。如“問(wèn)題”一詞,輸入“問(wèn)”字前兩碼“G、K”后,再輸“題”字的前兩碼“F、S”即可。
▓三字詞──取前兩字的首碼及第三字的前兩碼。如“國(guó)務(wù)院”一詞,輸入“國(guó)務(wù)”兩字的首碼“C、O”后,再輸“院”字的前兩碼“B、U”即可。
▓四字詞──取各字的第一碼。如“有限公司”一詞,依次輸入每個(gè)字的第一碼“N、B、U、J”即可。
▓多字詞──取前三字和最后一字的首碼,如:“中華人民共和國(guó)”一詞,依次輸入“中華人”三字的第一碼“K、I、I”后,再輸“國(guó)”字的第一碼“C”即可。
拆分及拆分原則
一、簡(jiǎn)易字的拆分
二、疑難字的拆分
三、拆分原則
制定拆分原則的目的是讓有共同特點(diǎn)的漢字遵守共同的拆分規(guī)則,便于歸納和記憶。
漢字的表現(xiàn)形態(tài)繁多。大多數(shù)漢字僅憑直覺(jué)(直觀性)就可拆分,對(duì)于少數(shù)結(jié)構(gòu)復(fù)雜的漢字有時(shí)需要依照“原則”來(lái)拆分。
本輸入法的拆分原則概括為以下3條:
1、直觀性原則。直觀性原則應(yīng)用最為廣泛,如“碧”可拆分為“王白石”,“部”可拆分為“立口阝”,直觀性原則有時(shí)也用在少數(shù)結(jié)構(gòu)緊密的漢字之中,如:“肺”可拆分為“月一巾”、“曹”可拆分為“艸曰日”。“求”可拆分為“一水丶”。
2、取大性原則。該原則要求在拆分時(shí)應(yīng)避免“管中窺豹”。如:“胡”可拆分為“古月”,不應(yīng)拆分為“十口月”;“更”可拆分為“一曰乂”,不應(yīng)拆分為“一曰乀”。
3、完整性原則。完整的原則要求在拆分的過(guò)程中,盡可能保證常見(jiàn)部件的完整。如:“蘭”字,可拆分為“丷三”?!坝凇弊挚刹鸱譃椤岸|”(亅為左折畫(huà))。“雀”字可拆分為“”。
重碼字特別練習(xí)
現(xiàn)代五筆全部重碼字(236個(gè))
ahj賈 姐 ascx醯 酗 askt醣 酮 asnx醑 醺 bxlh凰 隍 caly崦
罨 cclq屺 豈 ceg罟 固 cfex匣 岫 ciyl囹 嶺 dal類(lèi) 婁 dhc粗 徂 djcy盂 韞 dojj將 凈 dppx徙 循 dvb粑 冰 dwul涼 凜
fmg杲 果 fqdy易 昀 fqza遨 驁 fvl隸 錄 fybj即 既 gllb癍
庇 gmym麼 魔 gqvp庖 皰 gsjl厲 癘 gswx咸 戌 gwbk閌 廓
gxiy庾 瘐 hcwm甍 蔑 hffc曹 菖 hfnm萌 募 hfuq其 綦 hkbj韉
覲 hknq鞘 勤 hkwj蕺 鞫 hpdj藎 贐 husz苧 貯 hwkp賠 菩 ibz仉 仔 ieg個(gè) 估 ipnj焦 雋 itjs侍 舒 ivt他 氽 jfec抻 抽
jkk可 扣 jlz扎 找 khkh嚆 嗬 khnl嘮 嘞 klc呈 叱 kmd呆 吊
knl叻 另 kood啖 哆 ksql喇 咧 lgll轆 輪 lgyb被 玻 lhuq琪
祺 llzl邋 褳 璉 lpej琚 裾 lwje礻 衤 mclq榿 杞 mehz楨 幀
mkuz枳 幟 mlz札 棧 mrtc杵 棰 mswf黻 黼 mwgz樟 幛 梓 mwul椋 檁 nkzj迦 駕 nlwl尥 龍 ockj鮚 炯 ocys鳋 鲺 olys蝕 餿
orjw夕 夂 pbvt眺 跳 pfdt蹋 踢 pjdd蹬 瞪 pkwp甓 譬 pnk尻
肯 prmc睬 踩 qswp鋪 匍 qvb鈀 包 rcx氙 血 rdey氧 釉 rfof復(fù) 馥 sckd碉 硐 sjdd碭 磴 tdjw圩 圬 tpz址 走 tssy埡 垣
tuyg彀 轂 udjy竽 宇 ufkh害 豁 urbx筅 憲 urlb筆 篦 ussx寫(xiě)
宣 uudk空 箜 uukj窖 窘 vcs汕 泗 vhuh洪 潢 vusx瀉 渲 vwwy液 瀛 wlnh劾 肓 wlwl羸 蠃 wlwy嬴 贏 wngb瓣 辨 wngb辯 辮
wwxy諺 議 xcx細(xì) 兇 xlls鼠 纟 xokl綹 絡(luò) xwxj絞 皎 xxss絲
鷥 yjym蝥 蟊 yrex螅 蟋 zbcm猛 艋 zcs舢 駟
提示:針對(duì)以上重碼字,可選擇其中的常用字練習(xí),了解該字的簡(jiǎn)碼輸入情況,或組成詞組練習(xí),揚(yáng)長(zhǎng)避短。
習(xí)慣是人們的寶貴財(cái)富,對(duì)于習(xí)慣使用傳統(tǒng)五筆的用戶,請(qǐng)不要輕易更換輸入法,輸入法只不過(guò)是一工具而已,能用即是真理。
對(duì)于新用戶及使用傳統(tǒng)五筆不習(xí)慣的用戶,可以考慮更換輸入法,這是我們真誠(chéng)的建議!在考慮更換前,一定要對(duì)兩種五筆有一個(gè)全面及理性的認(rèn)識(shí)。
傳統(tǒng)五筆與現(xiàn)代五筆的區(qū)別主要表現(xiàn)在以下幾個(gè)方面:
________________________________________________________________________________
一、部件選用上的差異
傳統(tǒng)五筆與現(xiàn)代五筆的字根選用,都沒(méi)有跳出新華字典所用部件這個(gè)“如來(lái)”的掌心。
傳統(tǒng)五筆與現(xiàn)代五筆均采用常規(guī)的偏旁、部首、筆畫(huà)作為輸入法的構(gòu)字部件,因而部件的標(biāo)準(zhǔn)化、規(guī)范化程度都很高。
傳統(tǒng)五筆字根量是199個(gè)?,F(xiàn)代五筆字根量是185個(gè),是在傳統(tǒng)五筆的經(jīng)驗(yàn)上,去粗取精,字根選用力求少而精。
在所有常規(guī)部件中,“口”部件當(dāng)之無(wú)愧為第一大部件,構(gòu)字能力最強(qiáng),它占據(jù)任何一個(gè)鍵位,就會(huì)使該鍵位超負(fù)荷,引發(fā)鍵位不均衡矛盾。因此,現(xiàn)代五筆除保留“古”部件用于分解“口”部件壓力之外,另設(shè)“”與“足”部件(位于P鍵),用以減輕“口”所在的K鍵位的負(fù)荷,降低重碼,力求取得總體的均衡性。
現(xiàn)代五筆與傳統(tǒng)五筆的字根,同出于傳統(tǒng)構(gòu)字部件這一“轍”,因而字根的選用較為接近?,F(xiàn)將現(xiàn)代五筆1.5版的字根,與社會(huì)上廣泛使用的傳統(tǒng)五筆4.0版字根作一比較,以加深用戶的印象。
傳統(tǒng)五筆是采用漢字常規(guī)部件的最早期代表,不理想的是多出了諸如“由、甲、早、羽、六、辛等組字能力不強(qiáng)以及等不規(guī)范的構(gòu)字部件,增大了字根記憶量。
現(xiàn)代五筆是最優(yōu)秀的常規(guī)部件繼承者,提高了筆畫(huà)的構(gòu)字指數(shù),力求字根量少而精。
______________________________________________________________________________
二、字根表規(guī)則的差異
傳統(tǒng)五筆采用25個(gè)字母鍵編碼,將近兩百個(gè)字根按起始筆畫(huà)分為五個(gè)區(qū),首筆橫起的分在1區(qū),豎起的分在2區(qū),撇起的分在3區(qū),點(diǎn)起的分在4區(qū),折起的分在5區(qū)。每個(gè)區(qū)又按字根第二筆的筆畫(huà)分為五個(gè)位??偣?5個(gè)區(qū)位。每個(gè)區(qū)位對(duì)應(yīng)一個(gè)字母鍵。多出一個(gè)鍵“Z”用于編碼查詢。
傳統(tǒng)五筆初學(xué)時(shí),要淡化“字母”的概念,強(qiáng)化“區(qū)位”的概念。 如果完全按規(guī)定來(lái)分配字根,有些區(qū)位字根多得不得了,有些區(qū)位連一個(gè)字根也沒(méi)有。為了適當(dāng)平衡,以多補(bǔ)少,所以部分字根不按規(guī)則排位就座。 “五筆畫(huà)”的五
個(gè)筆畫(huà)(一、丨、丿、丶、乙)分別放在11、21、31、41和51里面。一橫、兩橫、三橫分別放在11、12、13里面;一豎、兩豎、三豎分別放在21、22、23里面;一撇、兩撇、三撇分別放在31、32、33里面;一點(diǎn)、兩點(diǎn)、三點(diǎn)、分別放在41、42、43里面;一折、二折、三折分別放在51、52、53里面。這種記憶式,對(duì)于筆畫(huà)部件記憶還行,可對(duì)整個(gè)字根表近兩百個(gè)字根而言,須借助口訣來(lái)助記。
就國(guó)標(biāo)6763個(gè)一二級(jí)漢字而言,涉及一折筆畫(huà)的漢字多達(dá)五百個(gè)之上,而涉及二折三折筆畫(huà)的漢字只有“粼巛巢剿巡淄瑙”那么幾個(gè)。傳統(tǒng)五筆將一折二折三折依次設(shè)置在NBV三個(gè)鍵位上,難以做到平衡?,F(xiàn)代五筆采用簡(jiǎn)單易行的順時(shí)針折與逆時(shí)針折方案,用J與L兩個(gè)鍵位,均衡了折類(lèi)筆畫(huà),化解了矛盾(參見(jiàn)概念篇五種筆畫(huà)主題)。
傳統(tǒng)五筆將右豎鉤視為“折”,將左豎鉤視為“豎”。對(duì)此,現(xiàn)代五筆遵守《GB13000.1字符集漢字部件規(guī)范》,科學(xué)地規(guī)劃了輸入法的筆畫(huà)方案,將左豎鉤筆畫(huà)回歸進(jìn)“折”類(lèi)。例如:“乎”、“牙”、“才”、“予”、“爭(zhēng)”、“事”等字的左豎鉤筆畫(huà)設(shè)置在 J 鍵上,“收”、“以”、“飲”、“鼠”等字的右豎鉤(提)筆畫(huà),設(shè)置在 L 鍵上。
現(xiàn)代五筆采用全部26個(gè)字母鍵編碼,充分發(fā)揮熱鍵區(qū)鍵位資源。將185個(gè)字根用“米字型+雙折”、形近形似字根聚集、字根與字母鍵音托、形似等記憶手段統(tǒng)束,強(qiáng)化鏈條式的記憶方式(毋須背口訣),起到的是事半功倍的效果,一旦記憶,永久難忘。
______________________________________________________________________________
三、末筆補(bǔ)碼的差異
傳統(tǒng)五筆所采用的末筆字型交叉識(shí)別碼,人為地加入了過(guò)多的邏輯性思維,用戶在使用過(guò)程中,時(shí)常難以流暢的輸入。
現(xiàn)代五筆采用單字的首音作為補(bǔ)碼,不僅取碼變得輕松,而且末筆用音碼收尾,恰好貼合人們書(shū)寫(xiě)漢字、默念其聲的習(xí)慣,顯得自然流暢,不費(fèi)心力(參閱“概念”篇“末筆補(bǔ)碼”主題)。
______________________________________________________________________________
四、取碼規(guī)則的差異
傳統(tǒng)五筆取碼為單字一、二、三、末四部件,從用戶角度來(lái)看,通常存在著三次拆分。
現(xiàn)代五筆取碼為單字一、二、末三部件,從用戶角度來(lái)看,通常只有兩次拆分,拆分簡(jiǎn)約化。兩次拆分其優(yōu)勢(shì)體現(xiàn)在:
1、減少了拆分工作量
少一碼拆分就意味著少一碼工作量,對(duì)于多部件取碼的單字就能體現(xiàn)這一差別。
最后一位音碼是補(bǔ)碼,起分解重碼的作用,不增加拆分難度,在實(shí)際輸入的時(shí)候,較少用到。
2、降低了拆分難度
我們知道,漢字的組成無(wú)非是偏旁、部首和筆畫(huà)。在漢字的構(gòu)成中,就總體而言,第一個(gè)部件最具獨(dú)立性(往往是純偏旁或部首),最后一個(gè)部件也具有較強(qiáng)的獨(dú)立性。
由于第一個(gè)部件的獨(dú)立性,使得第一碼與第二碼之間的拆分變得容易。相較而言,第三碼大多介于漢字結(jié)構(gòu)內(nèi)部,拆分就相對(duì)困難。
現(xiàn)代五筆避難就易,取一、二、末三個(gè)形碼,避開(kāi)第三碼(不包括作為末碼的第三碼),因此在拆分識(shí)碼上比傳統(tǒng)五筆更簡(jiǎn)易,更利落。
這種取碼方式,對(duì)于結(jié)構(gòu)簡(jiǎn)單的常用字而言,輸入感覺(jué)自然流暢,配以音碼,更符合人們輸入漢字的心理規(guī)律。因?yàn)槿藗冊(cè)跁?shū)寫(xiě)漢字的同時(shí),習(xí)慣于默念其讀音。而對(duì)于如“簿馨蹲曛爵璃繁”等多部件的漢字,又能顯出簡(jiǎn)約拆分的優(yōu)點(diǎn)。
______________________________________________________________________________
五、拆分的差異
傳統(tǒng)五筆是在國(guó)家《部件規(guī)范》與《筆順規(guī)范》發(fā)布前問(wèn)世的。現(xiàn)代五筆是新世紀(jì)后的技術(shù)成果,力求拆分規(guī)范、合理。
兩者拆分的差異現(xiàn)列舉10例:
1、“象”字的拆分?!跋蟆迸c“兔”第二部件均為“口”,傳統(tǒng)五筆將“象”的第二部件視為“”。這個(gè)在現(xiàn)代五筆中得到了統(tǒng)一與糾正。
2、“非”字是左右結(jié)構(gòu)的漢字,傳統(tǒng)五筆的拆分是三橫兩豎再三橫。按GB13000.1字符集漢字筆順規(guī)范,起筆應(yīng)是左邊的“丨”,正確的拆分應(yīng)是“丨”、“三”、“丨”、“三”。對(duì)此,現(xiàn)代五筆是依據(jù)筆順規(guī)范進(jìn)行拆分的。
3、“貌”字的拆分。傳統(tǒng)五筆拆分為:“”、“”、“白”、“兒”。現(xiàn)代五筆拆分為“豸”、“白”、“兒”。豺、豹、貂、貊、藐、霾、貅、豸、邈、貉等字拆分同理。
4、“蘭”字的拆分。傳統(tǒng)五筆拆分為“”、“二”,現(xiàn)代五筆拆分為“丷”、“三”。
5、“于”字的拆分。由于傳統(tǒng)五筆硬性規(guī)定“左豎鉤”為“丨”,那么“于”就拆分為“一”、“十”?,F(xiàn)代五筆拆分為“二”、“亅”(左折)。
6、“才”字的拆分。同上,傳統(tǒng)五筆拆分為“十”、“丿”?,F(xiàn)代五筆拆分為“一”、“亅”、“丿”。
7、“曹”字的拆分。傳統(tǒng)五筆拆為:“一”、“冂”、“”、“日”,現(xiàn)代五筆拆分為“艸”、“曰”、“日”?,F(xiàn)代五筆注重直觀性與組合性,“州”字拆分也是這個(gè)原理(拆為“川”+“學(xué)”字頭)。
8、“養(yǎng)”字的拆分。傳統(tǒng)五筆拆分為:“丷”、“”、“丶”、“”。現(xiàn)代五筆拆分為“丷”、“三”、“人”、“”
9、“年”字的拆分。傳統(tǒng)五筆拆分為“”、“丨”、“十”?,F(xiàn)代五筆拆分為“”、“”、“丨”。
10、“戊”字的拆分。傳統(tǒng)五筆拆分為:“廠”、“”、“丶”、“丿”(為規(guī)避重碼,傳統(tǒng)五筆最后的“撇”為硬性規(guī)定)?,F(xiàn)代五筆拆分為 “廠”、“”、“丿”、“ 丶” 。同理,“戌、戍、越、成、減、臧、我、瓦、瓶、瓷”等字,按筆順規(guī)范,最后都是以“點(diǎn)”收尾的。
重碼率方案
重碼率指標(biāo)從主觀上體現(xiàn)出設(shè)計(jì)者的設(shè)計(jì)技能,從客觀上卻反映出編碼規(guī)則的優(yōu)劣性。降低重碼率是每一個(gè)開(kāi)發(fā)者自始至終追求的目標(biāo),也是衡量輸入法品質(zhì)的一項(xiàng)硬指標(biāo)。以國(guó)標(biāo)6763個(gè)一二級(jí)漢字為標(biāo)準(zhǔn),優(yōu)秀的輸入法其漢字重碼率應(yīng)控制在5%以內(nèi),即重碼字少于338個(gè)。
傳統(tǒng)五筆之所以高效,是因?yàn)樗闹卮a字僅為250組510個(gè)(不足編碼漢字總數(shù)6763的十分之一)。全拼之所以低效,是因?yàn)樗闹卮a字最多。超過(guò)6000字以上。全拼用戶在輸入編碼后,漢字并不直接上屏,通常需要用戶用數(shù)字鍵選擇上屏,因數(shù)字鍵超出熱鍵區(qū)之外,且輸入時(shí),要加以注視并選擇,無(wú)法實(shí)現(xiàn)真正意義上的盲打,因而輸入速度無(wú)法提高。
可以說(shuō),鍵盤(pán)輸入法的效率高低,是與重碼率的高低成反比的。(重碼能夠控制在總量10%以內(nèi)的輸入法,較難見(jiàn)到,絕大多數(shù)輸入法,都程度較高地帶有數(shù)字選字詞的色彩,輸入字詞的時(shí)候,不能做到“干凈利落”。這也是其他輸入法多年來(lái)無(wú)法取代傳統(tǒng)五筆的最根本原因。
現(xiàn)代五筆,以創(chuàng)造最高效的漢字鍵盤(pán)輸入法為已任,在解決重碼問(wèn)題上,已獲得重大突破,將漢字鍵盤(pán)輸入法重碼降低到了極低限,僅116組共236個(gè)重碼字,用重碼字的嚴(yán)格標(biāo)準(zhǔn)衡量,目前沒(méi)有任何字母鍵編碼的輸入法能夠達(dá)到這一指標(biāo)(撥開(kāi)虛假?gòu)V告的迷霧,人們會(huì)真正地明白這一點(diǎn))。
重碼率與輸入法類(lèi)型及編碼方案關(guān)系最為密切。從各種類(lèi)型輸入法重碼率結(jié)果上來(lái)分析,一般可以這樣下結(jié)論(區(qū)位、電報(bào)等序號(hào)碼不在比較之列):
全音碼輸入法重碼率最高。每個(gè)漢字都有同音字,也就意味著每個(gè)漢字都有重碼。可以說(shuō)此類(lèi)輸入法是在重碼堆里“打滾”的輸入法。
全形碼輸入法能夠較好地處理重碼問(wèn)題。一般能將重碼字控制在800字以內(nèi)。
形音碼與音形碼輸入法能夠更好地處理重碼問(wèn)題。有經(jīng)驗(yàn)的作者一般能將重碼字控制在500字以內(nèi)。
形音碼與音形碼孰優(yōu)孰劣?我們認(rèn)為:由于音形碼有諸多弱點(diǎn),如陌生的字難輸、輸入方法不夠直觀、簡(jiǎn)碼數(shù)量達(dá)不上最高指標(biāo)等原因,所以作為重碼率方案應(yīng)首選形音碼編案方案,更進(jìn)一步地說(shuō)就是“先形后音、形主音輔”的編碼方案?,F(xiàn)代五筆就是這一方案的實(shí)踐者,只是“音輔”的占比更小而已。
重碼率、字根表規(guī)則、碼元集三者之間存在著“此長(zhǎng)彼消”的關(guān)系。要想降低重碼率,往往要以犧牲字根表規(guī)則或擴(kuò)大碼元集范圍作代價(jià),這是許多輸入法設(shè)計(jì)者“忍痛”以至不愿公開(kāi)重碼字的真實(shí)原因!
現(xiàn)代五筆堅(jiān)持“不突破26個(gè)標(biāo)準(zhǔn)碼元集范圍”、“最大限度強(qiáng)化字根表規(guī)則”這兩個(gè)基本原則,在低重碼與字根表規(guī)則兩條設(shè)計(jì)線上,全面發(fā)揮了數(shù)據(jù)庫(kù)強(qiáng)大的篩選功能,找到了兩者之間理想的磨合點(diǎn)(可以說(shuō)是現(xiàn)代五筆設(shè)計(jì)思想最亮麗的“閃光”點(diǎn))。此輸入法雖有236個(gè)重碼字,但其中的常用字很少,實(shí)際輸入時(shí),運(yùn)用簡(jiǎn)碼、詞組等輸入技巧,可以更好地消除重碼所帶來(lái)的負(fù)面影響,使輸入更加流暢。
現(xiàn)實(shí)中,極少有輸入法將自已的重碼字公之與眾。重碼字讓用戶了解,有利于在實(shí)踐中揚(yáng)長(zhǎng)避短,更好地應(yīng)用?,F(xiàn)代五筆率先將自身的重碼字公開(kāi),讓一些缺乏透明度,自栩品質(zhì)高的輸入法望洋興嘆。
________________________________________________________________________________
掩蓋重碼字的三種手法
近年來(lái),網(wǎng)上竟然有輸入法宣稱(chēng)只有幾十個(gè)重碼字,實(shí)在令行家難以置信。當(dāng)然他們的重碼字是不能公布的。因?yàn)?,一公布就?huì)露馬腳。這里有三種典型的情況:
一、輸入法作者自定重碼字標(biāo)準(zhǔn)
通常情況下,一個(gè)輸入法作者,懷著成功的愿望,辛辛苦苦完成了全部單字的編碼工作。可對(duì)單字編碼一排序,才發(fā)現(xiàn)竟然有千兒八百個(gè)重碼字。這是眾多設(shè)計(jì)者始料所不及的,最終成了輸入法設(shè)計(jì)者的難言之隱。(注:編碼規(guī)則類(lèi)型一經(jīng)確定,重碼字的大致數(shù)量也就“框”定了,減少重碼只有在這個(gè)“框”內(nèi)進(jìn)行,其有效途徑是反復(fù)調(diào)整字根在鍵盤(pán)上的位置或增設(shè)字根,然而這種辦法是以減弱字根表規(guī)則、降低易用性為代價(jià)的,且奏效的程度不高)。
痛定思痛,為了將自創(chuàng)輸入法推廣出去,在談及重碼字?jǐn)?shù)量時(shí),他們采用了靈活的說(shuō)法。并堂而皇之地認(rèn)為:有簡(jiǎn)碼的重碼字就不再是重碼字,理由是這些字可以通過(guò)簡(jiǎn)碼來(lái)輸入。
在這種心態(tài)支配下,他們只將沒(méi)有簡(jiǎn)碼字的重碼字確定為重碼字,如此,情況就大不一樣了,原來(lái)被認(rèn)為的600個(gè)重碼字,現(xiàn)在就只剩下不到200個(gè)了。確實(shí),簡(jiǎn)碼字作為重碼字的擋箭牌,其掩飾作用非常之大,特別是三級(jí)簡(jiǎn)碼,可以掩飾絕大多數(shù)重碼字。
我們認(rèn)為:重碼字作為輸入法品質(zhì)優(yōu)劣性的重要指標(biāo),應(yīng)以全碼字為定義對(duì)象,否則就沒(méi)有定義的必要了。
二、采用“取頭斷尾”法來(lái)掩蓋真實(shí)的重碼字
何為“取頭斷尾”法?這里舉一例子,假設(shè)我的輸入法真正的重碼字有600個(gè)(設(shè)為300組),可是我想讓用戶認(rèn)為無(wú)重碼,那好辦,只要從構(gòu)成重碼的每對(duì)中選取一個(gè)字,也就是選擇300個(gè)字設(shè)置成簡(jiǎn)碼字,然后將該字的全碼舍去即可(如果設(shè)計(jì)者刻意這樣做,是能夠做到無(wú)重碼的)。
這種做法,因沒(méi)有具體指明哪些字,所以不同于一般的硬性規(guī)定,應(yīng)該說(shuō)是“兒戲”編碼規(guī)則、對(duì)用戶不負(fù)責(zé)任的行為。顯然,所設(shè)的簡(jiǎn)碼可取代重碼字的輸入,但卻造成輸入法簡(jiǎn)碼品質(zhì)的下降。
我們知道,簡(jiǎn)碼字是從眾多符合篩選條件的字中嚴(yán)格挑選出的高頻字,如果將原本要安置高頻字的簡(jiǎn)碼空位讓給某些重碼字,讓這些“濫竽充數(shù)”者占據(jù)主位,勢(shì)必會(huì)影響總體輸入效率。同時(shí),用戶學(xué)習(xí)起來(lái),要特別留意這些“編碼不全的字”,以免“慣性”錄入了與之相對(duì)應(yīng)的另一重碼字。
要知道傳統(tǒng)五筆是專(zhuān)家學(xué)者們公認(rèn)的重碼少的輸入法,但就是這樣一個(gè)重碼少的輸入法也存250組共計(jì)510個(gè)重碼字,對(duì)于個(gè)別輸入法在宣傳中大言不慚說(shuō)自己只有幾十個(gè)重碼字,能信嗎?
三、在編碼對(duì)象上做文章
我們知道,國(guó)標(biāo)一級(jí)漢字共有3755個(gè),一般來(lái)說(shuō),常用字都在其中,二級(jí)漢字共有3008個(gè),其中大部分為冷避字。輸入法的基本編碼對(duì)象應(yīng)是這6763
個(gè)漢字。如果一個(gè)輸入法作者在這個(gè)基本編碼對(duì)象上做點(diǎn)文章,掩蓋自身的重碼率,那也是容易做到的。
設(shè)若他有重碼字600個(gè),他只要在重碼字中選擇120個(gè)相對(duì)冷避的漢字刪除掉,與之相配對(duì)的另一重碼字也就不存在了,這樣一來(lái),總量上就少了240個(gè)重碼字。
在漢字編碼總量上刪除120個(gè)冷避字,用戶是不易察覺(jué)的,倘若用戶碰巧輸入某個(gè)被刪除的冷避字不成功,還以為這個(gè)字是一二級(jí)以外的漢字呢,或者認(rèn)為自己輸入的編碼有錯(cuò)也未嘗不是,對(duì)此,用戶一般不會(huì)太較真。
有些耍聰明的輸入法作者,為了掩蓋其重碼率,力求做得天衣無(wú)縫:他們可以在一二級(jí)漢字之外,找到一些有用的漢字作補(bǔ)充,并對(duì)此輸入法軟件加殼,阻止他人反編譯過(guò)濾,揭穿老底。這樣,從漢字編碼總量上,并不少于其他輸入法,針對(duì)軟件測(cè)試者,往往也能蒙混過(guò)關(guān)。
在用26個(gè)字母鍵編碼的輸入法群體中,象現(xiàn)代五筆這樣只有236個(gè)重碼字的輸入法,絕無(wú)僅有!如果存在比此重碼字更少的輸入法(即使是字根表方案一般),一經(jīng)證實(shí),我們會(huì)大力舉薦。
________________________________________________________________________________
典型輸入法重碼發(fā)生的絕對(duì)幾率
最為常見(jiàn)的是以26個(gè)字母鍵、碼位數(shù)為4的輸入法。因此,我們就以這種典型的輸入法來(lái)討論重碼字發(fā)生的幾率。
這種典型的輸入法,其編碼空間總量為:456976位(26的4次方),而編碼對(duì)象是6763個(gè)國(guó)標(biāo)漢字(不加入詞組),在這種條件下,所編出的輸入法,其編碼空間占用的情況是:
456976÷6763=67.57,也就是:6763個(gè)字占用了約六十八分之一的編碼空間
此時(shí),每輸入1個(gè)漢字,其重碼的發(fā)生幾率為:67.57分之1(456976除以(6763-1)=67.58),或者說(shuō)每輸入67.58個(gè)漢字后,就會(huì)產(chǎn)生一對(duì)重碼,這樣累計(jì),輸完6763個(gè)漢字,會(huì)產(chǎn)生6763乘以1/67.58=100.1對(duì)重碼。從這個(gè)原理上來(lái)說(shuō),以26個(gè)字母鍵、碼位數(shù)為4編碼的輸入法,其重碼發(fā)生的幾率所產(chǎn)生的重碼為100對(duì)。
以上是從絕對(duì)均衡的條件下預(yù)測(cè)的。實(shí)際上,漢字外形結(jié)構(gòu)與讀音的類(lèi)同性、編碼規(guī)則、字根規(guī)則的原則性等因素,影響漢字在編碼空間內(nèi)均衡分布,其結(jié)果只會(huì)增大重碼的發(fā)生幾率。
就全形碼輸入法來(lái)說(shuō),漢字結(jié)構(gòu)的類(lèi)同性造成重碼發(fā)生幾率的增加,首先表現(xiàn)在構(gòu)字能力特強(qiáng)的一些部件上,如“口”、“亻”、“艸”、 “钅”、“氵”、“木”等,造成某些漢字聚集在編碼空間的某一區(qū)間或?qū)用嫔希瑥亩怪卮a的發(fā)生幾率增高;其次表現(xiàn)在某些相近特征的漢字上,產(chǎn)生“惰性”重碼。每種編碼規(guī)則類(lèi)型,都有其相應(yīng)的“惰性”重碼。如“贏羸蠃嬴” 、“微徽徵”、“齠齬”、“蝥蟊”等漢字相對(duì)全形碼而言,就是“惰性”重碼,在編碼規(guī)則確定為“一二三末”之后, 無(wú)論字根位置如何調(diào)整,這些重碼都在所難免。
以上編碼空間占用原理告訴我們:以26個(gè)字母鍵、碼位數(shù)為4編碼的輸入法,重碼發(fā)生的絕對(duì)幾率所產(chǎn)生的重碼為100對(duì),這是理論上的臨界值,實(shí)踐中,設(shè)計(jì)者降低重碼的理性期望值,是不能少于這個(gè)臨界值的。 少于這個(gè)臨界值的期望,是不現(xiàn)實(shí)的。
輸入效率方案
某些輸入法在自我宣傳中為了引人關(guān)注,常用到每分鐘能錄入多少多少字的廣告語(yǔ),以示該輸入法如何如何高效。我們認(rèn)為這種說(shuō)法是不切合實(shí)際的。
傳統(tǒng)五筆的高效性是有口皆碑的,然而就是用此輸入法的專(zhuān)職打字員,每分鐘能錄入120字的人也頗為少見(jiàn)。那種一分鐘能錄入300-360字的“變戲法”,不能作為高效性的標(biāo)尺。
什么才是測(cè)量輸入法高效性的標(biāo)尺呢?輸入法領(lǐng)域沒(méi)有一個(gè)明確的說(shuō)法?,F(xiàn)引進(jìn)一個(gè)輸入法高效性的極限值概念來(lái)討論這個(gè)問(wèn)題。由于26個(gè)英文字母鍵可謂漢字輸入公認(rèn)的熱鍵區(qū),只有充分利用熱鍵區(qū)資源,才能創(chuàng)造出高效的輸入法。所以“輸入法高效性的極限值”是建立在26個(gè)碼元集基礎(chǔ)之上的。
采有26個(gè)英文字母鍵編碼的輸入法,其高效性的極限值現(xiàn)列舉如下:
“頭”值:一級(jí)簡(jiǎn)碼:26個(gè)。
“上身”值:二級(jí)簡(jiǎn)碼26×26=676個(gè)
“下身”值:三碼可輸?shù)臐h字26×26×26=17576(可囊括全部一二級(jí)漢字)
“腳”值:四碼可輸?shù)臐h字26×26×26×26=456976(可囊括所有漢字和詞組,無(wú)重碼)。
這四個(gè)極限值的后兩項(xiàng)是輸入法設(shè)計(jì)者無(wú)法做到的。但我們?nèi)阅軌蛞源藶闇y(cè)量標(biāo)準(zhǔn),也就是:誰(shuí)的輸入法最接近這個(gè)極限值,誰(shuí)的輸入法最高效(暫撇開(kāi)輸入法的易用性)。這種測(cè)量方式是客觀的。
在用這種觀點(diǎn)來(lái)衡量某輸入法高效性的時(shí)候,不能一味注重該值的“數(shù)量”,也要適當(dāng)參考其簡(jiǎn)碼字的“質(zhì)量”,尤其是一二級(jí)簡(jiǎn)碼字與重碼字的“質(zhì)量”。
現(xiàn)代五筆是以這個(gè)極限值為努力方向的。一二三級(jí)簡(jiǎn)碼字的數(shù)量均多于以
25個(gè)碼元編碼的傳統(tǒng)五筆。由于重碼字也少于傳統(tǒng)五筆,可以確定四碼直接上屏的字也多于傳統(tǒng)五筆(參見(jiàn)首頁(yè)主要技術(shù)指標(biāo))。
傳統(tǒng)五筆用25個(gè)鍵位編碼,在高效性方面已然處于弱勢(shì)。打一個(gè)形象的比喻:即他在黃金地段有26間門(mén)面房,卻用了25間來(lái)銷(xiāo)售他的6763種商品,另外1間門(mén)面房做了倉(cāng)庫(kù)(編碼查詢),“倉(cāng)庫(kù)”僅適用于初學(xué)者,但在輸入法速度的最后沖刺中,不免落后一步。
我們認(rèn)為,“倉(cāng)庫(kù)”應(yīng)設(shè)置在字母鍵之外的地方更適宜(多數(shù)輸入法采用“?”號(hào)鍵)。輸入法編碼查詢方法有多種,偶爾遇到不會(huì)輸入的字,用輸入法反查功能解決更徹底(“倉(cāng)庫(kù)”查詢功能并不健全,若是第一碼不知道就無(wú)從查詢)。
對(duì)于某些音碼開(kāi)頭的輸入法而言,盡管采用26個(gè)字母鍵作為碼元集合,但由于漢語(yǔ)拼音的首音(聲母)只用到23個(gè)鍵,則其二級(jí)簡(jiǎn)碼數(shù)量不可能超過(guò)598(23×26)個(gè)。
從“高效性極限值”的立場(chǎng)上來(lái)考核“輸入法大家庭成員”,尚未發(fā)現(xiàn)有其他字母鍵編碼的輸入法,比現(xiàn)代五筆更接近這個(gè)極限值的,因此,我們可以從理論上初步推斷──現(xiàn)代五筆是一款更高效的中文輸入法!
字根表優(yōu)化方案
字根記憶規(guī)則決定著輸入法易學(xué)性,尤其是對(duì)于高效輸入法而言。
字根的最終“定位”不是依人的主觀愿望而定的,字根規(guī)則與重碼率息息相關(guān)。有時(shí),有了一個(gè)好的局部構(gòu)思,但在實(shí)現(xiàn)過(guò)程中,重碼字增加許多,因而只好舍棄??梢哉f(shuō)字根規(guī)則的優(yōu)化方案問(wèn)題已成為輸入法設(shè)計(jì)的“尖端”問(wèn)題,是一個(gè)頑固的“堡壘”。傳統(tǒng)五筆千方百計(jì)想形成一個(gè)好的字根規(guī)則方案,但顧及重碼的狀況,也只能做到讓“五種筆畫(huà)”排列有序,至于“筆畫(huà)”以外的構(gòu)字部件,一般是適“低重碼”需要而“生存”的,該輸入法的字根記憶問(wèn)題,也只有通過(guò)記憶口訣這個(gè)“拐杖”來(lái)緩解。
現(xiàn)代五筆字根表規(guī)則的“動(dòng)人”之處在于:她不僅將五種筆畫(huà)排列得井然有序,而且盡全力將相近、相似的字根聚集在同一鍵位上。除此之外,典型部件與所在鍵位字母音托形似、字根分布考慮方位特征等設(shè)置原則,大大豐富了學(xué)用者的記憶手段。這種“鏈條”式的記憶,與僵硬的口訣記憶,其設(shè)計(jì)風(fēng)格是大相徑庭的。
我們認(rèn)為,現(xiàn)在做一個(gè)有實(shí)力的中文輸入法,其字根表優(yōu)化方案,針對(duì)的并不是字根量問(wèn)題,而是字根在鍵盤(pán)上如何分布的問(wèn)題?,F(xiàn)代五筆以常規(guī)的漢字部件為字根,是精心篩選的。其字根規(guī)則方案,在高效輸入法群體中,堪稱(chēng)一絕。有些人看了現(xiàn)代五筆字根表,不以為然,殊不知這樣一張字根表,竟是經(jīng)過(guò)數(shù)據(jù)庫(kù)幾萬(wàn)次的重碼驗(yàn)算而得!如果沒(méi)有強(qiáng)大的數(shù)據(jù)庫(kù)軟件在背后做支持,單憑善良的愿望,所做的輸入法還不重碼累累?也正因?yàn)楝F(xiàn)代五筆用了較全面的漢字組字
部件,汲取了傳統(tǒng)漢字的精髓,才血肉豐盈,并得以成為新一代最具實(shí)力的漢字鍵盤(pán)輸入法。
現(xiàn)代五筆字根表規(guī)則涵蓋了絕大部分字根。根據(jù)部分用戶使用心得,在實(shí)際記憶時(shí),應(yīng)首先把握5種記憶規(guī)則這個(gè)主心骨,再硬記一些規(guī)則之外的字根,那你就會(huì)成功,用不著口訣記憶。
有個(gè)別用戶,來(lái)信要求我們?cè)O(shè)計(jì)出配套的記憶口訣。我們不打算這么做,倒不是我們沒(méi)有能力設(shè)計(jì)一個(gè)順口溜式的助記口訣,問(wèn)題在于個(gè)別用戶,對(duì)字根表規(guī)則不求甚解,才將字根記憶的希望放在助記口訣上。如果我們這么做,事實(shí)上就是將簡(jiǎn)單的問(wèn)題復(fù)雜化。
在實(shí)踐中,傳統(tǒng)五筆的用戶都是應(yīng)用口訣助記的。背熟口訣,需要不少時(shí)間。而現(xiàn)代五筆只用到傳統(tǒng)五筆背口訣的時(shí)間,就可以將字根表通盤(pán)記住,這就看你對(duì)5種字根記憶規(guī)則理解的深度了(僅有6對(duì)字根需要硬記)。現(xiàn)代五筆這種“鏈條”式的字根記憶方式,特別適合大齡用戶,記憶之后,不易忘卻。
字根量方案
形碼輸入法字根多,這是不容回避的事實(shí),如果了解其中的原委,你不一定認(rèn)為字根多只是缺點(diǎn)。
在以標(biāo)準(zhǔn)部件為字根的幾種正統(tǒng)輸入法中,現(xiàn)代五筆應(yīng)當(dāng)說(shuō)是字根量“少而精”的一種,字根量185個(gè)。傳統(tǒng)五筆字根量199個(gè),98王碼字根量227個(gè),天然碼字根量246個(gè),均多于現(xiàn)代五筆。
常規(guī)的漢字構(gòu)字部件,其數(shù)量是相對(duì)固定的,一般在180-240之間。用常規(guī)的漢字部件作為字根,不管你如何布局,單數(shù)量來(lái)說(shuō),就會(huì)令初學(xué)者望而生畏。
然而,正統(tǒng)輸入法所采用的標(biāo)準(zhǔn)構(gòu)字部件是科學(xué)合理的。這些部件一般是從成千上萬(wàn)個(gè)漢字中提煉出的具有代表性、典型性的構(gòu)字部件,并具有廣泛性、權(quán)威性。如果放棄或大幅度減少標(biāo)準(zhǔn)構(gòu)字部件,那么,所設(shè)計(jì)出的輸入法,其“體格”必然是畸形、病態(tài)或羸弱的(可以通過(guò)各項(xiàng)指標(biāo)測(cè)試出來(lái)),很難具備直觀性、高效性、通用性,與人們輸入漢字的心態(tài)背道而馳。
高效的輸入法必須采用較多數(shù)量的字根,這早已是不爭(zhēng)的事實(shí)。如果我們現(xiàn)在仍在討論字根量問(wèn)題,幻想能用少量的字根來(lái)創(chuàng)造一種既高效又易用的輸入法,那么,只能說(shuō)我們對(duì)高效輸入法的復(fù)雜性認(rèn)識(shí)得不夠深刻。若真抱有一種投機(jī)取巧的心態(tài)來(lái)搞輸入法設(shè)計(jì),其行為結(jié)果必然重蹈二筆字型的覆轍。
輸入法發(fā)展史上,并沒(méi)有一個(gè)真正優(yōu)秀的字根量方案。象二筆字型那樣,以追求字根少為目標(biāo),只強(qiáng)調(diào)字根表易記單項(xiàng)優(yōu)勢(shì),將大部分好端端的漢字部件“肢解”得十分零碎(只用到30個(gè)兩筆畫(huà)的部件和10個(gè)常規(guī)的大部件)。然后,讓人們來(lái)組字拼合,實(shí)在有違人們輸入漢字的心愿,因而并非優(yōu)秀的方案。
如果說(shuō)字根少是最重要的,那么全拼只有26個(gè)人們熟悉的字母字根,應(yīng)該說(shuō)是最好的了,可她能解決輸入效率問(wèn)題嗎?
輸入法字根應(yīng)具有典型性、概括性。如何實(shí)現(xiàn)對(duì)成千上萬(wàn)個(gè)漢字字符的完整概括,并做到字詞的理想兼容,是輸入法設(shè)計(jì)者首先要考慮的問(wèn)題。
字根量這一指標(biāo),在數(shù)學(xué)上有似于“最大公約數(shù)”概念;在運(yùn)動(dòng)員體格上有如“胸圍”。沒(méi)有健壯的胸圍,豈有體力在競(jìng)技中獲得好成績(jī)?
一般來(lái)說(shuō),字根量多的輸入法(如天然碼、98王碼),輸入文字偏重直觀性,感覺(jué)較好,速度容易提高,唯一的缺點(diǎn)就是學(xué)習(xí)時(shí)記憶量偏大,是謂“難在先”;字根量少的輸入法(如二筆字型),記憶量小,但漢字組合的直觀性較差,在使用過(guò)程中往往需要邏輯思維判斷選碼,速度不易提高,是謂“煩在后”。
“字根記憶多,彈指若有神,字根設(shè)置少,編碼走偏門(mén)”。作為輸入法設(shè)計(jì)的優(yōu)化方案,在魚(yú)和熊掌不可兼得的情形下,我們認(rèn)為應(yīng)堅(jiān)持“先難后易,一勞永逸”的編碼思想,將輸入的直觀、速度要素放在更重要的位置。這樣,字根量取“多”(健壯而不臃腫),一方面可以與國(guó)家認(rèn)定的標(biāo)準(zhǔn)部件相接軌,另一方面,可以實(shí)現(xiàn)“字根-鍵盤(pán)”布局的均衡性,使字詞兼容獲得更理想的效果。
其實(shí),二級(jí)簡(jiǎn)碼均衡率(簡(jiǎn)碼數(shù)量與編碼空位的比值)最能體現(xiàn)出輸入法的均衡性、字詞兼容狀況。
傳統(tǒng)五筆二級(jí)簡(jiǎn)碼均衡率為:599÷625=95.8%;現(xiàn)代五筆二級(jí)簡(jiǎn)碼均衡率為:669÷676%=98.9%(高出傳統(tǒng)五筆3.1個(gè)百分點(diǎn))。
本文發(fā)布于:2023-12-29 17:27:31,感謝您對(duì)本站的認(rèn)可!
本文鏈接:http://www.newhan.cn/zhishi/a/88/45474.html
版權(quán)聲明:本站內(nèi)容均來(lái)自互聯(lián)網(wǎng),僅供演示用,請(qǐng)勿用于商業(yè)和其他非法用途。如果侵犯了您的權(quán)益請(qǐng)與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除。
本文word下載地址:五種筆畫(huà).doc
本文 PDF 下載地址:五種筆畫(huà).pdf
| 留言與評(píng)論(共有 0 條評(píng)論) |