出簡讓全
----
> **碼表設計的幾種處理方式:**
1. 出簡讓全 (四碼類方案通用碼表處理方式)
即單字已經有簡碼,則其全碼讓出首選的位置(實際包含出簡讓簡:即一簡出的字,二簡讓給別的字,直至全碼)<br>
2. 出簡不出全 (頂功類方案常見碼表處理方式)
即單字已經有簡碼,則其全碼不編碼<br>
3. 出簡不讓全 (低頻字詞沖突的處理)
即單字已經有簡碼,其全碼依然占據首選的位置<br>
4. 無簡讓全 (生僻字類的處理)
即單字沒有簡碼,全碼首選依然讓給別的字詞<br>
12屬于主體方式,34屬于附屬方式
#### **一、小鶴音形屬于四碼類方案,采用1的方式:出簡讓全**
在我看來,GB2312字集,應該采用這種碼表設計思路,小鶴是通用規范字表,比GB2312字集稍大,適用這一編碼思路。<p>
不光是出簡讓全,應該是出簡讓簡,即一簡已出的字,二簡就應該讓給別的字,三簡再讓,直到全碼。達到簡碼歸集較常用字,全碼歸集較不常用字的設計目的。<p>
全碼讓出首選位置,具體到軟件可以有兩種方式選擇:
a,首選讓給別的字詞,自身靠后
b,首選讓給別的字詞,自身隱藏
用戶可以根據自身所處使用階段選擇,初學者學習時可使用a方式熟悉字根,真正使用時可用b方式。小鶴默認b方式,可通過直通碼`oqm`切換到a方式。<p>
我覺得沒有必要1簡已經出了的字,還要讓其占用2簡3簡乃至全碼首選,這是一種浪費,也不應該什么字都去打全碼,沒有輸入法能做到全碼無重,能做到的應該就不叫輸入法了,也失去了提升輸入效率的目的。<p>
有人說123簡要記,記憶量好大,這是自己嚇自己,也是沒用過四碼方案的人的臆想,用過再說。我這能提點一下的就是,別記,看著候選打就好了,常用字很快就能形成記憶,這是潛移默化的,至于不常用字就無所謂了,你自己的語言環境逐漸就能做到盲打(不看候選窗的盲打)。<p>
#### **二、頂功類方案更常見2的方式:出簡不出全**
頂功方案為了“頂”的這個功能,需要制造大量的空碼,這就使得編碼效率大幅降低(用頂來彌補這部分效率的損失),四碼空間不夠編碼,于是會編5碼6碼單字,所有字都編個6碼全碼意義也不大,畢竟多數頂功方案后面的編碼是筆畫,沒有打全碼來學習的必要。
#### **三、五筆也是四碼類方案,但處理方式混亂:出簡讓全+出簡不讓全+無簡讓全**
五筆的碼表處理有點亂,不分主次:有的字出了簡碼,全碼還要占據首位;有的字出了簡碼,全碼就讓給了其他字詞;還有無簡碼的字,全碼也讓給了別的詞;2簡已經有的字,3簡還要占用。<p>
* 出簡讓全+出簡不讓全:
“我”,有個無理碼的一簡q,還有個有理碼的3簡trn,微軟五筆的全碼首選讓給了“特性”,QQ五筆連次選位也讓了,搜狗五筆沒讓
“星”,有3簡jtg,微軟五筆全碼首選讓給了“鑒于”,QQ五筆搜狗五筆沒讓
“濟”,有3簡iyj,微軟五筆全碼首選讓給了“流暢”,次選給了“瀏”,三選給自己,搜狗五筆全碼首選也讓給了“流暢”,QQ五筆沒讓
* 無簡讓全:
“毓”,無簡碼,全碼首選讓給了“特征”
“嗝”,無簡碼,全碼首選讓給了“嚇唬”
* 出簡不讓簡:
“成”,2簡dn,3簡dnn都被占用,就是不讓“盛”
“關”,2簡ud,3簡udu都被占用,就是不讓“善”
我猜測應該是五筆鋪開得太快,碼表還沒處理優化好,就推出并普及,造成重復占用簡碼資源,其他五筆軟件只能參照這樣的簡碼安排作為標準,而在全碼時才有各自的排序想法。不知其后的98版和新世紀版是否注意到這個簡碼重復占用的問題,全碼是否有個相對統一的讓或不讓的安排。
#### **四、鄭碼、二筆:?**
同屬四碼類方案,應該主體采用“1.出簡讓全”的碼表處理方式。因為不普及,也沒相關碼表,所以不清楚其簡全碼的具體處理情況。
#### **總結一下:**
* GB2312字集范圍內的碼表設計,我覺得小鶴這樣“1.出簡讓全”的設計思路是最好的,即出簡讓簡,層層讓,直至全碼,充分利用編碼資源,而不是五筆這種“1.3.4.”忽讓忽不讓,思路混亂。全碼的意義主要是歸集較不常用字和學習,實際使用應該有簡打簡。<p>
* 大字集方案,作為擴展部分的字,全碼居后,即“1.+4.”的方式,我覺得是可行的。<p>
* 除了頂功用“2.出簡不出全”的方式,還有各種形作為拼音的輔助碼使用時,其碼表通常也會采用這種方式,這里的形已經退居輔助的地位,可用可不用,其全碼的學習作用也就不顯著了。<p>
<br>
> **再說說小鶴和五筆的默認態**
也就是輸入法的初始設置狀態<br>
#### 一、候選項,編碼精確匹配和展開提示
小鶴默認候選項是編碼精確匹配候選字詞的,即打到哪個編碼就顯示編碼對應的字詞。在我看來,編碼提示并不能幫助用戶更快的知道想要知道的字的編碼,如果要查編碼,直接用萬能鍵查詢應該能更快的抵達目標字。
五筆默認候選項則是打到哪個編碼顯示對應字詞的同時,還會顯示后續編碼字詞。五筆為什么要時時展開提示,這可能是要查詢的目標太廣,于是干脆處于時時都處于能查的狀態。
#### 二、已出簡碼的字,全碼顯示還是隱藏
小鶴默認已經出了簡碼且全碼有別的字詞的全碼字居后,也就是上面說的“出簡讓全”的a方式;
五筆默認是有的居前有的居后。
全碼居后考慮的是初學者要學習全碼拆分,完成學習后實際打字是一簡打簡,這時小鶴提供了一種全碼隱藏的方式,即“出簡讓全”的b方式。
五筆全碼,據說有的用戶習慣一下就打到全碼去了,不然要一路看簡碼。這可能就是初學者的一種認為,也可能是長期處在初學者狀態,我不認為一個成熟的五筆用戶打簡碼是要通過看來確認的。
#### 三、主輔方案混輸狀態
小鶴因為是音形碼,可以通過自身編碼知音查形或知形查音,所以不需要另一種輔方案來幫助解決相關問題。五筆因為是純形方案,所以需要另一種方案來解決不會寫的字的輸入問題,輔方案配拼音是常態,而生活中我見到的五筆用戶,長期使用并不是初學者,通常也習慣五筆和拼音的混模式狀態,應該是要保證在五筆不會時隨時能通過拼音方式解決輸入問題。音形碼的用戶對萬能鍵的依賴會逐漸降低,五筆用戶對拼音的依賴卻是長期的。<br>
1. 有人用“出簡不出全”來貶低小鶴,一,是不了解小鶴從來就沒有“出簡不出全”的單字處理方式;二、應該就是為貶低而貶低;三、在我看來“出簡不出全”也并沒有什么不可接受,成熟用戶最終是打簡不打全的。初學者可能更需要全碼來學習規則,小鶴也是基于這個原因保留所有字全碼的。<br>
2. 也有人說“小鶴使用a方式就會顯得重碼多了”,這就很好笑了,五筆從一簡開始就展開提示,起碼看到5個候選,一直到全碼候選看來都不少,你不說重碼多,小鶴全碼展示單字,重碼就顯多了?<br>
3. 還有人說“小鶴為了顯得重碼少,強制只保留一兩個詞做候選”,那五筆詞庫有多大?十萬?算大詞庫配置了吧,相比百萬級別的詞庫來說,是不是也強制去掉了九十萬的詞?是不是也為了顯得重碼少?<br>
* 小鶴和五筆都是四碼定長方案,在解決單字輸入問題的基礎上,控制詞庫量,本來都是相通的。我音形控制成兩個候選,是基于拼音的可預判因素,你五筆根據自己的情況某個詞條重碼或多或少,那也是根據形碼的不可預判性。不能說我控制詞庫量的方式和你有所區別,就成了我的方式有問題。為什么沒有小鶴用戶因此成為單字派,五筆卻有不少單字派呢?為什么小鶴能這樣控制,五筆卻不能這樣控制?這才是你要思考的。
<p> <br>
<p align="right">散步的鶴 2022年5月1日</p>
<br>