-
-
Notifications
You must be signed in to change notification settings - Fork 24
/
Copy pathmoran_aux.schema.yaml
342 lines (308 loc) · 9.84 KB
/
moran_aux.schema.yaml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
schema:
schema_id: moran_aux
name: 魔然·輔篩
version: "20241105"
author:
- 自然碼發明人:周志農
- 方案製作:ksqsf
description: |
在輸入完畢雙拼碼後,可以輸入輔助碼篩選候選項,與「魔然」方案不同。
dependencies:
- tiger
- moran_charset
- moran_english
#- moran_japanese
switches:
- name: ascii_mode
states: [ 中文, 西文 ]
- name: full_shape
states: [ 半角, 全角 ]
- name: simplification
states: [ 漢字, 汉字 ]
- name: ascii_punct
states: [ 。,, ., ]
- name: extended_charset
states: [ 通用, 增廣 ]
- name: emoji
states: [ 🈚, 🈶 ]
- name: chaifen
states: [ 不拆, 扌斥 ]
- name: unicode_comment
states: [ U關, U開 ]
- name: dzing
states: [ 通, 寍 ]
- options: [ std_opencc, std_tw, std_hk, std_dzing ]
states: [ 通, 臺, 港, 寍 ]
engine:
processors:
- key_binder
- ascii_composer
- recognizer
- speller
- punctuator
- selector
- navigator
- express_editor
segmentors:
- ascii_segmentor
- matcher
- matcher@recognizer_secondary
- abc_segmentor
- punct_segmentor
- fallback_segmentor
translators:
- punct_translator
- reverse_lookup_translator@reverse_tick
- reverse_lookup_translator@reverse_universal
- reverse_lookup_translator@reverse_tiger
- reverse_lookup_translator@reverse_stroke
- reverse_lookup_translator@reverse_cangjie5
- reverse_lookup_translator@reverse_zrlf
- table_translator@custom_phrase # 自定義短語
#- table_translator@english # 英語混輸
#- table_translator@japanese # 日語混輸
#- table_translator@fixed # 掛接用法
- lua_translator@*moran_aux_translator
filters:
#- lua_filter@*moran_aux_hint # 輔助碼提示需要去掉本行開頭的 # 符號
- lua_filter@*moran_charset_filter
- lua_filter@*moran_fix_filter
- simplifier
- simplifier@emoji
- simplifier@chaifen
- simplifier@std_tw
- simplifier@std_hk
- simplifier@std_dzing
- uniquifier
speller:
alphabet: abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
delimiter: " '"
aux_algebra:
__append:
- derive/^(.*);(\w)(\w)$/$1/
algebra:
__patch:
- moran:/algebra/user_force_top?
- moran:/algebra/user_sentence_top?
- :/speller/aux_algebra
- moran:/algebra/user_sentence_bottom?
- moran:/algebra/user_force_bottom?
translator:
dictionary: moran.extended
prism: moran_aux
initial_quality: 5
preedit_format:
- xform/([a-z][a-z][a-z][a-z])o/$1°/
custom_phrase: # 自定義短語
dictionary: ""
user_dict: moran_custom_phrases
db_class: stabledb
enable_completion: false
enable_sentence: false
initial_quality: 10
# 掛接用法,需解除 translators 中對應的註釋
fixed:
dictionary: moran_fixed
initial_quality: 10
enable_completion: false
enable_sentence: false
enable_user_dict: false
enable_encoder: false
encode_commit_history: true
english:
# tag: english # librime>=0.12 方可取消註釋
dictionary: moran_english
enable_user_dict: true
enable_completion: true
enable_sentence: false
initial_quality: 0
comment_format:
- xform/~[A-Za-z]*//
japanese:
dictionary: moran_japanese
enable_completion: false
enable_sentence: true
initial_quality: 0
simplifier:
option_name: simplification
opencc_config: moran_t2s.json
emoji:
opencc_config: moran_emoji.json
option_name: emoji
tips: all
chaifen:
option_name: chaifen
opencc_config: moran_chaifen.json
tips: char
show_in_comment: true
inherit_comment: true
comment_form:
- "xform/-/ /"
std_hk:
opencc_config: t2hk.json
option_name: std_hk
std_tw:
opencc_config: t2tw.json
option_name: std_tw
std_dzing:
opencc_config: moran_dzing.json
option_name: std_dzing
tips: all
reverse_format:
comment_format:
- xform/(\w\w);(\w\w)/$1[$2]/
preedit_format:
- xform/^o(lf|bh|cj|vy|hm)//
reverse_tiger:
tag: reverse_tiger
dictionary: tiger
enable_completion: true
prefix: "ohm"
tips: 〔虎碼〕
__include: reverse_format
reverse_universal:
tag: reverse_universal
dictionary: moran.chars
tips: 〔通配〕
__include: reverse_format
reverse_stroke:
tag: reverse_stroke
dictionary: stroke
prefix: "obh"
enable_completion: true
tips: 〔橫h豎s撇p捺n折z〕
__include: reverse_format
reverse_cangjie5:
tag: reverse_cangjie5
dictionary: cangjie5
prefix: "ocj"
enable_completion: true
tips: 〔倉頡五代〕
__include: reverse_format
reverse_zrlf:
tag: reverse_zrlf
dictionary: zrlf
prefix: "olf"
enable_completion: true
tips: 〔兩分〕
__include: reverse_format
reverse_tick:
__include: reverse_tiger
tag: reverse_tick
prefix: "`"
reverse_lookup:
extra_tags:
- reverse_tiger
- reverse_universal
- reverse_stroke
- reverse_cangjie5
- reverse_zrlf
- reverse_tick
punctuator:
import_preset: symbols
key_binder:
import_preset: default
custom_bindings:
__append:
# 在這裏添加只在本方案中生效的按鍵綁定
bindings:
__patch:
- :/key_binder/custom_bindings?
- moran:/key_bindings/moran_switches
- moran:/key_bindings/moran_tab
- moran:/key_bindings/moran_capital_for_last_syllable
- moran:/key_bindings/moran_semicolon_for_2
- moran:/key_bindings/moran_keypad
recognizer:
import_preset: default
patterns:
punct: '^/([0-9]0?|[A-Za-z]+)$'
# 反查
reverse_universal: "(^(`[a-z`]+))|(^([a-z]{2}(`[a-z`]?|[a-z`]`)))"
reverse_tick: "(^`$)|(^`[a-zA-Z]+$)"
reverse_tiger: "^ohm[a-z]+$"
reverse_stroke: "^obh[a-z]*$"
reverse_cangjie5: "^ocj[a-z]*$"
reverse_zrlf: "^olf[a-z]*$"
recognizer_secondary:
patterns:
# {4} 表示輸入長度達到 4 後開始輸出英語
english: '^[A-Za-z]{4}[A-Za-z]*'
moran:
# 預取個數
# 設置爲小於等於 0 的數相當於無限制。
# 設置爲正數時:數字越小,速度越快,被輔到的字越少;
# 數字越大,速度越慢,能被輔到字就越多。
# 默認爲無限制。
# 如果在某些性能較低的設備上使用時感到卡頓,可以設置爲 50 或更小的數字。
# 如果感到被輔生僻字過多,也可以考慮設置爲較小的數字。
prefetch: -1
# 固定一二級簡碼。參考設置:
quick_code_indicator: "⚡"
fix:
d: 的
l: 了
j: 就
# 首選固定爲句子,使得在輸入長句時,首選的長度不會跳變
# 例如,輸入「不太理解」輸入到 "bu tl l" 時,
# 若爲 false,則首選可能是「郶」(l 輔助碼生效)
# 若爲 true,則首選是「不太冷」(bu tl l 被視作雙拼),次選可能是「郶」(l 輔助碼生效)
sentence_priority: true
# 句子優先的生效長度
# 只有在句子輸出大於該長度時,句子才會被前置。
# 例如,要輸入「哪個」時輸入 nagek,首先被嘗試理解爲 na'ge'k,輸出三個字。
# 若設爲 4,就可以保證 nagek 的首选出現「哪個」,而不是三個字的候選。
# 若設爲 0,則表示不加限制、永遠開啓。
sentence_priority_length: 0
# 四碼時是否優先單字
# ※ 該設置優先級高於 word_over_char_tolerance
# 若本選項爲 true,即使 word_over_char_tolerance 大於 0,四碼仍然是單字優先。
char_priority: false
# 允許多少詞出現在被輔候選之前,影響輸入長度爲偶數的情況
# 被輔單字太多的情況下,例如 ji'dj li'hl 等,允許一些詞出現在這些字之前。
# 若設爲 0,相當於被輔候選永遠在最前,輸入 xibk 時首選會是「兮」而不是細胞。
# 若設爲 1,相當於被輔候選會出現在次選。
# 必須是正整數。
#
# ※ 該設置優先級低於 single_char_input_len。
# 如果本設置大於 0,而 single_char_input_len=4 ,則
word_over_char_tolerance: 2
# 是否允許被輔候選和插入詞語之間調頻
# 僅在當 word_over_char_tolerance > 0 時有效
# 如 doxx 存在「多謝」和「多」兩個候選,具體順序依據用戶使用頻率而定。
# 若設置爲 true,「多謝」可能出現在「多」之前,也可能出現在「多」之後。
# 若設置爲 false,則詞語無條件出現在被輔候選之前。
word_over_char_adaptive: true
# 輸入輔助碼時,原來匹配的首選後移
# ※ 該選項也對詞語生效。
#
# 例如,假設輸入 he 的首選是「喝」,
# 如果進一步輸入 k,有很大可能意味着我們想找一個不是「喝」的字。
# 那麼「喝」應該被延遲到若干選項之後。
#
# 注意,該功能不影響僅輸入一碼或二碼時的行爲,
# 即若 h 的首選是「喝」,則輸入 he 的首選依然是「喝」。
# 若需要改變此行爲,可以參照上方的一二級簡碼設置。
#
# 若爲 true,則原來匹配的候選被延遲到若干選項之後。
# (延遲候選的個數由 aux_priority_defer 指定。)
# 若爲 false,則 hek 一定仍然是「喝」。
aux_priority: true
# 延遲多少位
aux_priority_defer: 2
# 設定 aux_priority 作用時的輔助碼長度
# 若爲 1,表示允許 he -> hek 時降權「喝」字,即從二碼輸入一碼到三碼時。
# 若爲 2,表示允許 hek -> hekh 時降權「喝」字,即從三碼輸入一碼到四碼時。
# 其他任何數字都是無效輸入。
aux_priority_length: 1
# 如果候選被後移,增加一個提示符。
aux_priority_indicator: "▾"
# 輔助碼作用位置
# 注:輔篩模式無論如何都是在 *首個詞語* 上進行篩選。
# 本配置只影響取用哪個輔助碼
# first:首字
# last:末字
# any:任意字
aux_position: any
# 默認啓用語言模型
__include: moran:/octagram/enable_for_sentence