生成mdx詞庫的工具,mdx轉(zhuǎn)換軟件MdxBuilder,含stardict辭典轉(zhuǎn)換工具,在使用MdxBuilder制作詞庫時,將Data路徑指向上面存放數(shù)據(jù)的目錄,該目錄中的所有文件都會被壓縮到后綴名為.mdd文件中,使用時該.mdd文件應當與.mdx文件在同一目錄下。
轉(zhuǎn)換程序支持格式:
1) 擴展的SugarDict格式:
每個項目(詞條)一行,缺省最大為32K. 格式為: 關鍵字
解釋(就是關鍵字和解釋之間用空格分開)
關鍵字: 可以是大小寫的組合, 每個單詞的最大長度是255個字符。
關鍵字和解釋中的'_', '^'在轉(zhuǎn)換后會被替換成空格和回車
例子:
break_through /'bri:k_MQru:/ ^v. 突破^n. 突破
good ^adj.好^adj.賊好^adj.好得不得了
2) KDict解碼后的tab格式
每個條目一行,關鍵字和解釋之間用"tab"分隔. 其中的"\n"會被轉(zhuǎn)換成換行
例如:
good adj.好\nadj.賊好\nadj.好得不得了
3) MDict的html格式
每個項目兩行
第一行是關鍵字
第二行開始是正文, 這里的正文應該包括關鍵字。可以使用html的標記(不要包含<html>
<body></body></html>, 這個程序會自動加上, 另注意在轉(zhuǎn)換時要指明源數(shù)據(jù)為html).
如果需要顯示音標的話,可以利用html指定字體就可以顯示了。(參見下面的例子)
正文結(jié)束后必須用一行</>表示結(jié)束
例子:
Whole
<font size=5>whole</font>
<br>
<font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>
</>
在html中連接到其它關鍵字的方法:
<a href="entry://key#section">key</a>
其中key是關鍵字,section是對應關鍵字頁面中的section名稱.
4) MDict的緊湊型html格式(Compat Html)
這個格式由兩個文件組成,正文文件格式基本和2)一樣,但在正文里可以使用記號。另外
一個是記號文件。
記號文件的格式:
由多個記號定義組成,每個記號定義有3行
第一行: 記號的名稱(只能用數(shù)字,必須大于0,最大不超過255)
第二行: 開始字符串(可以為空)
第三行: 結(jié)束字符串(可以為空)
使用時在正文里使用`記號`(鍵盤左上角的那個符號)就會將后續(xù)的文字直到下一個記號前的文
字用記號定義的開始字符串和結(jié)束字符串括起來。正文里如果需要顯示` 則用"`"表示。內(nèi)
碼應該和正文的一樣(例如正文如果是用Unicode的話,記號文件也應該用Unicode)
例如:
記號文件:
1
<font size=5>
</font>
2
<br>
3
<font face="Kingsoft Phonetic Plain, Tahoma">
</font>
正文文件:
whole
`1`whole`s`2`<p>`3`(hol,hJl; houl)
</>
最后在顯示的時候就會被替換成
<font size=5>whole&#%96;s</font><br><p><font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>
備注:
如果你的數(shù)據(jù)里含有國際音標,建議使用Unicode格式
(請參考http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm)
將音標用對應的Unicode進行表示。這樣只要用戶裝有支持IPA的字體文件就能夠顯示音標。
(Windows里的Lucida Console就包含有IPA對應的字體)
MdxBuilder關于選項的說明:
a) Key case sensitive
關鍵字(標題)是否大小寫敏感。多數(shù)情況下詞典是大小寫不敏感的,所以不要選。
b) Allow export to text
是否允許導出為文本。如果選了,就可以用MdxExport這個工具吧詞典導出為文本格式。
c) Right to left text
文字的閱讀順序。中文是從左到右,阿拉伯文之類的是從右到左。
d) Strip key
是否去掉關鍵字中的特殊符號。例如21世紀詞典里的關鍵字是顯示成"lis.ten" 這個樣子的,如果不去掉".",則用戶需要輸入"lis.ten"而不是”listen"來查詢單詞。
e) Title
這個是用來標示詞典的名字,計劃將來在需要顯示詞典名稱的地方進行顯示用的。但目前暫時沒有用處。
f) Description
詞典的詳細介紹。第一次打開詞典時看到的歡迎頁面。
g) Build Data archive
僅進行數(shù)據(jù)文件制作。主要是用來制作圖庫,聲音庫時用。勾選后就不用填寫Source路徑。
h) Index block size,Record block size. 這兩個是調(diào)整性能用的,用缺省值就好了。
i) Encryption Key
詞典加密的密匙,用于詞典授權(quán)用的。可以參見MdxBuilder.zip里的LibKeygen.txt的說明
注意事項:
1、圖片鏈接最好使用 <img src=file:///1/1.jpg> 這樣的格式
2、轉(zhuǎn)換出錯一般是標題位置有多余的空行
如:
詞條1標題
詞條1內(nèi)容
</>
詞條2內(nèi)容
</>
3、mdxbuilder處理轉(zhuǎn)換后的mdx文檔大小應在4G以下