3

我正在寻找便于在通用文本编辑器(我使用 Emacs)中编辑并且可以在版本控制下存储(并允许轻松合并)的字典源文件格式。

所以我可以与其他人分享我在字典上的工作。

如果没有将 dict 源转换为索引形式以与字典软件文件格式一起使用的支持工具,则无法使用。

作为客户端词典软件,我使用 GoldenDict:http ://goldendict.org/dictionaries.php ,它了解许多索引 dicts 文件格式,但如果您推荐,我会切换到另一种。

以前我使用 TAB 格式(StarDict 的原始文件格式,转换为 .dict.dz/.idx/.ifo)。太丑了!每个单词定义必须保持在单行中,并且单词与 TAB 的定义分开。看:

be be [] (inf.)\n was/were [] (past ind.)\n be [] (past part.)\n (infinitive) быть, нести, родить

接下来我尝试使用 Dictd 文件格式。它要好得多:

  $猫我的.txt
...
形容词
形容词

   [ˈæʤɪktɪv]
   形容词
   形容词
   прилагательное

  $ dictfmt -f \
      --utf8 --allchars --区分大小写\
      -s '常用的字典缩写。' \
      我的 <my.txt

我也知道http://xdxf.sourceforge.net/。但深看,这是一个死项目。并且有两个明显的遗漏:

  • XML 排版噪音很难写文章
  • 没有工具可以将源代码转换为可用的字典(您只能转换为其他源格式,然后生成可用的字典......)

我正在寻找更好的解决方案...


为什么?我学习外语,想创建学过的单词词典来修改它们并进一步使用。

我还参与了开源软件项目手册和免费书籍的翻译,并希望维护术语列表,以便可以在翻译人员之间共享创建的字典以保持一致的翻译。

4

1 回答 1

2

正如我所说,stardict 的 TAB 文件是 DUMB。

目前我使用dict中的-c5格式(我邮寄给http://sourceforge.net/projects/dict/开发者,他说这是更合适和推荐的格式):

  $ dictfmt -c5 --headword-separator '; ' --break-headwords \
  --utf8 --allchars --区分大小写\
  --mime-header '内容类型:文本/html' \
  -s '常用的字典缩写。' -u http://gavenkoa.users.sourceforge.net/ \
  ${prefix_for_output} <${输入}

文章:

_____

形容词; 形容词

  [ˈæʤɪktɪv]
  形容词
  形容词
  прилагательное

_____

副词; 副词

  []
  副词。
  副词
  наречие

GoldenDict 的作者推荐使用 Abby Lingvo DSL丰富的格式,它允许格式化粗体/斜体、颜色等。要获取描述,请使用Lingvo 发行版中的Lingvo0.chm。例如:

聊天
  [m1][p][i][c][com]m[/com][/c][/i][/p][/m]
  [m1][trn]кот, кошка;[/trn][/m]
  [m2][*][ex][lang id=4]Chatbotté[/lang] — Кот в сапогах;[/ex][/*][/m]
  [m2][*][ex][lang id=4]jouer à chat perché[/lang] — играть в кошки-мышки[/ex][/*][/m]
于 2011-08-29T23:28:56.280 回答