1

我正在创建一个应用程序,用户可以在其中搜索多种语言。假设我有一个网站,其中托管着一本非常大的小说。可能由数千个段落组成。有些在 20,000 到 30,000 段之间。

用户可以阅读多种语言的小说。他可以用多种语言进行搜索。例如他用英文搜索“LOVE”,我将向他展示其中包含“LOVE”的所有段落。

现在,如果用户切换到法语,并搜索“Amour”(French for Love),我将向他显示所有包含“Amour”的段落。

我可以通过创建小说的两个版本来做到这一点,一个是法语版本,另一个是英语版本。确实,我会有翻译。但是,当用户阅读小说时,我会给他一个选项来单击任何单词并查看它是否被翻译成其他语言。在这种情况下,如果他正在阅读英文,我将向他展示该特定单词的法文翻译,反之亦然。

这意味着我想在不同语言之间保留单词到单词的映射。

一种方法是创建我自己的地图,这是很多工作。另一种方式可能是一些 API 调用,例如谷歌翻译。你能建议最好的方法吗?任何现有的API?一些谷歌条款为这项任务进入正确的方向也会有所帮助。

4

1 回答 1

2

Elasticsearch 可以很好地解决您的问题。

  1. 只需用他们的母语索引您的内容(很好地索引)
  2. 然后您可以使用 Elasticsearch 语音插件进行多语言搜索(https://www.elastic.co/guide/en/elasticsearch/plugins/current/analysis-phonetic.html

对于另一部分,您想要逐字翻译,我认为可以集成谷歌翻译或其他翻译api,或者也可以集成elasticsearch。

我希望这有帮助。

于 2018-12-16T11:59:25.557 回答