0

我即将制作一个翻译网站(使用 PHP),人们可以在其中订购翻译来翻译他们的文档。人们可以从该站点上传他们的文件,然后将其连接到该站点的翻译/成员。问题是我如何制作一个从文档中计算价格的应用程序。

评价翻译价格的最常用方法是按字数计算。所以我需要知道客户上传的文档中有多少字。我认为必须有可能从文本文件(如 word 文档)中计算单词。但是,我找不到任何方法来获取 ms word 2003 文档 (.doc) 的确切数量。我找到了一种方法来计算 .docx,但不是 .doc。并且会有更多的文件,例如 PDF 或 rtf。

我见过另一种只计算文件大小的方法,但我认为它不会对不同的文档格式给出相同的结果。或者它是?我能想到的简单方法是要求访问者将他们的文本复制/粘贴到文本区域,但我认为这不是最好的方法。

有人会给我一个建议,我该如何解决这个问题?

4

1 回答 1

0

If you're running your site on a *nix server, you might want to try the following:

$word_count = system("wc -w " . $filename);

And, yes, I've been lead to believe that it works with .doc and .docx documents. PDF's are a whole other story. I'll have to research that one.

于 2012-12-15T21:08:00.363 回答