如何评估 ASR(自动语音识别)中的 WER(单词错误率)?
例如,如果我有 (Human Ref. Translation) 用于 ASR 的句子和输出。
我知道方程式,但我不知道如何计算它。计算WER时是否输入逗号、句号等标点符号?
以及对于单词的 sub、ins 和 del。有具体重量吗?他们每个人在等式中计算时?
任何知道我们如何为 ASR 计算 WER 的人。请给我一个例子,以便我可以在我的应用程序中的多个句子中计算 ASR 的 WER
如何评估 ASR(自动语音识别)中的 WER(单词错误率)?
例如,如果我有 (Human Ref. Translation) 用于 ASR 的句子和输出。
我知道方程式,但我不知道如何计算它。计算WER时是否输入逗号、句号等标点符号?
以及对于单词的 sub、ins 和 del。有具体重量吗?他们每个人在等式中计算时?
任何知道我们如何为 ASR 计算 WER 的人。请给我一个例子,以便我可以在我的应用程序中的多个句子中计算 ASR 的 WER
计算WER时是否输入逗号、句号等标点符号?
您在计算之前去掉标点符号并将所有内容都转换为小写。
任何知道我们如何为 ASR 计算 WER 的人。请给我一个例子,以便我可以在我的应用程序中的多个句子中计算 ASR 的 WER
你可以使用这个 Python 包:
https://pypi.org/project/jiwer/
如果您需要其他语言,请告诉我们哪些。
一个简单的 C++ 实现基于 Levenshtein 距离,只是一个没有任何库的文件。