背景:关于序列比对的 维基百科页面说 DNA 序列比对算法也可用于自然语言处理。
问题: 因为命名实体识别器和 DNA 序列库都进行近似字符串匹配 -使用 DNA 测序库(如Bowtie)并构建您的 NER 是否可行?
不使用现有 NER 开源而是使用 DNA 测序库来构建 NER 的一个原因是希望在我的 NER 中自动获得“拼写错误纠正”。
如果我上面的假设是有道理的 - 是否有一些在线 DNA 测序工具,我可以在其中输入我的名人姓名数据库而不是 DNA 序列,并尝试在 DNA 测序工具中搜索拼写错误的“Michale Jacksun”,希望它与来自输入数据库的“迈克尔杰克逊”