假设我有一段文字,例如:
苹果公司由史蒂夫·乔布斯、史蒂夫·沃兹尼亚克和罗纳德·韦恩于 1976 年创立,旨在开发和销售沃兹尼亚克的 Apple I 个人电脑。1977 年,乔布斯和沃兹尼亚克将其合并为 Apple Computer, Inc.,其计算机的销量(其中包括 Apple II)迅速增长。Apple Computer, Inc. 成立于 1977 年 1 月 3 日,Wayne没有离开,他在共同创立 Apple 后仅 12 天就离开并以 800 美元的价格将他在公司的股份卖给了乔布斯和沃兹尼亚克。
这里的“Jobs”、“Wozniak”、“Wayne”分别指的是“Steve Jobs”、“Steve Wozniak”和“Ronald Wayne”。
如何将文本解析为类似
Apple 由史蒂夫·乔布斯、史蒂夫·沃兹尼亚克和罗纳德·韦恩于 1976 年创立,旨在开发和销售史蒂夫·沃兹尼亚克的 Apple I 个人电脑。1977 年,史蒂夫·乔布斯和史蒂夫·沃兹尼亚克将其合并为 Apple Computer, Inc.,其计算机(其中包括 Apple II)的销量迅速增长。Apple Computer, Inc. 于 1977 年 1 月 3 日成立,罗伯特·韦恩 ( Robert Wayne )在共同创立 Apple 后仅 12 天就离开并以 800 美元的价格将他在公司的股份卖给了史蒂夫·乔布斯和史蒂夫·沃兹尼亚克。
用“史蒂夫乔布斯”替换“乔布斯”显然是需要做的,但我如何检测到与“史蒂夫乔布斯”相对应的文本中有“乔布斯”。
(Steve Jobs 和 Jobs 被检测为单独的命名实体)