2

我正在尝试比较两份简历。我有一个标准,如果某些字段匹配它是重复的。如您所知,简历风格各不相同。我如何理解名称字段是名称字段,因此我可以将其存储在某处并将其与另一份简历中的同一字段进行比较?

到目前为止,我已经使用了一种 Interop 方法,并且我在一个字符串中获取了所有文档内容。从字符串中,我拆分所有 \t、\r 和空格,并获得一个数组。从数组中,我怎样才能得到我自己的标准 xml 格式,如下所示:

XML 格式:

 <CANDIDATE_FULL_NAME>CandidateName here</CANDIDATE_FULL_NAME>
 <CANDIDATE_FIRST_NAME>CandidateFirstName here</CANDIDATE_FIRST_NAME>
 <CANDIDATE_LAST_NAME>CandidateLastName here</CANDIDATE_LAST_NAME>
 <PRIMARY_EMAI`enter code here`L_ID>name@gmail.com</PRIMARY_EMAIL_ID>
 <PHONE_BASIC>+919720018454155</PHONE_`enter code here`BASIC>
 <DOB>8/2/1987</DOB>
 <STREET1></STREET1>
 <STREET2></STREET2>
 <CITY></CITY>
 <REGION></REGION>
 <COUNTRY></COUNTRY>
 <PIN></PIN>

在审查了我的问题后,我很明显我不知道自己在做什么,并且非常感谢一个起点。

4

1 回答 1

0

Ganesh,我建议建立自己的逻辑。这是您可以使用的。

  1. 将所有简历划分为各个字段。
  2. 然后你可以给每个字段加上权重年龄。

    电子邮件 - 80
    电话 - 80
    姓名 - 20
    最高学历 - 20
    家乡 - 20
    最后工作的公司 - 20
    出生日期 - 30
    和别的
    
  3. 然后将数字相加,看看它们的总和是否为 80 或以上。
  4. 如果不止于此,那么您可以说出相同的简历。
  5. 但如果不是那么你知道什么。
  6. 挑战在于有多少字段,以及如何拆分它们。我建议使用一些简历解析器并在此之上构建逻辑。
于 2013-05-02T17:14:33.337 回答