56

我需要在 Java 字符串之间执行差异。我希望能够使用原始字符串和差异版本重建字符串。有没有人用Java做过这个?你用什么图书馆?

String a1; // This can be a long text
String a2; // ej. above text with spelling corrections
String a3; // ej. above text with spelling corrections and an additional sentence

Diff diff = new Diff();
String differences_a1_a2 = Diff.getDifferences(a,changed_a);
String differences_a2_a3 = Diff.getDifferences(a,changed_a);    
String[] diffs = new String[]{a,differences_a1_a2,differences_a2_a3};
String new_a3 = Diff.build(diffs);
a3.equals(new_a3); // this is true
4

8 回答 8

53

这个库似乎可以解决问题:google-diff-match-patch。它可以根据差异创建补丁字符串并允许重新应用补丁。

编辑:另一个解决方案可能是https://code.google.com/p/java-diff-utils/

于 2008-09-25T10:41:37.537 回答
26

Apache Commons 有字符串差异

org.apache.commons.lang.StringUtils

StringUtils.difference("foobar", "foo");
于 2008-09-25T10:22:22.983 回答
4

java diff utills库可能很有用。

于 2009-07-18T08:36:27.573 回答
3

正如 Torsten 所说,您可以使用

org.apache.commons.lang.StringUtils;

System.err.println(StringUtils.getLevenshteinDistance("foobar", "bar"));
于 2008-09-25T10:46:16.153 回答
1

如果您需要处理大量数据之间的差异并有效地压缩差异,您可以尝试使用 xdelta 的 Java 实现,它反过来为二进制差异实现 RFC 3284 (VCDIFF)(也应该使用字符串)。

于 2008-09-25T14:36:44.540 回答
0

使用Levenshtein 距离并从算法建立的矩阵中提取编辑日志。维基百科文章链接到几个实现,我确信其中有一个 Java 实现。

Levenshtein 是最长公共子序列算法的一个特例,您可能还想看看。

于 2008-09-25T10:40:02.300 回答
0

Apache Commons Text 现在有StringsComparator

StringsComparator c = new StringsComparator(s1, s2);
c.getScript().visit(new CommandVisitor<Character>() {

    @Override
    public void visitKeepCommand(Character object) {
        System.out.println("k: " + object);
    }

    @Override
    public void visitInsertCommand(Character object) {
        System.out.println("i: " + object);
    }

    @Override
    public void visitDeleteCommand(Character object) {
        System.out.println("d: " + object);
    }
});
于 2020-02-12T14:58:11.917 回答
-7
public class Stringdiff {
public static void main(String args[]){
System.out.println(strcheck("sum","sumsum"));
}
public static String strcheck(String str1,String str2){
    if(Math.abs((str1.length()-str2.length()))==-1){
        return "Invalid";
    }
    int num=diffcheck1(str1, str2);
    if(num==-1){
        return "Empty";
    }
    if(str1.length()>str2.length()){
        return str1.substring(num);
    }
    else{
        return str2.substring(num);
    }

}

public static int diffcheck1(String str1,String str2)
{
    int i;
    String str;
    String strn;
    if(str1.length()>str2.length()){
        str=str1;
        strn=str2;
    }
    else{
        str=str2;
        strn=str1;
    }
    for(i=0;i<str.length() && i<strn.length();i++){
            if(str1.charAt(i)!=str2.charAt(i)){
                return i;
            }
    }
        if(i<str1.length()||i<str2.length()){
            return i;
        }

    return -1;

   }
   }
于 2016-11-29T18:30:26.300 回答