1

我有一组在 2 个不同时间段编写的文件。有一种迹象表明,第一期写的文件比第二期的文件更简洁。它们都是关于同一主题的。

我唯一能想到的是使用 LZW 算法并采用压缩/原始的比率来计算文档的一种简洁性。

我希望结果是:

  1. 文档 1 - 重复性指数或百分比 = 25% 或类似指标。之后,我将使用重复性指数创建一个不同时期的文档数据框,并进行统计测试以查看统计显着性。
4

0 回答 0