问题标签 [unique-values]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 是否有 R 函数可以删除大型数据集的单元格中的重复值?
我有一个大数据集,我的问题如下:我在一个单元格中有多个条目。我想删除单元格中的重复项,但保留所有列的重复行条目。这是一个示例代码,它将导致类似于我现在所处的情况:
该数据集有 >1000 行和 4 列,在很大程度上都存在这个问题。所以手动解决它们是没有选择的。
我无法在单元格中找到此类重复问题的解决方案。整列都有相似的条目,有时它们是相同的,有时它们是不同的。所以重要的是,不同的行仍然有可能具有相似的条目。还有标点符号问题,我想稍后解决,因为现在重复是更大的问题。
有什么建议么?
亲切的问候,
arrays - 从数组中复杂删除组内的重复元素
我有以下输入数据,我想删除每个组和每个子组中的重复元素(使所有字符串保持相同的出现顺序)。一个组以一个有相关的字符串开始s5
,在这种情况下都在“FIRST CHAPTER”之下,下一个组从“SECOND CHAPTER”的第一次出现开始。每个组内可以是与 相关的子组s4
。例如“第一部分”、“介绍”、“第二部分”等。
输入就像左边的列。第二列是显示组内和组/子组内每个字符串出现次数的说明。第 3 列是预期输出,第 4 列是我目前得到的输出。
我用黄色突出显示了每个字符串的第一次出现,以便更好地向您展示应该在输出中打印哪些元素。黄色的那些是它们各自组/子组中的第一次出现,并删除所有白色的行,我们得到正确的输出。我希望有意义。
这是我当前的代码,其中逻辑看起来是 uniq 值。输出相似但不正确,因为将 uniq 值与整个数组进行比较,而不是与每个组进行比较。
有人可以帮助我如何做到这一点。谢谢
下面的输入和输出
ggplot2 - 分类变量 R estudio 中的唯一值
如何找到每个类别在数据框中包含多少个唯一值,然后用图表表示?这一切都在 R 工作室
vba - 计算记录比较的唯一标识符
我有一个存储导入数据的表。每次导入时,我都需要检查导入的项目是否已经存在。我为此使用了一个唯一的 ID,它工作正常。但是匹配的原因可能是正在导入相同的记录(对创建导入数据的日期范围没有控制),或者数据实际上可能已被修改。
所以我的问题是,要查看它是哪种类型,我打算对这条记录的 11 个货币字段进行计算。我不能把它们加起来,因为修改一个字段(比如增加 10,会减少另一个字段 10)。我想到了 Field1 x1 + Field2 x2 等应该消除依赖关系。
我认为这不是真正的 vba 问题,而是更多的数据唯一性问题。
当然我可以比较 11 个值,但这在 VBA 中很乱!欢迎任何想法。非常感谢。
数据示例 当前数据库中的记录: Receipt Payment DealValue Tax Duties etc 3,500 0 3,600 100 0 //3,600 - 100 = 3,500 净收入
进口记录 Receipt Payment DealValue Tax Duties etc 3,500 0 3,650 150 0 //3,650 - 150 = 3,500 净收入
我不想创建一个 ID,只是一个可以比较以查看是否有变化的计算。
excel - 计算唯一值并在另一列中返回结果
我在 B 列中有值(绿色、蓝色、白色....),我想计算它们,结果必须以下列格式出现在 A 列中(green01、green02、green03....、blue01、blue02、蓝色03,蓝色04....,白色01,白色02...)。
结果必须像这张照片一样
我已经在网上搜索了一个宏,但我没有找到一个适合我需要的宏。
谢谢
excel - 比较两列 - 仅从第二列获取唯一值
我正在寻找一种工具/脚本,它可以帮助我在比较两列时仅获取唯一值,并且仅获取第二列中的唯一值。例如,如果数据是:
第 1 列:
第 2 列:
在这种情况下,我希望在结果“aab 和 ccd”值中看到,因为它在 column1 中不存在。在我看来,Excel 似乎没有这个确切的功能。
先感谢您
r - 如何计算R中一行中的唯一值
我在 R 中有以下面板数据集,其中包含一个 ID 变量并显示该 ID 的最后登录详细信息。
在上面的数据集中,我想计算 A、B 和 C 登录的唯一次数。我如何在 R 中做到这一点,以便我只选择“last_log_date”变量并让 R 计算其中的唯一日期? 我还想将此计数列添加到数据集中。
期待解决这个问题!
谢谢,拉奇塔