问题标签 [anonymize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pandas - 匿名数据/替换名称
通常我通过使用 hashlib 和使用 .apply(hash) 函数来匿名化我的数据。
现在我尝试一种新方法,想象我必须遵循名为“数据”的 df:
我想通过将名称全部变成等来匿名化person1
,person2
如下所示:
所以我的第一个想法是总结名称列,以便将名称附加到唯一索引,我可以使用该索引作为“人”之后的数字。
azure - 在 Azure Pipeline 中转换数据以使其匿名
在我在荷兰社区大厅的新工作中,我们使用包含隐私敏感数据(例如公民服务号码)的数据库。他们最近还开始使用 Azure,正如我们所说的,我已经熟悉了。所以这可能是一个初学者的问题,但我希望有人能引导我走向正确的方向:有没有办法通过与数据库的直接连接来检索数据并使其“匿名”,例如通过散列或使用密钥文件在管道的某个地方?我知道管道是 .JSON 文件,并且可以进行一些转换。我很好奇在 Azure 中执行此操作的可能性!
**编辑**
更清楚地说:我想最好在管道中编写一段代码,它执行以下操作:
稍后,我想在这个数据库中添加列,例如这个人住的房子有什么样的价值。我希望能够通过使用“耦合”数据库
ios - 如何为 GDPR / RGPD 匿名化 iOS 版 Google Analytics(分析)
我想知道是否可以以匿名方式使用 Google Analytics for iOS。
目前可以:
- 禁用 IDFA ( https://developers.google.com/analytics/devguides/collection/ios/v3/optional-features )
- 匿名 IP ( https://developers.google.com/analytics/开发指南/集合/ios/v3/高级)
但是谷歌分析是否可以使用任何其他标识符?
例如,Google Analytics 是否使用 IDFV?(https://developer.apple.com/documentation/uikit/uidevice/1620059-identifierforvendor)
google-analytics - 如何设置 gtag anonymize_ip?我做错了吗?
所以通过阅读这个小页面来阅读,首先我想,我只需将以下行添加到我的 gtag 脚本中,一切都会好起来的:
但是今天我意识到,也许我没有正确理解它,而我所做的,这简直是愚蠢的。:)
所以现在我不知道第二行应该怎么看:
或者
或者根本不应该有两行,只是已经包含 anonymize_ip 的那一行...
不知何故,这对我来说不是自我解释的,因为谷歌文档的其他地方有这样的例子:
不像这样,用这些括号('<>')。所以只是拼写错误?
ubuntu - 使用 anonip.py 将 Apache 日志中的 IP 匿名化与使用 Cronolog 的日志轮换相结合
我当然希望我来对地方了。
我想匿名化日志文件中的 IP 地址(请参阅此处),同时在 Ubuntu 16.04 上使用 Cronolog 旋转日志文件。
这是对我当前的 CustomLog 条目的轻微推导:
如果我省略 cronolog,它确实有效,但不使用它。有谁知道如何使这项工作?替代品也受到赞赏。谢谢!
python - 用“X”替换所有大写字符,用“x”替换所有小写字符,同时保持所有空格或符号相同
我正在尝试创建一个代码,将输入字符串替换为“匿名”代码。我想用“X”替换所有大写字符,用“x”替换所有小写字符,同时保持任何空格或符号相同。
我理解<< variable >>.replace<< old value, new value >>和if和for循环,但是在实现它们来做我想做的事情时遇到了麻烦,请帮忙?
抱歉,如果我发布的代码不正确,我是新手
r - 匿名化 R 中每个不同行的数据
例子
价值
有三个不同的值,但有 7 行,下面是我想要的。因为我想匿名我的数据。我不断收到错误“替换有 3 行,数据有 7”
这是我正在使用的代码
价值
apache-kafka - 使用 Kafka 在多语言生产者之间共享分区逻辑
我们正在我的公司构建一个事件源系统,依赖于 Kafka。
为了符合 GDPR,我们需要能够更新事件。
我们的想法是使用压缩和墓碑功能。
这意味着我们不能使用默认的分区策略,因为我们希望每条消息都有一个唯一的键(为了覆盖特定的消息),但我们仍然希望发生在同一个聚合上的事件在同一个分区上结束。
这使我们创建了一个自定义分区器(基本上复制了默认分区器的“哈希模”逻辑,但使用与消息键不同的值来计算哈希)。
问题是我们正在多语言环境中发展(我们有 php、python 和 Java/Kotlin 服务发布和消费事件)。
我们希望确保所有这些服务都会在给定特定分区键的情况下向同一个分区生成消息(以防不同的服务将事件发布到同一个主题)。
我们的主要想法是使用一种通用的散列算法,但我们发现很难找到一个既具有强大的分布保证又具有良好稳定性的算法(不仅仅是实验库的一部分)。
PHP 本身支持广泛的散列算法,但我们发现很难在其他语言中找到相同的支持。
由于 Kafka 默认分区器依赖于 murmur2,我们也开始朝这个方向寻找。不幸的是,php 本身并不支持它(尽管存在一些实现)。此外,该算法使用种子,这意味着我们需要为所有发布者服务使用完全相同的种子,这开始使该方法看起来相当复杂。
但是,我们可能从错误的角度看待设计。跨多语言服务共享事件存储写入功能可能不是一个好主意,并且每个服务都可以有自己的分区逻辑,只要它确保“每个聚合一个分区”的要求。问题是我们必须提前考虑这一点,因为没有任何技术保障措施可以防止将来某个服务在“共享”事件流上发布(并且不使用完全相同的分区逻辑会在发生时产生巨大影响)。
是否有人有在多语言环境中使用 Kafka 构建事件存储的经验,并且可以就这个特定主题向我们强调一下,好吗?
wildfly - Wildfly:http访问日志IP匿名器
出于 GDPR 的原因,我想匿名化记录在 WildFly 的 access.log 文件中的 IP 地址。我该怎么做呢?有没有现成的解决方案?或者一些简单的方法来扩展现有的日志记录格式?我想保留 IPv4 地址的前 3 个八位字节。
html - 使用正则表达式匿名化 html
我正在尝试使用正则表达式匿名化 HTML 字符串以进行 SQL 查询。
https://regex101.com/r/QWt1E1/1
计划是将不在 <> 中的每个字符替换为n
. 它几乎可以工作,但在我的示例中,它取代了e
in </em>
。不知道为什么以及如何解决这个问题。
如何调整正则表达式以不替换e
示例中的?