问题标签 [azure-purview]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 如何在 Azure Purview 中为数据分类创建列名模式匹配?
如果列名包含以下任何内容,我要做的只是将字段分类为“出生日期”:
- 出生日期
- 出生日期
- 出生日期
- 生日快乐
我不是一个庞大的 RegEx 用户,但我通常可以通过几个谷歌来弄清楚。我在自定义数据分类规则中尝试了以下所有方法:
DateofBirth|BirthDate|DOB|YMDBIRTH
/DateofBirth/|/BirthDate/|/DOB/|/YMDBIRTH/
.*DateOfBirth.*|.*BirthDate.*|.*DOB.*|.*YMDBIRTH.*
/.*DateOfBirth.*|.*BirthDate.*|.*DOB.*|.*YMDBIRTH.*/i
这些似乎都不起作用...我开始认为这与我的扫描有关...是否存在某种滞后?
我什至只是在分类规则上使用了 YMDBIRTH,扫描完成后它仍然没有对列进行分类。
根据这个微软文档,我认为我在这里记录的第一个方法应该有效“ DateofBirth|BirthDate|DOB|YMDBIRTH ”
根据文件,它说:
或者,如果数据通常位于他们知道名称的列中,例如 Employee_ID 或 EmployeeID,他们可以添加列模式正则表达式以使扫描更加准确。一个示例正则表达式是Employee_ID|EmployeeID
所以使用这个,我认为应该可以工作: Classification Rule Screenshot
azure-purview - Azure Purview 的数据工厂连接页面中缺少“新建”按钮
我正在尝试将数据工厂连接到我的 Azure 权限帐户。但我在数据工厂连接页面上看不到“新建”按钮。我看到的只是刷新按钮。有人可以帮我理解我错过了什么吗?
我为我的用户分配了贡献者、读者、权限数据管理员和权限数据源管理员角色。
谢谢
azure-synapse - 无法从 Azure Synapse 连接 Azure 权限
我遵循了将 azure 权限帐户与突触连接的文档 。我在 Synapse Workspace 中看不到选项 - 管理 -> Azure Purview。
azure-cosmosdb - Azure Purview 扫描 cosmos 数据库以发现数据资产有时会失败
我测试了设置 Azure Purview 和 CosmosDB 与预置吞吐量容量/无服务器容量模式 SQL API,集合很少。在 Cosmos 数据源注册后,我启动了扫描并提供了指向 CosmosDB 帐户密钥的密钥库。对于具有预置吞吐容量模式的 CosmosDB,已成功发现数据资产。
对于容量模式 - 无服务器 CosmosDB SQL API,收集项在扫描完成后未被识别为数据资产。
azure-purview - 无法调用 Azure Purview Rest API 以使用唯一属性更新实体
我正在尝试使用“/atlas/v2/entity/uniqueAttribute/type/{typename}”端点更新 Purview 中的实体描述,但无法使其正常工作。
休息 API 端点 - https://XXXX.catalog.purview.azure.com/api/atlas/v2/entity/uniqueAttribute/type/azure_datalake_gen2_filesystem?attr:qualifiedName=https://XXXXXX.dfs.core.windows.net/ testcont 操作 - PUT 正文 - {"description" : "test"}
响应 - {"requestId": "XXXX", "errorCode": "RequestInvalid", "errorMessage": "请求无法识别。请验证 HTTP 方法、标头或 URL"}
有人可以让我知道我在这里做错了什么。
azure - 注册源选项中缺少 Azure Purview Sources(SAP、HIVE、S3、“多个源”)
希望在订阅/帐户中注册所有数据源,但缺少“Azure(多源)”选项。与其他来源(HIVE、SAP、AWS S3)一样。
为什么会这样?
azure - Is it possible to create "Glossary Categories" in Purview as was possible in Apache Atlas?
In Atlas, it was possible to create a hierarchy of categories and subcategories in the Glossary to partition all the Business Terms.
Is there any way to create similar categories/sub-categories in Purview?
azure - 从数据湖的原始摄取层中的 CSV 文件推断架构的最佳实践?
在数据湖的原始摄取层中推断模式是否有最佳实践(不是模式验证,只是推断数据类型和列名)?
我正在使用 Azure,并希望设计一种方法来验证摄取层下游的架构,因此想要一种从 CSV 推断它以进行验证的方法。
到目前为止,由于标头中的架构,我尝试使用 Azure 数据工厂读取带有整数的 csv 并写入 AVRO,并将其全部存储为字符串。我还尝试使用 Purview 扫描文件(CSV 和 AVRO),但仍然返回所有字符串。
文件格式:NAICS 公司编号、NAICS 公司名称、每个州的列(wa 值为 1 或 0)
我认为显而易见的答案可能是使用 Spark(Databricks),但我想确保我有一个简单/必要的理由来提出这个建议。
编辑:我们需要动态地执行此操作,因为我们将每天运行它并且用于摄取许多 csv(而不仅仅是一个文件)的管道。
sql-server - 将集成运行时连接到 azure 数据工厂和权限
我想使用 azure 数据工厂将数据从我的本地服务器加载到 azure,我还将使用权限扫描我的本地服务器。
如何使用一个集成规则扫描同一台服务器,而不是每次都手动更改它?