我有一个包含以下列的 csv 文件:
Email | Date | Location
我几乎想把它直接扔到数据库表中。问题是文件中的位置值是字符串 - 例如:“波士顿”。我要插入的表具有整数属性LocationId
。
所以,在我的数据流的中途,我需要做一个数据库查询来获取Location对应的LocationId。例如:
SELECT Id as LocationId FROM Locations WHERE Name = { location string from current csv row }
并将其添加到我当前的列集中作为新值“LocationId”。
我不知道该怎么做 - 我尝试了查找,但这意味着我必须将查找放在单独的数据流中 - 我的 csv 文件中的列似乎不可用。
我想使用缓存,因为相同的位置重复了很多次,并且我不想在不需要时为每一行运行选择。
总之:
- 我如何才能在数据流的一部分中坚持查找转换(来自不同的源,sql),并将输出与 csv 派生列合并?
- 查找是否使用了错误的转换?