我有一个 csv 文件,其中包含Products
以下 4 个字段的列表
Product ID, Name, Alias, UOM
我想将文件导入到有 2 个表的数据库中。首先是Product
表格:
Product ID, Name, UOM
第二个是Product Alias
表:
Product ID, Alias
每个Product ID
可能有 0 到多个别名。
有没有什么办法可以Alias
通过逗号之间的不同分隔符来处理该列,例如“;” 或句号“。” 将给定产品 ID 的 0 到多个别名分开?
因此,在 csv 导入期间,当它获得第三个逗号时,它会将该数据导入第二个表,但会导入一条新记录,其中包含重复的产品 ID,因为该逗号字段中有许多别名。
希望我解释得足够好,如果我没有,让我解释。无论正在使用什么代码,我对执行此操作的可能处理更感兴趣,但 python 将是首选路线。
示例数据
ProductID, Name, Alias, UOM
122, Widget1, W1; Wid1;Wt1, Each
123, Widget2, , Each
124, Widget3, W3; Wt3, Each