我有两个数据集。第一个是:
countyGroup income other_data_
1 20990 …
2 25622 …
3 24289 …
4 27391 …
5 23326 …
6 19261 …
7 15197 …
8 11132 …
第二个是:
countyGroup state county other_data
1 IL 123 …
1 IL 123 …
2 MI 365 …
1 IL 123 …
3 AK 65 …
4 IL 546 …
5 MI 689 …
6 AK 32 …
变量countyGroup
唯一标识state
和county
。第二个数据集包含countyGroup
和。第一个数据集仅包含. 我需要在第一个数据集中生成两个变量 (和)。state
county
countyGroup
state
county
我尝试使用以下方法匹配值merge
:
use dataset1
merge 1:m countyGroup using dataset2, keepusing(state state cntyfp) update replace
我得到的结果是重复的行......我试过1:1
它没有工作......我总是可以drop
那些重复的行,但我想从一开始就正确合并它们。