所以我有两个数据集,drinks 和drinks2,关于星巴克饮料的营养信息,每个数据集都有一组不同的饮料作为观察值。
饮料列:
['Beverage', 'Calories', 'Fat (g)', 'Carb. (g)', 'Fiber (g)','Protein (g)', 'Sodium (g)']
饮料列2:
['Beverage_category', 'Beverage', 'Beverage_prep', 'Calories', 'Fat (g)','Trans Fat (g)', 'Saturated Fat (g)', 'Sodium (g)', 'Carb. (g)', 'Cholesterol (mg)', 'Fiber (g)', 'Sugars (g)', 'Protein (g)','Vitamin A (% DV)', 'Vitamin C (% DV)', 'Calcium (% DV)', 'Iron (% DV)', 'Caffeine (mg)']
将两个数据集合并到它们的公共'Beverage'
列上后,新数据集的'Beverage'
列由三个值的多次出现组成;拿铁咖啡、焦糖玛奇朵、卡布奇诺咖啡,这表示在初始数据帧的两个原始“饮料”列中都存在这些值,并且它们的存在通过手动检查得到确认。
但是,当尝试使用以下 for 循环打印出公共值时:
for i, v in drinks2['Beverage'].iteritems():
if v in drinks['Beverage']:
print(v)
输出上没有显示任何内容。两个饮料列之间有共同的值,但没有打印任何内容。知道为什么吗?