0

我有几张来自不同来源和不同引用指标的学术期刊排名表。我想将它们组合在一个表中,按日志聚合数据。

例如,第一个表有列:

ISSN1 ISSN2 Journal_Name_1 Impact_Factor

第二个表有列

ISSN3 ISSN4 ISSN5 Journal_Name_2 Citations

期刊名称因数据源而异,任何期刊都可能有 0 个或多个 ISSN 号。我想做的是创建一个带有列的新表

ISSN1 ISSN2 ISSN3 ISSN4 ISSN5 Journal_name_1 Journal_Name_2 Impact_factor Citations

包括表 1 或表 2 中列出的所有期刊,如果条件满足,则将第一个表中的一行与第二个表中的一行合并

( Journal_Name_1 = Journal_Name_2 ) OR ( at least one of ISSN1 or ISSN2 is equal to at least one of ISSN3, ISSN4, ISSN5)

创造这种结果的最有效方法是什么?

(目前数据在 CSV 文件中,我可以使用 sqlite/mysql/postgresql/任何其他 DBMS)

4

1 回答 1

1

用于播放的SQL Fiddle 。

select t1.*, t2.*
from t1
left join t2 on (journal_name1 = journal_name2)
                or (issn1 in (issn3, issn4, issn5))
                or (issn2 in (issn3, issn4, issn5))
union all
select t1.*, t2.*
from t1
right join t2 on (journal_name1 = journal_name2)
                 or (issn1 in (issn3, issn4, issn5))
                 or (issn2 in (issn3, issn4, issn5));
于 2012-11-23T23:32:18.957 回答