4

我正在使用一些代表文件系统的表,我需要选择每个文件夹的完整路径作为扁平字符串。

第一个表列出了每个文件夹的详细信息:

CREATE TABLE Folders(
    FolderID int IDENTITY(1,1) NOT NULL,
    [Name] nvarchar(255) NOT NULL)

第二个表列出了文件夹关系的传递闭包:

CREATE TABLE FolderClosures(
    FolderClosuresID int IDENTITY(1,1) NOT NULL,
    AncestorFolderID int NOT NULL, --Foreign key to Folders.FolderID
    DescendantFolderID int NOT NULL --Foreign key to Folders.FolderID
    IsDirect bit NOT NULL)

对于示例数据,假设存在以下文件夹:

Documents/
Documents/Finance/
Documents/HumanResources/
Documents/HumanResources/Training/

这些将保留在这些表中,如下所示:

| FolderID | Name           |
+----------+----------------+
|        1 | Documents      |
|        2 | Finance        |
|        3 | HumanResources |
|        4 | Training       |

| FolderClosureID | AncestorFolderID | DescendantFolderID | IsDirect |
+-----------------+------------------+--------------------+----------+
|               1 |                1 |                  1 |        0 |
|               2 |                2 |                  2 |        0 |
|               3 |                1 |                  2 |        1 |
|               4 |                3 |                  3 |        0 |
|               5 |                1 |                  3 |        1 |
|               6 |                4 |                  4 |        0 |
|               7 |                1 |                  4 |        0 |
|               8 |                3 |                  4 |        1 |

一些需要注意的细节:

  1. 每个文件夹在 中都有一个“身份行” FolderClosures,其中AncestorFolderID = DescendantFolderID AND IsDirect = 0.

  2. 每个不是顶级文件夹的文件夹在FolderClosureswhere 中都只有一行IsDirect = 1

  3. FolderClosures每个文件夹可以包含许多行,其中AncestorFolderID <> DescendantFolderID AND IsDirect = 0. 这些中的每一个都代表“祖父母”或更远的关系。

  4. 由于没有列可以为空,因此没有行明确声明给定文件夹是顶级文件夹。这只能通过检查有问题的文件夹的 ID在FolderClosures哪里没有行来辨别。IsDirect = 1 AND DescendantFolderID = SomeIDSomeID

我希望能够运行返回此数据的查询:

| FolderID | Path                               |
+----------+------------------------------------+
|        1 | Documents/                         |
|        2 | Documents/Finance/                 |
|        3 | Documents/HumanResources/          |
|        4 | Documents/HumanResources/Training/ |

文件夹可以无限嵌套,但实际上可能最多只有 10 层。查询可能需要返回几千个文件夹的路径。

当数据作为邻接列表持久存在时,我发现了很多关于创建此类查询的建议,但我无法找到像这样的传递闭包设置的答案。我发现的邻接列表解决方案依赖于使用可为空的父文件夹 ID 持久化的行,但这在这里不起作用。

如何获得所需的输出?

如果有帮助,我正在使用 SQL Server 2016。

4

1 回答 1

2

获得所需输出的一种方法是进行递归查询。为此,我认为最好的方法是仅使用具有IsDirect = 1并使用锚点的行作为所有没有直接父级的文件夹 in FolderClosures,这应该是您的所有根文件夹。

WITH FoldersCTE AS (
    SELECT  F.FolderID, CAST(F.Name as NVARCHAR(max)) Path
    FROM    Folders F
    WHERE   NOT EXISTS (
        SELECT 1 FROM FolderClosures FC WHERE FC.IsDirect = 1 AND FC.DescendantFolderID = F.FolderID
    )
    UNION ALL
    SELECT  F.FolderID, CONCAT(PF.Path, '\', F.Name)
    FROM    FoldersCTE PF
            INNER JOIN FolderClosures FC
                ON  FC.AncestorFolderID = PF.FolderId
                AND FC.IsDirect = 1
            INNER JOIN Folders F
                ON F.FolderID = FC.DescendantFolderID
)
SELECT * 
FROM    FoldersCTE  
OPTION (MAXRECURSION 1000) --> how many nested levels you think you will have

这会产生:

FolderID    Path
1           Documents
2           Documents\Finance
3           Documents\HumanResources
4           Documents\HumanResources\Training

希望能帮助到你。

于 2017-08-16T16:41:32.930 回答