我使用 SSIS 和 [SharePointListAdapters][1] [1]: http://sqlsrvintegrationsrv.codeplex.com/releases 从我的 SharePoint 2010 列表中导入数据并将其放入 SQL Server 2008 表中。大约有 500 行数据。现在的挑战是适当地解析数据。我有几列周围有 html 标签。
例如,Column Project Desc 有类似 Project Desc 的数据
<div class="ExternalClass914BB5DA5CB142EB854C739EAACEE3BB">
<div>Import Data from SharePoint list to Database.
</div>
</div>
在谷歌搜索中,我发现了下面的功能。它按预期工作。我的问题是如何编辑此函数以将名为 Project Desc 的列名作为参数,以便该特定列中的所有数据都将丢弃 html 标记。
create function dbo.StripHTML( @text varchar(max) ) returns varchar(max) as
begin
declare @textXML xml
declare @result varchar(max)
set @textXML = @text;
with doc(contents) as
(
select chunks.chunk.query('.') from @textXML.nodes('/') as chunks(chunk)
)
select @result = contents.value('.', 'varchar(max)') from doc
return @result
end
go
select dbo.StripHTML('<div class="ExternalClassB1D90504EAFF42BE8A8056E686F4E195"> <div>Import Data from SharePoint list to Database.</div></div>')