在 SSIS 范围内使用 IronPython 的最简单的机制(至少在我的大脑中)是调用外部进程并转储到文件,然后将其用作数据流的源。
也就是说,我能够从 C# 托管 IronPython 应用程序并使用返回的数据来填充输出缓冲区并与管道中的数据进行交互。我只有一台机器可以执行此操作,所以我列出了我记得做的所有事情,直到包裹变绿为止。
先决条件
这篇文章让我了解了如何完成这项工作。在 C# 4.0 程序中托管 IronPython 我强烈建议您创建一个 C#/VB.NET 控制台应用程序并首先让您的 IronPython 集成在那里工作,因为 SSIS 将为所有内容添加一个额外的层。
可能有能力在 C# 中托管旧版本的 IronPython,而不需要 4.0 框架,但这远远超出了我的能力范围。我可以说的是,要使用 4.0 框架,您正在查看 SQL Server 2012。2008 包可以针对 3.5 框架(默认为 2.0)。
全局程序集缓存,简称 GAC。它是 Windows 中可以存放已签名程序集的特殊位置。SSIS 可能能够使用 GAC 中没有的程序集,但我没有运气这样做。这个案子也不例外。我的控制台应用程序运行良好,但是当我将该代码复制到 SSIS 时,它会Could not load file or assembly 'Microsoft.Scripting...
出现错误消息。幸运的是,IronPython-2.7.2.1(可能还有以前的版本)是强签名的 dll。这意味着您可以而且必须将它们添加到 GAC 中。
在您的 Visual Studio 目录中,查找 Visual Studio 命令提示符 (2010)。假设您的 IronPython 安装文件夹是C:\tmp\IronPython-2.7.2.1\IronPython-2.7.2.1
您将键入cd C:\tmp\IronPython-2.7.2.1\IronPython-2.7.2.1
然后我注册了以下 3 个程序集
C:\tmp\IronPython-2.7.2.1\IronPython-2.7.2.1>gacutil -if Microsoft.Dynamic.dll
Microsoft (R) .NET Global Assembly Cache Utility. Version 4.0.30319.1
Copyright (c) Microsoft Corporation. All rights reserved.
Assembly successfully added to the cache
C:\tmp\IronPython-2.7.2.1\IronPython-2.7.2.1>gacutil -if IronPython.dll
Microsoft (R) .NET Global Assembly Cache Utility. Version 4.0.30319.1
Copyright (c) Microsoft Corporation. All rights reserved.
Assembly successfully added to the cache
C:\tmp\IronPython-2.7.2.1\IronPython-2.7.2.1>gacutil -if Microsoft.Scripting.dll
Microsoft (R) .NET Global Assembly Cache Utility. Version 4.0.30319.1
Copyright (c) Microsoft Corporation. All rights reserved.
Assembly successfully added to the cache
我的 SSIS 项目,我已将 Run64bitRuntime 设置为 False,但在重新测试时,没关系。默认为 True ,这似乎工作正常。
Python 脚本 - 我没有足够的背景来使 C# 和 .NET DLR 语言之间的集成更加优雅。提供一个字符串或包含我想要执行的脚本的东西会很好,也许这就是脚本块的内容,但我没有时间调查。因此,此解决方案需要一个脚本文件位于磁盘的某个位置。我在使用托管脚本进行导入时遇到了麻烦(没有名为 X 异常的模块)。毫无疑问,类路径和所有需要提供给主机以使其正常工作的东西都有一些魔力。顺便说一句,这可能是一个不同的 SO 问题。
设置
我有一个文件位于 C:\ssisdata\simplePy.py
# could not get a simple import to work from hosted
# works fine from "not hosted"
#import os
def GetIPData():
#os.listdir(r'C:\\')
return range(0,100)
将脚本任务添加到数据流后,我将其配置为在输出缓冲区(wstr 1000)上有一个列。然后我用它作为我的源代码。
using System;
using System.Collections.Generic;
using System.Data;
using Microsoft.SqlServer.Dts.Pipeline.Wrapper;
using Microsoft.SqlServer.Dts.Runtime.Wrapper;
using IronPython.Hosting;
using Microsoft.Scripting.Hosting;
/// <summary>
/// Attempt to use IP script as a source
/// http://blogs.msdn.com/b/charlie/archive/2009/10/25/hosting-ironpython-in-a-c-4-0-program.aspx
/// </summary>
[Microsoft.SqlServer.Dts.Pipeline.SSISScriptComponentEntryPointAttribute]
public class ScriptMain : UserComponent
{
/// <summary>
/// Create data rows and fill those buckets
/// </summary>
public override void CreateNewOutputRows()
{
foreach (var item in this.GetData())
{
Output0Buffer.AddRow();
Output0Buffer.Content = item;
}
}
/// <summary>
/// I've written plenty of code, but I'm quite certain this is some of the ugliest.
/// There certainly must be more graceful means of
/// * feeding your source code to the ironpython run-time than a file
/// * processing the output of the code the method call
/// * sucking less at life
/// </summary>
/// <returns>A list of strings</returns>
public List<string> GetData()
{
List<string> output = null;
var ipy = Python.CreateRuntime();
dynamic test = ipy.UseFile(@"C:\ssisdata\simplePy.py");
output = new List<string>();
var pythonData = test.GetIPData();
foreach (var item in pythonData)
{
output.Add(item.ToString());
}
return output;
}
}
快速拍摄我的参考资料
点击运行按钮,大获成功