有什么方法可以提取各种excel公式的底层元数据。我正在使用 excel 公式在 C# 中构建这个框架,并且有兴趣了解每个公式的输入参数、它们的数据类型和返回类型。这将帮助我根据所提供的元数据构建一个向导屏幕。
在此先感谢您的帮助。
基于@ja72 的建议,很容易从他提到的链接中解析数据。我不太擅长 C#,所以这里有一个 vb.net 代码,您可以将其转换为 C#
话虽如此,您可以通过多种方式从 C# 中查看此问题
方式 1
在运行时导航到 URL 并使用以下代码解析值。
缺点:
1)您必须有互联网连接
2)这个过程很慢
方式 2
创建一个单独的程序以导航到 URL 并使用以下代码解析值。使用以下代码生成文本文件或 csv 文件的输出并将文件嵌入到您的资源中,以便您可以随时使用它
我会建议方式2,但最终决定权在你。:)
代码
Public Class Form1
Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
TextBox1.Clear()
GetFormulas()
MessageBox.Show ("Done!")
End Sub
Sub GetFormulas()
Dim wc As New Net.WebClient
'~~> first get links
Dim mainPage As String = wc.DownloadString("http://office.microsoft.com/client/helppreview.aspx?AssetId=HV805551279990&lcid=1033&NS=EXCEL.DEV&Version=12&pid=CH080555125")
Dim doc As mshtml.IHTMLDocument2 = New mshtml.HTMLDocument
doc.write (mainPage)
doc.close()
Dim table As mshtml.IHTMLElement = DirectCast(doc.getElementById("vstable"), mshtml.IHTMLElement2).getElementsByTagName("table")(0)
Dim links As mshtml.IHTMLElementCollection = table.getElementsByTagName("A")
For Each link In links
Dim childPage As String = wc.DownloadString(link.getAttribute("href"))
Dim doc2 As mshtml.IHTMLDocument2 = New mshtml.HTMLDocument
doc2.write (childPage)
doc2.close()
Dim div2 As mshtml.IHTMLElement2 = doc2.getElementById("m_article")
For Each elem As mshtml.IHTMLElement In div2.getElementsByTagName("P")
If elem.getAttribute("className") = "signature" Then
Dim formulaString As String = elem.innerText
TextBox1.AppendText (link.innerText & vbTab & formulaString & vbCrLf)
End If
Next
Next
End Sub
End Class
快照
注意:以上只是如何抓取 ja72 提供的上述链接的示例。如果您打算使用任何其他链接,则必须相应地更改代码。另请注意,上述链接中提到的公式适用于 Excel 2007 及更高版本。对于 Excel 2003,您将不得不进入另一个链接。我没有STOP
在上面的例子中包含一个按钮,所以一旦程序开始运行,它就无法停止,直到它完成。我相信您可以再添加一个按钮来终止提取。
所有功劳归功于@SiddharthRout。这是 Sid 发布的代码的 C# 转换
使用 C# 时,您确实必须处理大量的转换和转换。但这就是 C# 的工作方式:P
using System;
using System.Windows.Forms;
Namespace WindowsFormsApplication1
{
public partial class Form1 : Form
{
Public Form1()
{
InitializeComponent();
}
private void button1_Click(object sender, EventArgs e)
{
textBox1.Clear();
GetFormulas();
MessageBox.Show("Done!");
}
public void GetFormulas()
{
mshtml.HTMLDocument doc = NewHtmlDoc("http://office.microsoft.com/client/helppreview.aspx?AssetId=HV805551279990&lcid=1033&NS=EXCEL.DEV&Version=12&pid=CH080555125");
mshtml.IHTMLElement2 table = (mshtml.IHTMLElement2)(mshtml.IHTMLElement2)((mshtml.IHTMLElement2)doc.getElementById("vstable")).getElementsByTagName("table").item(null, 0);
mshtml.IHTMLElementCollection links = table.getElementsByTagName("A");
foreach (mshtml.IHTMLElement link in links)
{
mshtml.HTMLDocument doc2 = NewHtmlDoc(link.getAttribute("href",0).ToString());
mshtml.IHTMLElement div2 = doc2.getElementById("m_article");
foreach (mshtml.IHTMLElement elem in ((mshtml.IHTMLElement2)div2).getElementsByTagName("P"))
{
if (elem.getAttribute("className",0) != null && elem.getAttribute("className",0).ToString() == "signature")
{
string formulaString = elem.innerText;
textBox1.AppendText(link.innerText + "\t\t" + formulaString + "\n");
}
}
}
}
private mshtml.HTMLDocument NewHtmlDoc(string url)
{
System.Net.WebClient wc = new System.Net.WebClient();
string page = wc.DownloadString(url);
mshtml.IHTMLDocument2 doc = (mshtml.IHTMLDocument2)(new mshtml.HTMLDocument());
doc.write(page);
doc.close();
return (mshtml.HTMLDocument)doc;
}
}
}