7

我正在尝试使用 Microsoft.Office.Interop.Word 获取 C# 中 MS Word 窗口中显示的文本。请注意,这不是整个文档,甚至不是页面;与用户看到的内容相同。

以下代码似乎适用于简单文档:

Application word = new Application();
word.Visible = true;
object fileName = @"example.docx";
word.Documents.Add(ref fileName, Type.Missing, Type.Missing, true);

Rect rect = AutomationElement.FocusedElement.Current.BoundingRectangle;

Range r1 = word.ActiveWindow.RangeFromPoint((int)rect.Left, (int)rect.Top);
Range r2 = word.ActiveWindow.RangeFromPoint((int)rect.Left + (int)rect.Width, (int)rect.Top + (int)rect.Height);
r1.End = r2.Start;

Console.WriteLine(r1.Text.Replace("\r", "\r\n"));

但是,当文档包含其他结构(例如标题)时,仅返回部分文本。

那么,实现这一目标的正确方法是什么?

非常感谢!

更新代码

Rect rect = AutomationElement.FocusedElement.Current.BoundingRectangle;

foreach (Range r in word.ActiveDocument.StoryRanges) {
    int left = 0, top = 0, width = 0, height = 0;
    try {
        try {
            word.ActiveWindow.GetPoint(out left, out top, out width, out height, r);
        } catch {
            left = (int)rect.Left;
            top = (int)rect.Top;
            width = (int)rect.Width;
            height = (int)rect.Height;
        }
        Rect newRect = new Rect(left, top, width, height);
        Rect inter;
        if ((inter = Rect.Intersect(rect, newRect)) != Rect.Empty) {
            Range r1 = word.ActiveWindow.RangeFromPoint((int)inter.Left, (int)inter.Top);
            Range r2 = word.ActiveWindow.RangeFromPoint((int)inter.Right, (int)inter.Bottom);
            r.SetRange(r1.Start, r2.Start);

            Console.WriteLine(r.Text.Replace("\r", "\r\n"));
        }
    } catch { }
}
4

4 回答 4

4

这可能存在一些问题:

  • 它不可靠。你真的每次都能得到一致的结果吗?例如,在一个简单的“=rand()”文档上,在不改变 Word 状态的情况下,连续运行程序 5 次。当我这样做时,每次都会将不同的范围打印到控制台。我首先从这里开始:您获取范围的逻辑似乎有问题。例如, rect.Left 每次我对屏幕上单独存在的同一个文档执行它时都会返回不同的数字
  • 它与其他故事变得棘手。也许 RangeFromPoint 不能
    跨越多个故事边界。但是,让我们假设它确实如此。您仍然需要枚举每个故事,例如

enumerator = r1.StoryRanges.GetEnumerator(); { while (enumerator.MoveNext() { Range current = (Range) enumerator.Current; } }

您是否尝试过查看如何以编程方式提取 Office.Interop.Word.Document 对象的当前查看页面的文本

于 2012-06-30T15:29:14.710 回答
1

您可能会看到跨页面元素选择范围的副作用。
在大多数情况下,如果您将光标移动到屏幕的左上角,向下移动到屏幕的右下角,它只会选择主体文本(没有页眉或页脚)。此外,如果文档有列,并且这些列在屏幕之外开始或结束,那么当您从第一列中选​​择时,将选择直到最后一列的文本,即使它不在屏幕上。

据我所知,除非您愿意忽略不一致之处,或者想要专门处理所有用例(图像、列、表格等),否则没有简单的方法可以实现您的目标。

如果您可以告诉我们您正在尝试做什么,那么我们可以提供替代方案,否则请将答案标记为正确。

于 2012-06-30T15:46:39.540 回答
1

上面的讨论是针对 Office 版本的。

我认为我的代码适用于所有情况。

        IntPtr h = (IntPtr)Globals.ThisAddIn.Application.ActiveWindow.Hwnd;
        String strText = NativeInvoker.GetWindowText(h);
        if (strText != null && strText.StartsWith(Globals.ThisAddIn.Application.ActiveWindow.Caption))
        {
            h = NativeInvoker.FindWindowEx(h, IntPtr.Zero, "_WwF", "");
            h = NativeInvoker.FindWindowEx(h, IntPtr.Zero, "_WwB", null);
            h = NativeInvoker.FindWindowEx(h, IntPtr.Zero, "_WwG", null);

            Rect t;
            if (NativeInvoker.GetWindowRect(h, out t))
            {
                Range r1 = (Range)Globals.ThisAddIn.Application.ActiveWindow.RangeFromPoint((int)t.Left, (int)t.Top);
                Range r2 = (Range)Globals.ThisAddIn.Application.ActiveWindow.RangeFromPoint((int)t.Right, (int)t.Bottom);
                Range r = Globals.ThisAddIn.Application.ActiveDocument.Range(r1.Start, r2.Start);
                ....

您可以从anyware 中引用NativeInvoker 类的内容。

我希望我的代码对您的工作有所帮助。

蓬。

于 2016-04-28T09:45:50.757 回答
0

我的 Word 插件中有类似的要求。

试试下面的代码,它对我有用。

IntPtr h = Process.GetCurrentProcess().MainWindowHandle;

            h = NativeMethodsActiveScreen.FindWindowExW(h, new IntPtr(0), "_WwF", "");
            h = NativeMethodsActiveScreen.FindWindowExW(h, new IntPtr(0), "_WwB", null);
            h = NativeMethodsActiveScreen.FindWindowExW(h, new IntPtr(0), "_WwG", null);

            NativeMethodsActiveScreen.tagRECT t = new NativeMethodsActiveScreen.tagRECT();
            NativeMethodsActiveScreen.GetWindowRect(h, out t);

            var Aw = RibbonHelper.SharedApplicationInstance.ActiveWindow;
            Range fullDocRange = RibbonHelper.SharedApplicationInstance.ActiveDocument.Range();
            Range r1 = RibbonHelper.SharedApplicationInstance.ActiveWindow.RangeFromPoint(t.left, t.top);
            Range r2 = RibbonHelper.SharedApplicationInstance.ActiveWindow.RangeFromPoint(t.right, t.bottom);
            Range r = RibbonHelper.SharedApplicationInstance.ActiveDocument.Range(r1.Start, r2.Start);

如果有帮助,请将答案标记为有帮助。

谢谢

于 2020-07-22T13:14:58.807 回答