问题标签 [microsoft-ocr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
windows-phone-8.1 - Microsoft OCR Library
I have recently started to use the Microsoft OCR Library for loading text from images. And I have a question. Is it possible to automatically detect the language of the picture? Or I need set all possible languages by myself?
c# - 如何在 ASP.Net MVC4 Web API 项目中使用 Microsoft OCR 库 ( Microsoft.Windows.Ocr )?
TL;博士:
有谁知道在服务器端 ASP.Net Web 应用程序(如 MV4 Web API)上引用Microsoft.Windows.Ocr
(/ WindowsPreview.Media.Ocr.dll
)程序集的方法,并利用该程序集中的 OCR 功能将照片图像作为输入并从中提取文本内容它 ? 如果是,请在您的回答中提供详细说明。
问题详细信息(以及到目前为止我尝试过的内容)
我正在构建一个 Web 应用程序,该应用程序将图像上传到服务器(通过文件上传 UI 屏幕),然后使用OCR读取文本并在下一页上显示文本,就在上传的图像旁边。
由于大多数商业 OCR 库的成本都很高(我上次检查时超过 1,300 美元),我想我可以尝试使用免费的Microsoft OCR 库 Microsoft.Windows.Ocr
,而且看起来非常简单易用。
所以我尝试将Microsoft.Windows.Ocr Nuget 包安装到我的 ASP.Net MVC4 Web API 项目中,并且成功了。
之后,我查看了我的 MVC4 Web API 项目引用,令我惊讶的是,没有找到对Microsoft.Windows.Ocr.dll程序集的引用。
因此,我尝试通过浏览文件夹中的程序集来添加对 Microsoft.Windows.Ocr.dll 程序集的 x86 版本的引用,并从文件夹\packages
中选择WindowsPreview.Media.Ocr.dll\lib\win81\x86
注意:程序集名称是 WindowsPreview.Media.Ocr.dll 而不是 Microsoft.Windows.Ocr.dll ,不知道为什么!
当我这样做并单击OK时,我收到以下错误消息。
然后我从Nuget 页面发现“支持的平台”只有Windows Phone 8、Windows Phone 8.1、Windows 8.1(仅限 Windows Store 应用程序)。
但可以肯定的是,一定有办法在 ASP.Net 应用程序的服务器端使用这个OCR dll吗?
有谁知道在服务器端 ASP.Net Web 应用程序(如 MV4 Web API)上引用Microsoft.Windows.Ocr
(/ WindowsPreview.Media.Ocr.dll
)程序集的方法,并利用该程序集中的 OCR 功能将照片图像作为输入并从中提取文本内容它?**如果是,请在您的回答中提供详细说明。
任何“黑客”和/或示例代码将不胜感激!
谢谢!!
c# - Microsoft OCR:将位图转换为 Windows Phone 8 Silverlight 的像素阵列
我一直在寻找答案 2 天,但我不能。这就是为什么我把它贴在这里。我跟着这个教程。
我收到错误bitmap.SetSource(imgStream);
,所以我将其更改为bitmap.SetSource(imgStream.AsStream);
我在这条线上也收到了错误消息。我无法将像素转换为数组。因为没有PixelBuffer
,我不能使用Pixels
所以我在互联网上搜索并找到了stackoverflow.com的这个链接。所以我复制并粘贴了以下代码
接着 byte[] hello = ByteArrayChange.ToByteArray(bitmap);
App.Xaml.cs
我用 Device 运行代码,它给出了异常Application_UnhandledException
注意:我正在 Windows Phone 8/8.1 (Silverlight) 上开发
image-processing - 我在哪里可以获得用于 OCR(光学字符识别)的服务器端 api?
抱歉,如果这个问题很愚蠢或含糊不清,但我的任务是在实习期间在服务器端实现 ocr。我在哪里可以获得合适的 api 以将其与我公司的网站集成。我曾尝试使用 microsoft vision api,但不知道如何将其发送到服务器!我是IT领域的新手。因此,请帮助我提出您宝贵的建议。谢谢!
windows-runtime - 使用 OCR 引擎识别 Micr 字体?
我正在使用 Microsoft OCR 库来阅读文本。
Microsoft OCR 库完美运行。但是我想阅读链接http://www.ict4u.net/databases/database-images/micr.jpg中给出的以下字符列表。有没有一种方法可以训练 OCR 库读取以下字符,或者是否有一种语言可以读取以下字符。
text - 如何获得文本的颜色?
我一直在使用 Microsoft OCR API,我正在从图像中获取文本,但我想知道文本是特定颜色还是特定背景颜色。
例如,我有以下图片,我想知道是否有红色文字, 即图片
我以为这条线:
将帮助我建立我想从图像中接收的参数,所以如果我想知道一行文字中的颜色。所以我添加了这样的视觉功能:
但这并没有解决问题。
另外:我可以混合来自图像分析的 uriBase 链接和来自 OCR 的链接吗?
image - 如何将 base64 图像发送到 Microsoft-ocr api?
我正在尝试使用 Microsoft Azure OCR API 服务从图像中提取一些文本。
我用于发送到 API 服务的图像具有“data:image/png; base64,”结构,因此我无法使用内容类型“application/json”发送它。
我尝试使用内容类型“multipart/form-data”或“application/octet-stream”发送它,但它也失败了......
我对应该如何发送图像或是否应该进行一些转换感到有些困惑。
我应该使用哪种内容类型来执行正确的请求?我应该更改图像源的编码吗?如何?
谢谢你们!
c# - 使用 Microsoft OCR 获取扫描图像文本的坐标
试图在扫描的图像中找到文本的坐标。扫描的图像有很多文本数据,需要将图像数据转换为文本,然后得到文本的坐标。坐标表示边界框,例如X,Y轴,高度和宽度,其中文本是
使用 Microsoft OCR ProjectOxford Vision
预期输出: 获取具有各自坐标的文本(x,y,高度,宽度)
json输出
{“状态”:“成功”,“成功”:真,“失败”:假,“完成”:真,“识别结果”:[{“页面”:1,“顺时针方向”:359.62,“宽度”:505 ,“高度”:399,“单位”:“像素”,“线”:[{“boundingBox”:[224、58、380、57、381、74、225、75],“文本”:“政府印度”,“单词”:[ { “boundingBox”:[ 229, 59, 321, 58, 320, 75,229, 75 ], "text": "GOVERNMENT" }, { "boundingBox": [ 324, 58, 341, 58, 341, 75, 323, 75 ], "text": "OF" }, { "boundingBox" : [ 344, 58, 381, 58, 381, 75, 344, 75 ], "文本": "印度" } ] }, { "boundingBox": [ 211, 159, 429,160, 428, 180, 210, 178 ],“文本”:“FH faPet/出生日期:27/07/1982”,“单词”:[ { “boundingBox”:[ 225、160、243、160、243、179 , 225, 179 ], "text": "FH" }, { "boundingBox": [ 247, 160, 286, 160, 286, 179, 247, 179 ], "text": "faPet/" }, { "边界框”:[290、160、333、160、333、179、290、179],“文本”:“出生日期:”},{“边界框”:[337、160、428、162、428、180、337、179] , "text": "27/07/1982" } ] }, { "boundingBox": [ 209, 192, 313, 190, 314, 208, 210, 210 ], "text": "you / MALE", "字”:[ { "boundingBox": [ 214, 192, 247, 192, 246, 209, 214, 210 ], "text": "you" }, { "boundingBox": [ 254, 192, 260, 192, 260, 209 , 254, 209 ], "text": "/" }, { "boundingBox": [ 264, 192, 314, 192, 313, 208, 263, 209 ],"text": "MALE" } ] }, { "boundingBox": [ 201, 314, 351, 313, 352, 330, 202, 331 ], "text": "66 66 6666 6666", "words": [ { "boundingBox": [ 204, 315, 225, 314, 225, 330, 204, 331 ], "text": "66" }, { "boundingBox": [ 229, 314, 251, 314, 251, 330,229, 330 ], "text": "66" }, { "boundingBox": [ 255, 314, 301, 314, 301, 330, 255, 330 ], "text": "6666" }, { "boundingBox" : [ 307, 314, 352, 314, 351, 331, 306, 330 ], "文本": "6666" } ] } ] } ] }66" }, { "boundingBox": [ 255, 314, 301, 314, 301, 330, 255, 330 ], "text": "6666" }, { "boundingBox": [ 307, 314, 352, 314, 351, 331, 306, 330 ], "文本": "6666" } ] } ] } ] }66" }, { "boundingBox": [ 255, 314, 301, 314, 301, 330, 255, 330 ], "text": "6666" }, { "boundingBox": [ 307, 314, 352, 314, 351, 331, 306, 330 ], "文本": "6666" } ] } ] } ] }330, 255, 330 ], "text": "6666" }, { "boundingBox": [ 307, 314, 352, 314, 351, 331, 306, 330 ], "text": "6666" } ] } ] } ] }330, 255, 330 ], "text": "6666" }, { "boundingBox": [ 307, 314, 352, 314, 351, 331, 306, 330 ], "text": "6666" } ] } ] } ] }“文本”:“6666”} ] } ] } ] }“文本”:“6666”} ] } ] } ] }
angular - 使用 Angular 将本地图像的 POST 请求发送到 Microsoft OCR API
我有一个 Angular 应用程序,我想将本地图像从我的设备发送到 Microsoft OCR API,但我遇到了这个问题。
在 onUpload() 函数中,它看起来像这样
当我尝试记录“this.imgURL”时,它返回“data:image/png;base64,iVBORw0KGg.......”
我在这里测试了请求并选择了“application/octet-stream”,它说body应该是[Binary Image Data]
请求返回“400”
代码:“InvalidImageFormat” requestId:“1be37150-b8ea-4750-ad06-d12e76b3ac49”消息:“输入数据不是有效图像。”