没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:莫成敏|2020-06-09 15:46:43.447|阅读 424 次
概述:借助LEAD强大的OCR库,开发人员能够轻松制作自动化的OCR解决方案,并仅用五行代码即可将这些图像转换为可搜索的PDF转换。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
相关链接:
如今,在每个地方,几乎每个人都在使用PDF。在大多数组织中,PDF文档对于业务应用程序和工作流程至关重要。由于文件格式的可移植性和多功能性,许多行业,例如保险代理机构、金融机构和法律实践,已将其文档管理系统标准化为PDF格式。
这些PDF的使用方式取决于所处理PDF的类型。PDF有两种主要类型:图像和可搜索。例如,如果您使用文字处理器保存PDF,则很可能是可搜索的PDF,您可以根据需要复制/粘贴文档中的文本。另一方面,如果您使用扫描仪将纸张转换为PDF,则很可能是图像PDF,并且您将无法搜索文本。
即使您使用扫描仪来创建图像PDF或由其他人发送了图像PDF,仍然可以通过某种方式使它可搜索。这是通过OCR发生的,OCD是LEADTOOLS最擅长的!借助LEAD强大的OCR库,开发人员能够轻松制作自动化的OCR解决方案,并仅用五行代码即可将这些图像转换为可搜索的PDF转换。这些解决方案可以节省人员和公司两个最宝贵的资源:时间和金钱。
LEAD强大的OCR库包括这些产品:LEADTOOLS Recognition Imaging Developer Toolkit、LEADTOOLS Document Imaging Suite、LEADTOOLS OCR Module - LEAD Engine、LEADTOOLS OCR Module - OmniPage Engine、LEADTOOLS ICR Module - OmniPage Engine。
以下代码向您展示了创建将图像转换为可搜索的PDF的解决方案所需的全部内容。如果您需要完整的分步教程,请查看我们的“使用OCR将图像转换为可搜索PDF教程”。(如文章后面内容)
static void OCR(string inputFile, string outputFile) { using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD, false)) { //Startup the LEADTOOLS OCR Engine ocrEngine.Startup(null, null, null, null); //Run the AutoRecognizeManager and specify PDF format ocrEngine.AutoRecognizeManager.Run(inputFile, outputFile, DocumentFormat.Pdf, null, null); Console.WriteLine($"OCR output saved to {outputFile}"); } }
使用OCR将图像转换为可搜索的PDF-控制台C#
本教程说明如何创建一个C#Windows控制台应用程序,该应用程序设置LEAD OCR引擎以处理OCR。
创建项目并添加LEADTOOLS参考
在Visual Studio中,创建一个新的C#Windows Console项目,并添加以下必要的LEADTOOLS引用。
所需的参考取决于项目的目的。引用可以通过以下两种方法中的一种或另一种添加(但不能同时添加)。对于此项目,需要以下参考:
如果使用NuGet引用,则本教程需要以下NuGet软件包:
如果使用本地DLL引用,则需要以下DLL:
本地DLL安装在<INSTALL_DIR>\LEADTOOLS 20\Bin\Dotnet4\x64:
设置许可证文件
许可证可解锁项目所需的功能。必须在调用任何工具包功能之前进行设置。
有两种类型的运行时许可证:
添加OCR代码
创建项目,添加参考和许可证集后,即可开始编码。
在解决方案资源管理器中,打开Program.cs。要初始化和运行OCR引擎,请添加一个新OCR(string inputFile, string outputFile)方法并在Main方法内部调用它。
将以下语句添加到Program.cs顶部的using块中:
C#
// Using block at the top using System; using Leadtools; using Leadtools.Document.Writer; using Leadtools.Ocr;
C#
static void OCR(string inputFile, string outputFile) { using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD, false)) { //Startup the LEADTOOLS OCR Engine ocrEngine.Startup(null, null, null, null); //Run the AutoRecognizeManager and specify PDF format ocrEngine.AutoRecognizeManager.Run(inputFile, outputFile, DocumentFormat.Pdf, null, null); Console.WriteLine($"OCR output saved to {outputFile}"); } }
C#
static void Main(string[] args) { SetLicense(); string input = @"C:\Users\Public\Documents\LEADTOOLS Images\OCR1.TIF"; string output = @"C:\Users\Public\Documents\LEADTOOLS Images\OCR1.PDF"; OCR(input, output); }
运行项目
按F5或选择Debug- > Start Debugging运行项目。
如果正确执行了这些步骤,则会出现控制台并确认许可证设置正确,然后应用程序将OCR1.TIF图像转换为PDF格式,并将其保存到指定位置(作为可搜索的PDF)。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@wqylolg.cn
文章转载自:LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
LEADTOOLS Medical Imaging是一款医疗成像控件,包含了一些精心挑选的、经过优化的特性,可以满足医疗成像应用程序开发的特殊需要。
在线协同文档编辑器ONLYOFFICE现已支持阿里通义千问( Qwen),带来先进的 AI 功能,实现更智能的文档编辑。本指南将向您展示如何将 Qwen 连接到 ONLYOFFICE,并充分利用其功能。
需要从 PDF 文档中删除特定页面?本快速指南将向您展示如何仅用几行代码删除不需要的页面。
本教程将向您展示如何用MyEclipse开发EJB 3无状态会话Bean,欢迎下载最新版IDE体验!
DHTMLX 产品支持构建功能丰富的预订系统,从而简化针对不同行业的预约安排。Scheduler 组件丰富的功能(可自定义的日历视图、重复事件等)与 Booking 小部件现成的预订管理 UI 相结合,满足您构建现代化 Web 预订解决方案所需。
20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…
LEADTOOLS Document Suite Developer ToolkitLEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
LEADTOOLS Document Imaging Developer Toolkit多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。
LEADTOOLS Medical Developer ToolkitLEADTOOLS Medical Imaging是一款医疗成像控件,包含了一些精心挑选的、经过优化的特性,可以满足医疗成像应用程序开发的特殊需要。
LEADTOOLS Medical Imaging Suite Developer ToolkitLEADTOOLS Medical Imaging Suite帮您开发功能强大的PACS和医学成像应用程序
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@wqylolg.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢