股市泡沫

第三媒体软件中心使用与技巧工具教程 → 如何用百度大脑文字识别技术,快速集成实用小工具 TTL

如何用百度大脑文字识别技术,快速集成实用小工具

上传:gyj333     来源:炒股配资 存储服务     日期:2019-12-11

[摘要]  
   本文介绍了基于百度AI的云猫OCR软件相关功能、性能评价及核心代码解读。因篇幅较长大家可以直接检索所需炒股配资 参考
 
[正文]    

   一、 总体概述

股市泡沫  本文介绍了基于百度AI的云猫OCR软件相关功能、性能评价及核心代码解读。因篇幅较长大家可以直接检索所需炒股配资 参考。

  本文主要介绍了由本人开发的、基于百度AI的云猫OCR软件的主要功能,性能评价及核心代码解读。因为是几个帖子合并成一个,所以篇幅较长,希望各位能耐心看完,当然也可以各取所需。

  本文主要分为以下几个部分:

  第一部分是云猫OCR软件介绍。 由开发者本人亲自介绍软件的主要功能。对标ABBYY等OCR软件,云猫OCR的功能更全面,使用更简单,关键的是云猫OCR目前是完全免费给大家用的。当然因为是试用版,可能存在一些bug,大家使用的时候不要乱按就行。

股市泡沫  第二部分是云猫OCR基于百度OCR的具体实现方式说明。 同时也会对软件的部分核心代码进行展示,便于大家进行参考做出更有创意的产品。

股市泡沫  第三部分是云猫OCR使用说明及效果评测。 但因为云猫OCR是2017年底左右开发的,所以用的不是百度OCR最新接口功能,如果云猫能得到大家的支持,我可以考虑开发新版接入股市价值 百度最新的AI接口,希望大家能多多捧场。

股市泡沫  本文的最后部分是附录,附上了我基于百度OCR进行开发的代码解读,使用的是最新的百度手写体识别接口,也一并打包给大家参考。

  第一部分 云猫OCR的软件介绍

股市泡沫  一、云猫OCR简介

  云猫OCR是基于百度云OCR算法,由进击的狐狸进行开发的一款软件。本软件由C#语言进行开发,运行在Windows平台上。主要调用的接口是通用文字识别、通用文字识别(高精度)和表格识别等。

  二、云猫OCR目前实现的主要功能:

  1.批量图片文字识别,可以预览图片,可以对识别结果进行自动换行和缩进,可以控制QPS并发(QPS功能因为百度云的timeout问题而暂时搁置);

  2.批量表格图片识别,支持自动打开识别结果,用户也可以选择直接打开保存目录;

  3.PDF转图片,在我的(配置为I7处理器/8G/128G SSD)的硬件环境下,PDF转图片程序模块占用的内存不超过400M,同时可以在2分钟左右的时间内转换超过500页内容的PDF文件。支持一键打开转换结果文件夹。

股市泡沫  4.云猫软件支持换肤功能,目前有两套皮肤;

  5.可以设置API Key和Secret Key;

  6.支持中途停止识别;

  7.支持把设置改变后对同一张图片进行重新识别;

股市泡沫  8.支持多种语言;

  9.其他功能,比如识别统计炒股配资 、控制字体大小、右键把识别结果另存为rtf文件、全选和复制识别结果等等;

  三、演示帖子链接

股市泡沫  http://ai.baidu.com/forum/topic/show/492371

  四、云猫OCR演示视频链接

  https://v.qq.com/x/page/r0564n4a87e.html

股市泡沫  第二部分 云猫OCR基于百度OCR的具体实现方式说明

  一、概述

  云猫OCR是基于百度AI,在Windows平台运行的一款软件。我是用C#语言在Visual Studio2017集成股市泡沫开发环境中进行开发的,开发方式是SDK包开发。在开发中,我们需要参考百度的技术文档。

  百度云文字识别技术文档地址:

股市泡沫  https://cloud.baidu.com/doc/OCR/index.html

如何用百度大脑文字识别技术快速集成实用小工具

  二、准备工作

  首先,我们需要下载最新的百度文字识别的SDK包。

  C# SDK包的下载地址:http://ai.baidu.com/sdk#ocr

如何用百度大脑文字识别技术快速集成实用小工具

股市泡沫  下载完毕后解压缩,最新的包在文件夹net45里面。

如何用百度大脑文字识别技术快速集成实用小工具

  打开Visual Studio2017开发环境,选择新建项目,因为我打算用控制台项目讲解,因此要选择新建项目——C#控制台项目。建好项目之后,需要在项目中引用上面下载的SDK包。

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

  三、 核心代码讲解

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

  注意,具体开发的时候要把上面的API Key和Secret Key分别改为你自己的,另外不要忘了把图片文件路径改为你自己的图片路径。下面是识别的结果示例:

如何用百度大脑文字识别技术快速集成实用小工具

  原图如下:

如何用百度大脑文字识别技术快速集成实用小工具

  (二)解析Json格式,把识别结果转变为更为直观的文本类型

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

  程序运行结果如下:

如何用百度大脑文字识别技术快速集成实用小工具

  这样就比较符合人类的阅读习惯了,上面这段代码也是核心的基础代码,可以通过这些核心的代码去做一些优化,比如自动换行、自动缩进、根据语言习惯自动改变标点符号等等。

  (三)表格识别

  百度的表格文字识别的编程较为麻烦,主要分成两步:第一步是提交表格文字识别请求,获得requestId;第二步是根据requestId获取表格文字识别股市泡沫的结果,默认是Excel文件格式,Json结果会返回一段下载地址。

股市泡沫  我的程序除了上面这两步以外,还添加了自动下载Excel文件到本地电脑的代码,供各位参考。另外要注意的是,提交识别请求和获得识别结果这两步之间,程序必须设置延时,否则不能获得下载的URL 。经过实际测试,延时为3秒以上较为合适,3秒以下可能会出错。

  代码如下:

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

  作者使用的测试用图片:

如何用百度大脑文字识别技术快速集成实用小工具

  表格文字识别结果截图:

如何用百度大脑文字识别技术快速集成实用小工具

股市泡沫  第三部分 云猫OCR的使用说明及效果评测

  一、概述

  笔者是在2017年接触百度云服务平台的,在这里我也称之为百度AI 。笔者根据百度AI提供的函数接口,自行编程实现了一款OCR软件——云猫OCR。云猫OCR大部分的代码开发是在2017年底前完成的,之所以雪藏到现在,是因为笔者的一些私人事务(小孩出生等)——我是利用业余时间进行软件开发的,所以中断了大概一年多的时间,现在才有空继续这个项目。

股市泡沫  评测篇的原帖子地址:

股市泡沫  http://ai.baidu.com/forum/topic/show/955989

股市泡沫  二、评测的具体内容

  (一)准备工作

股市泡沫  在使用云猫OCR之前,我们必须先去百度云官网进行注册账号,有了账号以后,我们还要去具体的云服务项目下申请API Key和Secret Key ,一般这两个Key是用户各人保管的,不能随便透露给外人。因为百度云现在已经正式收费,而用户每人每天的免费调用次数都是有限的,提高限额需要支付费用,用户使用百度云AI接口的依据主要就是这两个Key,所以我们要保管好。下面是简单的准备工作图片说明:

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

股市泡沫  (二)正式使用云猫OCR

  用户有了百度云API Key和Secret Key之后,就可以正式使用云猫OCR了。具体使用步骤如下:

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

股市泡沫  (三)评测的具体内容

  首先介绍一下云猫OCR调用的百度AI的主要接口,首先是通用文字识别(带位置版),其次是通用文字识别(带位置高精度版),最后是表格文字识别,下面依次介绍这三种识别。

  1. 通用文字识别(带位置版)和通用文字识别(带位置高精度版)的混合使用

如何用百度大脑文字识别技术快速集成实用小工具

  如上图所示,用户可以选择多种语言(包括德语、法语、西班牙语等等),选择好后点击文字识别即可。因为百度云提供的高精度文字识别接口只支持中英文,而通用的文字识别支持除中英文以外的多种语言,所以笔者在编写软件中,这两种接口是混合使用的,具体怎么混合使用请看代码篇。一般情况下,高精度的文字识别股市泡沫效果比通用的好,但也比较耗时。

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

  本软件支持识别的文字结果在本机保存为文件,具体如下图操作:

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

股市泡沫  保存的文件是rtf格式,可以用WPS或者Office Word打开。下面再给出一次性识别20张图片的统计结果图示:

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

  从上图可以看出,百度云的文字识别结果速度还是不错的,识别速度是平均大概2-3秒一张图。

  2. 表格文字识别

  表格文字识别股市泡沫的主要步骤如下图所示:

如何用百度大脑文字识别技术快速集成实用小工具

股市泡沫  识别的结果软件会自动保存为Excel文件并打开,如图:

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

  从上图可以看出,表格文字识别的速度比普通文字识别要慢一些,大概需要5-6秒。

  评测总结:百度OCR对于印刷体的识别还是不错的,比起以前的OCR软件来说,百度OCR可以说是革命性的进步。当然,它也有自己的短板。比如手写体的识别,笔者还没有评测,但百度云通用文字高精度接口对手写体的识别是较差的。再比如QPS并发,我的理解是可以提高OCR文字识别的速度,对于大量的图片文字识别来说尤其是重要,可以节省大量时间。但遗憾的是,百度云对并发好像做的不太好,程序不一定支持QPS并发,这个缺点我们也是希望百度后面能够有所改正。

  附录:

股市泡沫  C#编程实现手写识别

  一、概述

  本人是用C#编程,调用百度API接口实现手写体识别的,参考了百度的产品文档。

股市泡沫  文档地址:https://cloud.baidu.com/doc/OCR/index.html

  二、代码及解说

  本人的源代码大部分是来自百度的产品文档,但其中也遇到了一些麻烦。比如文字识别股市泡沫的编码问题,百度的代码给出的编码是Default,但在我的机器上这样做会显示乱码。经过查找资料,我把编码改成UTF8,乱码的问题才得到解决。

  作者的所有源代码如下:

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具

如何用百度大脑文字识别技术快速集成实用小工具


股市泡沫  注意,上面的代码中需要各位改成自己的Akey和Skey,另外要改一下图片路径。如果返回的是乱码,还需要改一下编码。

  识别的结果如下:

如何用百度大脑文字识别技术快速集成实用小工具


  程序用的图片文件如下:

如何用百度大脑文字识别技术快速集成实用小工具

   (期货配资 稿 2019-12-13)


频道股票配资 】【 评论 】 【 打印 】 【 字体:
   上一篇:文件误删除如何恢复? 办公文件丢失恢复技巧!
   下一篇:
导航: | | | | | 订阅 
 Advertisement
 十大最受关注的期货配资
1  
2  
3  
4  
5  
6  
7  
8  
9  
10  
 十大热门驱动/软件下载
1  [手机驱动]手机usb万能
2  [热门常用软件]QQ2008正式版下载【腾讯QQ2008官方版Beta1】
3  [热门常用软件]E话通下载【E话通4.5 正式版】
4  [手机驱动]Samsung三星 手机USB驱动1.0版For Win98SE/ME/...
5  [手机驱动]Microsoft微软 ActiveSync同步软件4.5中文版Fo...
6  [摄像头驱动]万能摄像头 FOR Windows
7  [热门常用软件]皮皮播放器下载【PPFilm皮皮播放器 2.1.0....
8  [手机驱动]诺基亚 PC套件下载
9  [热门常用软件]面对面游戏下载【面对面视频游戏大厅】
10  [手机驱动]Microsoft微软 Windows Mobile Device Center ...
 十大最受关注的品牌
1  (SAMSUNG)
2  (NOKIA)
3  (ASUS)
4  (MOTOROLA)
5  (Intel)
6  (ASUS)
7  (LG)
8  (Sony Ericsson)
9  (lenovo)
10  (acer)
 十大热门常用软件下载
1  QQ2008正式版下载【腾讯QQ2008官方版Beta1】
2  E话通下载【E话通4.5 正式版】
3  皮皮播放器下载【PPFilm皮皮播放器 2.1.0.2版】
4  面对面游戏下载【面对面视频游戏大厅】
5  DVD解码器下载【NVIDIA DVD Decoder 1.02】
6  迅雷5下载【迅雷5.8.1.507官方版】
7  QQ2007 II正式版下载【腾讯QQ2007官方版本】
8  QQ2006正式版下载【腾讯QQ2006官方版本】
9  联众世界游戏大厅下载【联众世界2.7.0.8官方版】
10  MTV下载器【MTV下载精灵 8.31版】
11  pplive最新版下载【PPLive网络电视V1.9.35版】
12  迅雷(Thunder)下载【迅雷v5.7.12.493官方版】
13  腾讯QQ2008下载【腾讯QQ官方版2008极速贺岁版KB1】
14  Total Video Converter下载【Total Video Converter v3.1...
15  QQ拼音输入法下载【腾讯QQQQ拼音输入法V1.4.1版】
16  皮皮高清影视播放器下载【PIPIPlayer 2.7.0.3版】
17  eMule下载【电驴eMule官方v0.49a正式版】
18  极点五笔输入法下载【极点五笔6.1标准版】
19  QQ2009正式版下载【腾讯QQ2009 SP4官方版】
20  Vagaa哇嘎画时代版下载【哇嘎 2.6.5.10】

股市泡沫相关的文章

股市价值 检索

其他

系列