上海网站建设

上海网站建设

咨询热线:(021)51698180


网站设计,平面设计

上海网站建设RSS订阅  RSS订阅  新浪微博  新浪微博  上海网站建设客服  客服  获取报价  获取报价

如何将图片文字转换为可编辑的文字

在工作中,我常常在想,要是能把纸上有用的文字快速输入到电脑中,不用打字录入便可以大大提高工作效率该有多好呀!随着科技的发展, 这个问题在不断的解决,例如,现在市场上的扫描仪就带有OCR软件,可以把扫描的文字转换到电脑中进行编辑。但是,对于我们平常人来说,大多数人都是即不想多花钱购买不常用的设备,又不想费力气打字录入,那我就给大家提供一个我刚刚发现的方法吧!现在数码相机很普遍,也很常用,我们就从这里下手吧。 
工具准备:
硬件:  电脑一台 数码相机   
软件:  word2003(其它的版本我没有实验)
               doPDF (百度可以搜索下载,是一款免费的PDF制作软件)
               AJViewer软件(在百度可以搜索下载,是一款免费的阅读器)
步骤:
1、在电脑中安装 doPDF和AJViewer
2、用数码相机把需要的文字拍下来(相机和照像水平就不多谈了。照片效果越好,可以大大缩小转换文字的误差率)
例如如何将图片文字转换为可编辑的文字1
3、在word中插入你用数码相机照的书上的文字(打开word——插入菜单——图片——来自文件——选择照片——插入)
4、在word中选择文件菜单——打印——在打印机选项中选择doPDF——确定——点击“浏览”选项——选择文件保存的位置和填写文件名称——保存——确定5、按照上面的步骤,电脑会自动打开AJViewer软件,若没有自动打开该软件,可以自己打开AJViewer软件,然后在AJViewer中打开刚刚转换的PDF文件。
6、选择AJViewer中的如何将图片文字转换为可编辑的文字2,然后在需要的文字部分拖动鼠标画出虚线。
7、点击发送到word按钮,就可以转换成word文件了。可以编辑了 。
第6、7步骤图片如下:
如何将图片文字转换为可编辑的文字3
要点提示:
1、照片一定要平整,最好对比强烈。( 最最关键的部分)
2、用doPDF生成PDF文件不只一种用法,你也可以选择其它更好、更便捷的方法,这里只提供我本此的实验软件。
3、如果熟练的使用我的方法,用不了一分钟就可以转出若干的文字,大大提高了工作效率。
4、切记:输出的文字一定要校对呀!
如何将图片文字转换为可编辑的文字4
 
 
其他方法:
 
方法一:
完全安装的Office2003的前提下,方法是:
第一步:转换文件格式。用ACDSee打开你的.jpg文件,单击界面上的“浏览器”按钮(或者双击当前图片都可以进入到浏览器界面),在打开的浏览器中,右键这个文件,在右键菜单中选择“工具/转换文件格式”;在转换文件格式对话框中,选择TIFF格式,两次下一步后,就开始转换,结果是将你当前的.jpg文件转换成了.tif文件。
第二步:将图片转换为文字。选择:开始/所有程序/Microsoft Office/Microsoft Office工具/Microsoft Office Document Imaging,打开这个工具后,菜单:文件/打开,找到你保存的那个.tif文件,打开它。然后选择菜单:工具/使用OCR识别文本;梢等一会儿,继续菜单:工具/将文本发送到Word。这样,这幅图片就到了Word中成了可以编辑的文字内容了。因为OCR识别并非百分之百成功,所以有些位置可能需要你进行手动修改。
(如果上述方法不行的话,就先把图片-->.BMP-->.TIF,这样就可以转了,已测试)
 
方法二:
采用OCR V7 .5文字识别软件
步骤如下: 
因为OCR V7 .5文字识别软件只能使用TIF、BMP、PXC三种格式的黑白图像文件。而数码相机输出的文件一般有两种格式,TIF格式和JPEG格式。由于获得的是彩色图片,所以要把导出的文件处理一下。在Photoshop软件中,选择“图像”命令菜单的“调整”选项,然后选“阈值”命令,该命令可以将一张彩色或者是灰度图片根据指定的阈值转变成一张具有高反差的黑白图片。们可以根据图片的效果适当调整图片的阈值,就可把数码相机导出的照片变成高反差的黑白照片,但这还不是二值(黑白)图像,需要把图片另存为BMP格式文件,关闭Photoshop软件。打开操作系统中附件里的“画图”软件,打开保存好的BMP文件,另存为单色位图文件。这样数码相机所拍摄的图片经过处理很容易就变成了OCR V7.5文字识别软件可使用的BMP格式黑白图像文件。 
在OCR V7 .5文字识别软件中,在命令菜单中选择“打开”,在对话框的文件类型中选择“BMP格式”,打开文件,选好识别区域,就可识别文字,实际的识别效果非常不错。一页A4幅面的文稿只用几秒钟就可识别完成。 
最后强调的是,文字识别的成功与否主要取决于数码相机拍摄图片的质量,一是要合理选择数码相机的像素,现在200万像素以上的相机很普及,价格也不贵。而只有640×480的30万像素老数码相机拍摄的图片文字识别率很低,一般不能用来翻拍。二是要合理使用光源,光线尽可能用自然的散射光,还要关闭数码相机的闪光灯。翻拍白纸黑字的文稿时,要使用手动拍摄模式并增加曝光补偿,拍出的照片才会光线均匀,经过Photoshop软件处理后字迹清晰,如果图片拍摄的好,可以不用在Photoshop中调整图片的阈值。只需要在Photoshop中转换一下
 
方法三:
软件介绍SOFT INTRODUCE本软件系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。 目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。

识别字符 简体字符集:国标GB2312-80的全部一、二级汉字6800多个。纯英文字符集。 简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。

识别字体种类 能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。

识别字号 初号 小六号字体。

表格识别 可以自动判断、拆分、识别和还原各种通用型印刷体表格。

可支持繁体WINDOWS系统



用扫描仪扫描的文字图像,不能对个别文字进行编辑修改,在教学中,需要利用文字识别软件,将文字图像进行识别,将图像格式转化成文本格式,常见的文字识别软件有很多,主要功能基本相同,尚书七号就是其中很优秀的一款。用尚书七号对文字图像识别转化的过程,利用其主菜单:“文件”、“编辑”、“识别”、“输出”可以很方便地完成。具体步骤为:

步骤1:获取文字图像文件。

选择“文件”菜单下的“扫描”或“打开图像”(将已经扫描好的图像文件打开)命令,打开图像文件。如果连接了多台扫描仪,可以选择“文件”菜单下的“选择扫描仪”命令,调用扫描仪。

步骤2:对扫描的图像页进行调整

选择“编辑”菜单下“图像页面的处理”子菜单下的“图像页的倾斜校正”(提供自动和手动实现方法)及“旋转”等命令,将扫描的图像页进行调整。

步骤3:版面分析与文字识别转化

版面分析,选择识别范围,在进行文字识别前要选择识别范围,识别过程的核心是“版面分析”。尚书七号的自动版面分析功能很强,对报纸杂志等复杂的版面,也能保持很高的分析正确率。

设置好后,直接点击“开始识别”的按钮就可以进行文字识别了。 



步骤4:校对修改

自动识别完毕,识别结果的“文本窗口”会弹出,这个窗口能够提供识别结果的校对,为了校对方便,尚书七号增加了光标跟随显示原图像行的校对方法(如图3出现的黄色提示行的出现)。

提供的校对方法,一眼就能够看到图像原文和识别出文本的差别,如果发现识别有误,可以进行修改。

步骤5:输出

如果检查修改后确认无误,选择识别结果的“输出”菜单,输出的文件格式有:RTF、HTML、XLS、2126,可以根据自己的需要选择对应的格式。如果用户想得到类似原文的识别结果,请选择RTF格式。把RTF格式输出的文件用WORD打开后,会发现几乎保留了原文的所有痕迹,包括原来页面中的彩色图像,都已经保留在WORD中了。