今天早上起来,我对着桌上的那一大堆PDF文件头都大了。公司财务发给我的报销单据,全是扫描件,每份都得手动输入到表格里,累得腰酸背痛的,一折腾就是半天。
研究汉王OCR工具
我就琢磨着,有没有省事的法子。上网搜了一圈,发现大家都说汉王OCR好用,免费还简单。我也抱着试试看的心态,打开官网直接下载软件。安装过程挺顺当的,双击exe文件,点几下同意和下一步,不到两分钟就搞定。
先试试单个文档处理
刚开始我懒得看说明,直接拖一个PDF进软件。点开工具栏的“识别”按钮,它就自动弹出来个结果框。识别的文字挺准的,但导出到Word还得我自己复制粘贴。我心想这不行,效率太慢了。
- 第一步:设置识别选项 - 我发现工具栏有个“高级识别”选项,点进去改了下语言设为中文简体,勾选上忽略图片格式。
- 第二步:导出测试 - 识别完一个文件后,我选了导出到Word,导出速度还行,但手动操作费劲。
折腾了十分钟,只搞定一个文件,我急得直冒汗。
发现批量处理功能
我又回主界面瞎点,在软件左上角找到个“批量处理”菜单。点进去一看,有“添加文件夹”的选项。我直接把整个桌面的PDF文件夹全选中,拖进去。
结果弹出个提示说有些文件太大,要我调整设置。我就点开右边的“配置”按钮,把识别精度调到中档,输出格式选成批量Word。再点“开始”按钮,软件自个儿就跑起来了。
实战操作与结果
我泡杯茶的功夫,回头一看,电脑上三十几个文档全处理完了。打开生成的文件夹,每个PDF都对应一个Word文件,文字排版没乱,连发票号码都清晰。整个过程不到一刻钟,比手动省了快两个小时。
算下来,软件是免费的,电脑电费也不值钱,一年光这个活儿就能省几百块钱。真要是早知道,早点用上汉王OCR批量处理,该多