票据OCR
概述
OCR,是一种识别图片中文字,得到结构化文本信息的技术手段。我们将使用DataInterpreter
进行各类票据的OCR信息抽取
示例:购物小票识别
任务
使用DataInterpreter
对如下的票据进行OCR识别,提取并保存总金额
代码
注意:你需要事先安装Paddle相关依赖以运行此示例,可执行
pip install metagpt[ocr]
bash
python examples/di/ocr_receipt.py
python examples/di/ocr_receipt.py
运行结果
DataInterpreter
会在当前工作路径下保存一个csv文件,内含抽取出的总金额
机制解释
使用DataInterpreter
先生成规划Plan,再生成基于paddle OCR的工具代码,执行OCR处理以识别餐饮发票图片中的文本信息,提取相关数据,并将这些数据整理成表格文件。