Skip to content

票据OCR

概述

OCR,是一种识别图片中文字,得到结构化文本信息的技术手段。我们将使用CodeInterpreter进行各类票据的OCR信息抽取

示例:购物小票识别

任务

使用CodeInterpreter对如下的票据进行OCR识别,提取并保存总金额和票据号码

代码

注意:你需要事先安装Paddle相关依赖以运行此示例,可执行 pip install metagpt[ocr]

bash
python examples/ci/ocr_receipt.py
python examples/ci/ocr_receipt.py

运行结果

机制解释

使用CodeInterpreter先生成规划Plan,再生成基于paddle OCR的工具代码,执行OCR处理以识别餐饮发票图片中的文本信息,提取相关数据,并将这些数据整理成表格文件。

Released under the MIT License.