一句话解释
这是一套可从亚马逊S3存储的PDF文件中实时提取文本的交互式服务搭建方案,支持程序化文档访问。
通俗理解
可以类比为给S3里的PDF文件装了一个“文本提取开关”,无需手动下载打开文件,就能通过代码实时获取其中的文字内容,还能交互式查询特定内容,和直接使用Amazon Textract是两种不同的工具选择。
适用场景
- 需要批量自动化处理亚马逊S3中存储的PDF文档的企业
- 需要程序化获取PDF文本内容的开发者
- 需要实时查询PDF内容的业务系统
相关概念
亚马逊S3(对象存储服务)、Amazon Textract(AWS的文档文本提取服务)、服务器端文本提取、程序化文档访问