Apache Tika是美国阿帕奇(Apache)基金会的一个集成了POI(使用Java程序对MicrosoftOffice格式文档提供读和写功能的开源函数库)、Pdfbox(读取和创建PDF文档的纯Java类库)并为文本抽取工作提供了统一界面的内容抽取工具集合。 Apache Tika 1.28.2 和 2.4.0 之前版本存在安全漏洞,该漏洞源于 BPG 解析器可能会在精心制作的文件上分配不合理的内存量。
Apache Tika是美国阿帕奇(Apache)基金会的一个集成了POI(使用Java程序对MicrosoftOffice格式文档提供读和写功能的开源函数库)、Pdfbox(读取和创建PDF文档的纯Java类库)并为文本抽取工作提供了统一界面的内容抽取工具集合。 Apache Tika 1.28.2 和 2.4.0 之前版本存在安全漏洞,该漏洞源于 BPG 解析器可能会在精心制作的文件上分配不合理的内存量。