IT之家 5 月 30 日消息,根据微软最新发表的研究论文,利用人工智能技术,可以实现保留原始布局和设计的情况下,将不可编辑的 PDF 文件转换为可编辑文档。
当前市场上固然有不少工具,可以将不可编辑的 PDF 文件转换为可编辑文档,但转换之后很难保留原始布局。
微软最新论文名称为《从不可编辑文档生成可编辑文档的方法和系统》,利用人工智能保留字体、颜色、布局和不同格式图像等视觉元素。
IT之家简要介绍下该系统的操作步骤,该系统先查看不可编辑的文档,找出各种元素(如文本、图像和表格)的排列方式,并使用边界框确定这些元素的位置和大小。
系统可识别不可编辑文档中文本使用的字体,然后使用人工智能模型,根据原始文档中使用的颜色选择配色方案。
系统会使用确定的布局、字体和配色方案创建一个新的可编辑文档。新文档保持了原始不可编辑文档的外观和感觉,但允许编辑。
该技术可将不可编辑的 PDF 文件转换为可编辑的文件,同时保留其原始元素,还可调整其大小,并保持所有内容完好无损。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/771/674.htm]