Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了309,372,495字

该文章投稿至Nemo社区资讯板块复制链接

超越 OCR，谷歌 AI 技术 InkSight 可精准识别手写文字

发布于 2024/11/05 18:15 80浏览 0回复 817字

IT之家 11 月 5 日消息，Google Research 展示了一种使用人工智能读取手写内容的新方法，名为 InkSight 的系统能够直接从手写文字的图片中提取出数字文本，无需任何中间设备。

超越 OCR，谷歌 AI 技术 InkSight 可精准识别手写文字

传统的手写文字识别技术主要依赖于光学字符识别 (OCR)，但这种方法在处理复杂背景、模糊不清或低光照条件下的手写文字时往往表现不佳。InkSight 则采用了不同的思路，通过模仿人类学习阅读的过程，即通过不断地重写文本，来学习整个单词的外观和含义。这需要研究人员训练 AI 模型，使其能够识别和模仿人类的手写风格。

超越 OCR，谷歌 AI 技术 InkSight 可精准识别手写文字

InkSight 在处理复杂场景时表现更为出色，例如当照片光线昏暗、文本部分遮挡或背景干扰时，InkSight 能够更准确地识别手写文字。研究人员发现，人类能够阅读 InkSight 生成的文本描摹的准确率高达 87%，其中三分之二的描摹结果与真实手写几乎无法区分。

对于喜欢手写的人来说，InkSight 具有巨大的潜力。想象一下，只需将手写笔记拍摄照片，即可立即将其转换为可搜索的数字文本。对于那些字迹潦草的人来说，InkSight 可以将难以辨认的手写内容转化为清晰、准确的打印文本。

从更广阔的视角来看，这项技术对于破译和和将几个世纪以来的手写文本转换为数字形式具有重要意义。即使对于那些数字化程度较低的语言，InkSight 也能帮助保护手写遗产，并为这些语言的数字化训练提供更多资源。

IT之家注意到，谷歌并不是唯一一家致力于开发手写识别 AI 工具的公司。亚马逊的 Kindle Scribe 电子阅读器也具备将手写笔记转换为可读文本的功能。此外，Goodnotes 等数字笔记应用也推出了手写识别和编辑功能，可以将手写文字转换为可编辑的数字文本。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/808/127.htm]

点了个评

Echo

超越 OCR，谷歌 AI 技术 InkSight 可精准识别手写文字

最新文章

华为“T0022C”耳机盒充电仓通过星闪认证，预计归属 FreeBuds Pro 4

原𝕏全球事务负责人入职阿尔特曼旗下团队，助力“数字身份验证”工作

海外版极氪 7X 实车曝光，明年欧洲上市

芒果 TV 应用上线理想汽车：适配 L6 / L7 / L8 / L9 / MEGA 车型，支持三屏同播功能

拼多多联席 CEO 赵佳臻：市场竞争加剧，收入增长放缓是必然

小米 13、Redmi K70 系列等机型开启澎湃 HyperOS 2 Beta 版内测招募

新徕卡 M11 相机及 Noctilux-M 50 f/1.2 ASPH.镜头“黑漆版”发布，72000 元 / 63500 元

图灵奖得主 Yoshua Bengio：人类仍缺乏可靠的方法来管理和约束 AI

消息称小米第二款车型计划明年 2、3 月上市，为纯电 SUV

KTC 27 英寸显示器“H27T22C 二代”上市：2K 180Hz、350nit 亮度，首发 749 元