日本NTT发布支持图表识别的LLM“tsuzumi 2 Vision模型”

发布时间：2026/5/19

tsuzumi 2 Vision模型示意图

日本NTT公司于5月19日宣布，推出了其开发的大规模语言模型（LLM）“tsuzumi 2”的视觉处理版本——“tsuzumi 2 Vision模型”。

此前，tsuzumi 2主要支持基于文字的信息处理，但实际工作中使用的文档往往包含表格、图表等视觉元素，且这些文档格式多样，主要面向人类阅读。

此次升级的版本能够高精度地读取带有图表的日文文档，能够理解格式各异的企业报价单、以及定义业务流程的流程图等内容，并能根据用户请求提供相应回答。

tsuzumi 2 Vision模型应用示例

日本NTT表示，新模型将通过NTT集团旗下各公司陆续提供相关服务，并将继续推动该技术的研究与开发，力求实现更进一步的功能提升。

tsuzumi 2 Vision模型发展展望

标签

#日本NTT #大规模语言模型 #图表识别 #文档处理 #人工智能

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

东京大学加入World ID项目，成为AI时代的人类身份认证节点

2026/04/21

东京大学加入World ID项目，成为AI时代的人类身份认证节点

OpenAI CEO萨姆·奥特曼参与的World ID项目宣布东京大学将作为AMPC节点参与，推动基于虹膜识别的分布式身份认证技术。

日本软银将“Patching as a Service”服务对象扩大至3000家公司

2026/07/14

日本软银将“Patching as a Service”服务对象扩大至3000家公司

软银与SB OAI Japan利用OpenAI先进AI技术，扩展AI驱动的网络安全解决方案服务范围，强化企业系统安全防护。

索尼宣布结束国内aibo机器人的销售

2026/06/25

索尼宣布结束国内aibo机器人的销售

日本索尼集团于25日宣布，将停止销售自律型娱乐机器人“aibo(ERS-1000)”的国内市场产品，待库存售罄后，国内销售正式结束。 aibo(ERS-1000)自2018年1月起发售，作为一款可爱且富有生命感的犬型自律娱乐机器人，以其圆润的造型、灵动的眼睛、独特的叫声以及耳朵、尾巴和身体语言，成为用户生活中的温馨伙伴。索尼每年都会推出新颜色的型号以丰富产品线。虽然本体销售将终止，但订阅服务“