首页 > 快讯

钉钉AI升级多模态:能根据图片识人、翻译、创作、多轮问答

快讯 零壹财经 零壹财经 2024-03-28 阅读:577

关键词:AI钉钉


3月28日讯,钉钉AI助理迎来升级,上线图片理解、文档速读、工作流等产品能力,探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型,升级后的钉钉AI助理拥有更强的视觉推理能力和长文本速读能力。目前,用户在钉钉IM消息框或点击魔法棒按钮进入AI助理对话框,发送长文件、在线文档、网页链接、视频内容,即可根据内容识人、识地点、分析、答题、翻译、摘要、提取文字,甚至可以通过多轮交互进一步做智能问答。基于通义千问Qwen-VL-Max视觉理解模型,钉钉AI助理能够准确描述和识别图片信息,并根据图片进行信息推理、扩展创作、文字提取、翻译等。此外,AI助理也支持视频内容的速读。发送给AI助理的短视频、直播切片或培训视频可以被快速“观看”,AI助理会根据视频内容生成字幕,提取关键词,并生成一份智能摘要,对于最高2GB的视频内容,仅需3分钟即可完成智能解读。

上一篇>IDC:中国生成式AI投资增长加速,五年复合增长率达86.2%

下一篇>通义大模型落地手机芯片



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 175ms