首页 > 快讯

海天瑞声发布超大规模中文对话数据集DOTS-NLP-216

快讯 零壹财经 零壹财经 2023-07-28 阅读:2064

关键词:数据集海天瑞声


7月28日讯,海天瑞声今日宣布正式推出中文千万轮对话语料库DOTS-NLP-216。据介绍,该语料库更加符合中国人表达习惯的自然对话数据集,共计约千万轮,上亿级token,包含正式&非正式风格对话,使用偏口语化自然表达,覆盖工作、生活、校园等场景,及金融、教育、娱乐、汽车、科技等领域。在数据集构成上,DOTS-NLP-216包含了对真实场景的对话采集,及高度还原真实场景的模拟对话两种方式。(金十数据)

上一篇>事关科创金融,央行副行长张青松提出五大重要内容

下一篇>今年上半年GDP十强城市出炉



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 498ms