客服邮箱:service@midu.com
总部地址:上海市浦东新区张衡路198弄10号楼3层
为帮助广大开发者更好地了解大模型语料数据联盟发布的AI大模型语料数据,沟通大模型企业在AI视角下的数据需求,不断服务大模型产业生态和落地应用,作为大模型语料数据联盟发起单位,上海人工智能实验室联合各成员单位共同打造“解数 Talk”系列直播。首播已于12月13日正式开启。
首期“解数 Talk”直播邀请蜜度和上海仲裁委两家成员单位介绍两个高质量开源数据集。蜜度旗下微热点研究院副院长王昉深度解读了蜜度发布的开源文本数据集“蜜巢·花粉1.0”。

王昉在直播中表示,作为语料联盟推出的第二批开源语料数据集,蜜巢·花粉数据集数据总量7000余万条,在发布后的3个月里得到了广泛关注,在OpenDataLab开放数据平台上累计下载量超过4700次。
王昉对“蜜巢·花粉1.0”的服务途径和落地方式进行深度讲解,她指出,蜜巢·花粉已被应用于蜜度自研大模型的训练,为政务及媒体等行业领域提供知识问答与内容生成、分析报告自动生成、文稿内容审校与润色改写等各类智能生成式服务,各项应用均获得用户的良好反馈。
此外,蜜巢·花粉数据集的最新落地应用——知知通即将上线。据了解,知知通是一款专注于政企内部多模态文档的检索与问答的智能知识管理平台,以“人机互动”的方式实现文档即“找”即“现”、即“问”即“答”,能够有效帮助政府单位、大型企业将内部的数字资产进行统一整合,目前已经落地政务服务、地产等领域。蜜度还将进一步降低大模型技术探索和落地的门槛,加速应用创新与行业落地。
未来,蜜度将持续推进语料开源计划,逐步开源多模态、多领域的数据集,打造全平台、多模态、跨行业的综合数据集,为大模型技术深度发展与高水平应用提供更多元的数据要素保障。