语言智能-蜜度Midu-专注于大模型垂直应用的人工智能企业

“AI+办公”，让工作更轻松

蜜度基于多模态高质量数据，自主研发蜜巢、文修两个垂直大模型，并利用智能检索、智能校对、智能生成3大核心能力，在公文写作、内容校对、舆情分析等核心办公场景中，为客户提供安全、高效、智能的产品与服务。

自主研发大语言模型

蜜巢
大模型
文修
智能校对大模型

蜜巢大模型

模型特点：

自主：蜜巢为蜜度自主研发的大模型，在研发工作中，构建了Token数超1万亿、中文内容占比超75%的高质量语料数据集用于预训练工作。

安全：蜜巢从优质预训练语料入手，从零开始逐阶段完成训练，同时从源头强化价值观对齐能力与中文理解能力，模型安全可信、自主可控。

双引擎：基于自主研发的蜜巢大模型，并融合书生·浦语大模型，通过构建“双引擎”协同机制，推动各类应用场景的深度开发与高效落地实施。

应用丰富：模型聚焦知识问答、公文写作、材料分析三大垂直应用方向，以蜜巢能力为核心，不断拓展大模型的应用场景，为各垂直办公领域赋能。

落地强：蜜巢大模型已完成备案，并落地蜜度文稿通、知知通、新浪舆情通三款智能应用产品，为1万+客户提供SaaS服务。同时，也为客户提供个性化大模型解决方案，并已在包括政务服务热线、大型企业内部知识管理与问答、社交媒体智能舆情分析等多个场景实现商业化落地。

文修智能校对大模型

技术特点：

安全可控：以大模型 (LLM )为技术底座，从零训练，确保技术自主；具备大规模高质量数据构造能力，数据可控；支持在消费级显卡上以容器化方式实现快速部署，单节点处理千字文本仅需0.5秒，成本可控；

技术优越：引入样例增强和解码增强技术提高校对效果；

高质量数据：基础预训练模型的数据超10000亿词符，校对任务的训练数据超5000亿词符，校对训练数据规模达8000亿Token；

效果优秀：面向母语和非母语的公开测试数据集，截至目前，在所有公开结果中文修表现效果最佳。面向专业领域公开数据集，文修能够识别并准确纠正的差错案例占比超70%；

多模态、多语言能力引擎

MiduMLC多语言校对引擎
Multi-Lingual Correction
MiduMLC多语言校对引擎基于去噪自编码与自回归技术，将大规模语料库中蕴含的语言规律内嵌到深度网络模型之中，并通过音形义多模态融合和文本约束生成，实现对多种语言文字内容的智能校对与改写，校对能力处于业界前沿地位。
MiduMLC支持文本、图片、视频等多模态数据与网页、版式、流式等多文档格式的智能解析与校对，并拥有动态更新的知识图谱和常识知识库，具有精准的多要素实体关系联合抽取模型和事实一致性检测能力。MiduMLC具备主动学习能力，能够在无人工干预下持续提升校对效果。
MiduNLP自然语言处理引擎
Natural Language Processing
MiduNLP是面向工业场景的智能引擎，具备敏捷开发、自定义等优点。借助大规模的语料库，训练了丰富的语言模型。引擎能力涵盖分词、命名实体识别、关键词提取、新词发现、关系抽取、情感分析等自然语言处理任务，可满足工业场景中对文本处理的各类技术需求。引擎持续跟踪业界前沿算法模型，助力模型的便捷实现、高效训练和快速落地。
MiduCV计算机视觉引擎
Computer Vision
MiduCV作为面向图片、语音、视频等模态内容的智能理解引擎，涵盖了CV及ASR等技术方向。引擎模型包括目标检测、语义分割和卷积循环神经网络等，实现光学字符识别、人脸识别、以图搜图、特定目标检测、视频理解等任务。依托上述技术并结合工业场景进行针对性优化与融合，实现图片、视频两种模态内容中图片文字、视频字幕、人物、场景及品牌Logo的提取与识别。
针对智能语音识别，引擎则通过搭建的语音活动检测模型和自动语音识别模型，结合实际工业场景的精标数据集进行模型的自主训练及性能优化，解决了对语音片段的自动降噪、精准提取与准确识别等问题，实现对音频内容的智能识别与理解。
MiduCMR跨模态检索引擎
Cross-Modal Retrieval
MiduCMR涵盖了NLP、CV单一模态以及多模态之间进行交互、融合的技术。相较于单一模态的模型，跨模态可以真正实现“以语言指导图像，以图像指导语言”的训练，充分利用不同模态之间的互信息来提升模型对各种模态的理解能力。
引擎采用泛化性及效果突出的Transformer架构模型，不仅在单模态认知中能够通过自注意力机制充分学习特征，也能在多模态认知过程里充分融合不同模态的特征，从而达到多模态信息表示的统一。引擎通过基于动量对比学习、跨模态融合注意力、以及跨模态特征指导等工作，在大量无监督数据上进行预训练，并针对不同工业场景进行特化训练。
引擎能力覆盖各种跨模态检索任务（文搜图、图搜文、文搜视频等）、单模态检索任务（相似图片检索）、图片描述生成任务、图文匹配判断任务等。
MiduAIGC内容生成引擎
AI Generated Content
MiduAIGC内容生成引擎，支持在不同的模态及任务场景上进行辅助内容生成。MiduAIGC引擎在学界业界最新模型基础上进行模型设计，认知并融合中文语言环境下多模态内容的特性开展语言模型训练，支持根据用户要求辅助生成相应内容。目前MiduAIGC引擎专注于图生图，图生文，文生图，文生文能力的建设。
文生文：拥有续写，文稿撰写能力，可以辅助用户进行文字创作，提供创作灵感，大大提升用户的创作效率。
文生图：可根据用户输入的文字进行艺术创作、图像编辑，可根据简笔画草图与文字要求可控地生成图像。可以在设计、配图等多个场景辅助用户进行创作。
图生图：由图像风格迁移，超分辨率，图像修复等多个能力构成，共同帮助用户对图像进行智能美化与修改。
图生文：可以根据图片内容进行文字创作，可用于图片描述生成，图片相关的广告文字生成，以及基于图像内容的问答等。
MiduKG知识图谱引擎
Knowledge Graph
MiduKG知识图谱引擎通过知识建模、知识抽取、知识融合、知识存储、知识计算等技术从海量文本、图像、音视频等多模态信息中提取有价值的知识，同时采用深度学习技术来推断复杂知识的关联关系，从而形成对知识的认知，并自动构建知识图谱。并用于解决语义搜索、智能推荐、知识问答和知识可视化等多种复杂场景的问题。
语义搜索：利用知识图谱中的知识模型，实现用户输入的自然语言查询逻辑的解析。
智能推荐：从海量的信息中为用户寻找其感兴趣的信息，通过算法推荐达到节省用户时间、提升用户满意度。
知识问答：利用了知识图谱中知识模型以及推理能力，以多轮交互的方式实现用户问题的回答。
知识可视化：利用了知识图谱中的已有知识，可以将知识结构可视化展现出来，从而更好的展示出知识之间的联系。

多种服务方式赋能行业发展

定制化开发
个性化解决方案满足用户特定需求
私有化部署
按需求进行本地化部署
SaaS产品
提供标准化产品服务
一体机
开发者服务
提供基于产品功能的一系列开发者服务
报告服务
系统+人工实时推送，支持定制化分析报告
生态合作
共建创新实验室、联合会销活动、产品展示等，推动行业发展

网信宣传
政法
公共服务
文旅
媒体
智慧城市
应急
品牌企业
金融
出版
大数据
财经
交通
教育
医疗
环保
能源
国央企

语言智能

“AI+办公”，让工作更轻松

自主研发大语言模型

蜜巢

文修

蜜巢大模型

模型特点：

文修智能校对大模型

技术特点：

多模态、多语言能力引擎

MiduMLC多语言校对引擎

Multi-Lingual Correction

MiduNLP自然语言处理引擎

Natural Language Processing

MiduCV计算机视觉引擎

Computer Vision

MiduCMR跨模态检索引擎

Cross-Modal Retrieval

MiduAIGC内容生成引擎

AI Generated Content

MiduKG知识图谱引擎

Knowledge Graph

三大核心能力

多种服务方式赋能行业发展

定制化开发

私有化部署

SaaS产品

一体机

开发者服务

报告服务

生态合作

专业定制行业解决方案

网信行业解决方案

文旅行业解决方案

政法行业解决方案

体验便捷的智能科技服务

联系我们

语言智能

“AI+办公”，让工作更轻松

自主研发大语言模型

蜜巢

文修

蜜巢大模型

模型特点：

文修智能校对大模型

技术特点：

多模态、多语言能力引擎

MiduMLC多语言校对引擎

Multi-Lingual Correction

MiduNLP自然语言处理引擎

Natural Language Processing

MiduCV计算机视觉引擎

Computer Vision

MiduCMR跨模态检索引擎

Cross-Modal Retrieval

MiduAIGC内容生成引擎

AI Generated Content

MiduKG知识图谱引擎

Knowledge Graph

三大核心能力

多种服务方式 赋能行业发展

定制化开发

私有化部署

SaaS产品

一体机

开发者服务

报告服务

生态合作

专业定制行业解决方案

网信行业解决方案

文旅行业解决方案

政法行业解决方案

体验便捷的智能科技服务

联系我们

多种服务方式赋能行业发展

网信行业解决方案

文旅行业解决方案

政法行业解决方案