跨模态信息检索平台
实现文字、图片、音视频互联互通

索骥2.0 全新升级
视频字幕、弹幕、背景等元素及音频识别
多个视频平台的热搜数据,实时掌握
快速识别视频中可能存在的风险
视频追根溯源,一探究竟
自主研发模型,从单一模态到跨模态
自定义监测,去除噪音
相似特征提取,相似图片查询
关注动态,实时推送
数十种可视化图表,支持一键下载
各类报告,快速生成
日/周/月等周期报告,便于总结与汇报
106个政务类单位,271个特殊场景进行加强训练
每天全媒体数据实时识别,保障数据全面、快速
常规常见场景快速识别并提取
文字、图片、音视频互联互通,并在内容检索上实现智能情绪识别
通过智能识别能力输出视觉、语音多维度内容标签
实时视频比对,有效找到相似视频
拥有新浪微博官方数据;内容判断准确率高达95%;覆盖网站数量25+万。
每日识别图片总数达到2.8亿+张;智能识别图片中的文字内容,可准确解析视频中的字幕、背景、封面等特征元素,平均处理速度1250万+张/小时;图片识别准确率高达95%。
每日识别音视频1.2亿+条;平均处理速度330万+条/小时;视频识别准确率92%左右;视频覆盖16个短视频和直播平台、317个视频频道、30个视频网站、143个电视台相关视频平台,对8大热门短视频平台进行重点覆盖。
使用一种模态在另一种模态中检索相关信息的过程称为跨模态检索,可实现文本搜图片、视频;图片搜文本、视频;视频搜文本、图片等跨模态检索。
从单模态数据中基于文本视觉相似性排序来进行数据增强,使用对应特征计算对比学习损失,使得模型中多模态任务上有更加出色的表现。
整合不同模态间的模型和特征,提高理解能力和效率,实现语音文字文本纠错能力,提升识别准确率。
将多模态信息进行整合及联合表征,实现视频内容的一体化识别。
用搜索特征向量对海量目标高维向量进行近似最近邻计算,实现语义检索及TOPN相似结果召回。