• 微信咨询

  • 电话咨询

  • 预约演示

  • 关注公众号

  • 问题反馈

  • 竞赛介绍
  • 竞赛流程
  • 奖项设置
  • 评审标准
  • 大赛声明

第四届数据挖掘竞赛介绍

熟悉计算社会科学研究范式并掌握基本的计算技能,是传播学者进入计算传播学领域的基本条件。本次竞赛的主要目的在于引导高校教师或学生利用计算传播数据进行专业研究,激发高校教师或学生对计算传播数据的挖掘兴趣,鼓励研究者探索数据挖掘维度、尝试新的算法、解决现实问题,鼓励将数据分析与处理的知识与实际问题相结合,通过实际应用熟练掌握各种数据挖掘技术,培养计算思维,增强团队协作意识。

  • 01

    活动对象为致力于在相关领域进行学习和研究的高校教师或学生。

  • 02

    以团队为单位参赛,团队中必须包括一个以上成员来自社会科学领域,每个团队成员不超过5人,可跨学科自由组合。

  • 03

    本次竞赛各参赛队伍须根据给在出的如下选题方向的基础数据集中任选其一,完成选题要求,最终形成分析报告。
    注:竞赛数据将提供关联图片链接,支持多模态融合分析需求。研究方案的工程可行性将作为重要的评分项。

  • 时序数据流的事件识别与影响力预测研究

    数据:

    给定一个持续时间段内具有时序特征的社交媒体数据

    方向:

    信息抽取,事件聚合,事件分类,影响力评估

    要求:

    1. 对信息内容进行事件要素定义和抽取;2. 遵循数据流时序特征,对内容进行事件动态聚合;3.给出事件置信度定义,并且对其影响力进行评价。

  • 特定事件的次生和衍生事件识别与演化机制分析

    数据:

    给定特定时间段内的特定事件全生命周期数据

    方向:

    事件研究,深度学习

    要求:

    1. 次生和衍生事件的自动识别;2. 对衍生子事件识别的准确度进行评价;3. 对事件的演化机制进行建模分析。

  • 餐饮行业点评内容的分类评价研究

    数据:

    给定餐饮行业消费者点评内容数据

    方向:

    信息抽取,情感计算,机器学习

    要求:

    1. 对餐饮行业点评内容进行行业建模(如:口味,环境,价格,服务,菜品,进店目的,适合人群等);2. 对点评内容数据进行情感计算。

  • 不同地域用户信息茧房的识别及其形成机制研究

    数据:

    随机选择部分区域用户样本一段时间内的数据

    方向:

    测量、用户研究

    要求:

    1. 对用户关注的内容进行分类;2. 设计算法计算用户注意力被束缚在信息茧房的程 度;3. 尝试分析导致信息茧房的原因;4.将理论、数据与算法进行结合。

  • 04

    本次比赛以分析报告书的形式参与,分析报告书内容必须包括:

  • (定义研究问题,阐述问题的重要性)

  • 数据分析处理过程

  • 最终分析结果

    (包括可视化)

  • 相应解决方案及可行性论证

  • 报告格式包括标题、摘要、引言、问题的提出、对问题的分析、研究方法、发现、结论等部分,使用宋体、正文使用12号字体、1倍行距

  • 报告长度不超过五页,但是附图和表格不受页数限制

    (鼓励在文末附加图和表,需要有简短说明文字)