近日,我院数据与智能安全团队的学术论文《RCTD: Reputation-Constrained Truth Discovery in Sybil Attack Crowdsourcing Environment》被知识发现与数据挖掘领域的顶级会议第30届“ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2024, CCF A类)”录用,会议将在2024年8月25日至29日于西班牙巴塞罗那举行。该文章的第一作者为我院金星副教授,第二作者为22级硕士研究生龚智海,通信作者为王震教授,该研究合作单位还有南京财经大学,之江实验室。本届大会投稿量达2046篇,录用率约20%。
女巫攻击表现为单一攻击实体控制多个虚拟账户,以共谋的方式实施对一项任务答案的操控。其在众包/群智感知系统中普遍存在,成为这类系统服务质量提升的瓶颈。真值发现算法(Truth Discovery, TD)旨在从相互冲突的数据中推断出最值得信任的答案。现有的真值发现算法检测众包/群智系统中的女巫攻击通常依赖于黄金任务,忽略了历史信誉值的可用性,然而历史信誉值往往也存在噪声、膨胀等问题。
这项工作首次提出了任务参与者的权重序列和信誉序列的“分块相似性”指标,并将其作为真值发现目标函数的正则项,以约束参与者权重的更新过程免受女巫攻击的影响,名为RCTD(Reputation-Constrained Truth Discovery)。其中,采用有序序列的相似度而非数值上的相似性旨在缓解信誉膨胀问题,而“分块”的目的在于减弱目标函数对相近信誉参与者排名先后的敏感度,即缓解信誉噪声难题。针对目标函数的求解,本文创新性提出了一种“交换梯度”的启发式解决方法,可以保证在有限次迭代后目标函数收敛至极小值。如Figure 1所示,本文通过大量实验验证了RCTD算法抗女巫攻击的有效性。