导语在假新闻研究迈向神经科学领域的今天,研究人员不再满足于仅仅观察我们说了什么,而是开始探索我们的大脑在想什么。近日,西南大学何清华教授团队在《Scientific Data》发表了一份全新的数据集,其中包含了大脑结构与功能的核磁共振成像(MRI)数据,以及参与者在阅读假新闻和真新闻时的行为与心理反应记录。这一开放获取的数据库将有助于揭示大脑处理虚假信息的底层机理,促进跨文化和跨学科的协作研究。

论文来源:Scientific Data

论文题目:China’s social fake news database release with brain structural, functional, and behavioural measures

论文地址:https://www.nature.com/articles/s41597-025-04901-4

Wanting Chen, Jia Shi,Qinghua He | 作者

朱欣怡 | 编译

嵘麒、Nicole、青鹤 | 审校

在这个信息爆炸的时代,我们每天都在社交媒体上滑动刷新,阅读来自世界各地的新闻和消息。然而,潜藏在这信息洪流中的是数量惊人的虚假新闻,它们像数字病毒一样迅速传播,影响着公众认知和社会稳定。虽然我们对虚假新闻的传播模式已有一定了解,但一个根本性问题仍然困扰着科学家:人类大脑究竟如何处理、分辨虚假信息?

近日,一项发表在《Scientific Data》上的开创性研究为研究这一问题提供了新的工具。西南大学何清华教授团队构建了中国首个社交虚假新闻神经影像数据库,这一数据库将神经影像学、行为数据和标准化的虚假/真实新闻材料相结合,为探索虚假新闻的神经机制开辟了新天地。

"与西方国家不同,中国的虚假新闻主要集中在社交生活领域,而非政治领域。然而,长期以来我们缺乏标准化的研究材料,这严重限制了更进一步的研究。"何清华教授解释道,"我们的目标是建立一个高质量的多模态数据库,不仅为国内研究提供基础,也为跨文化比较研究提供可能。"

目前,虚假新闻扰乱正常社交状态在全球范围内都是一个严重问题,但其内容重点在不同文化背景下有着显著差异。何清华教授研究团队对280条经过证伪的中国虚假新闻进行分析后发现,高达50.93%的虚假新闻属于社交生活类,例如"好心人归还百万失物"这类故事,这与西方主要集中在政治领域的虚假新闻有很大不同。

这种差异凸显了构建具有文化针对性的虚假新闻研究材料的重要性。正如研究团队在论文中指出的那样:“大多数现有研究主要聚焦于西方的政治或健康背景,忽视了虚假新闻传播在不同文化中的多样性。在中国,虚假新闻更常围绕社会类话题展开,这进一步突显了采用更具文化包容性的方法,深入理解并有效应对虚假信息传播的必要性。”

实验设计

这项研究保证了实验新闻材料筛选和标准化的严格流程。研究团队首先从"上海新闻记者"网站、中国华中师范大学新闻与传播学院媒体伦理案例库以及微博社区事实核查中心等权威来源识别了280条经过证伪的虚假新闻。经过多轮筛选,最终确定了67条社交生活类虚假新闻和60条主题相对应的真实新闻。

为确保材料的标准化和可比性,研究团队实施了严格的处理流程(如图1所示):

1. 初步筛选时剔除外国媒体报道、自媒体报道、内容不清晰的图片操纵案例和重复条目;

2. 由新闻传播专业学生将虚假新闻分为社会、文化、政治等10个主题,发现社会生活类占比最高;

3. 通过网络爬虫收集605条微博帖子,确定标准字数为110-130字;然后由专业学生重写长文章,保留原文风格和核心内容;再使用四维评分量表评估压缩版文章质量,包括主要内容提炼、基本新闻要素包含、原始新闻情感语言保留和整体准确性;

4. 两名学生独立评估原始新闻和标准化版本的语言准确性。这一过程确保了实验材料的高质量和一致性,为后续的脑成像研究奠定了坚实基础。

图1 新闻收集流程图

实际操作中,研究团队招募了43名大学生(29名女性,14名男性,平均年龄20.79岁)参与实验,采集了三类核磁共振成像数据:1)高分辨率T1结构像;2)静息态功能像;3)任务态功能像。

高分辨率T1结构像:一种通过磁共振成像(MRI)获取的大脑解剖结构图像,它的“高清”特性让我们可以清晰地看到大脑内部的不同组织结构,比如灰质、白质和脑脊液的分布。

静息态功能像:记录参与者安静休息状态下的脑活动,反映大脑内在功能连接。

任务态功能像:捕捉参与者执行特定任务时的脑活动。

实验设计巧妙地分为两个任务运行:

任务1:参与者首先阅读新闻并评价分享意愿,然后评估同一新闻的准确性,最后再次评价分享意愿,研究准确性评估如何影响随后的分享决策;

任务2:参与者被明确告知新闻的真假性,然后评价分享意愿,每个模块包含10次试次,呈现相同真实性的新闻,模块呈现顺序采用ABBA设计平衡,允许直接比较参与者对真假新闻的行为和神经反应。

此外,研究还收集了参与者的人口统计学信息和心理特质数据,包括认知反思测验(CRT)、错失恐惧量表(FoM)和认知需求量表(NFC)等。

认知反思测验(CRT):用来衡量一个人抵抗直觉冲动、进行深度思考的能力的心理量表。它被广泛用于预测人们在决策和判断中是否倾向于快速但错误的反应,还是愿意花时间进行逻辑推理。

错失恐惧量表(FoM):用于评估一个人害怕错过他人正在经历的有趣或重要事件的程度的心理量表。

认知需求量表(NFC):用来测量个体在日常生活中喜欢思考、享受思考的程度的心理量表。

图2 整体实验设计图

数据质量与技术验证

为确保数据的可靠性和有效性,研究团队使用“nipreps/mriqc”工具处理原始成像数据,获取多种图像质量指标。

结构成像质量指标包括关节变异系数(CJV)平均0.64±0.07,反映白质和灰质之间的强度变异性;白质/灰质对比噪声比(CNR)平均1.59±0.18,评估白质和灰质对比的清晰度;以及脑脊液、灰质和白质的信噪比(SNR)分别为2.10±0.13、7.03±0.60和11.36±1.00。

功能成像质量指标包括帧间位移(FD)静息态平均0.085±0.026mm,任务态平均约0.098mm,反映头动程度;以及时间信噪比(TSNR)静息态平均39.13±4.01,任务态平均30.49-35.63,反映功能成像的灵敏度。这些指标显示,数据集整体质量优良,满足高质量神经影像研究的标准要求。

图3 结构化图像质量指标

数据集说明

该融合脑影像与行为数据的开放数据集,容量约为84GB,内容涵盖三大类信息。首先是新闻材料数据,包括参与者在实验中阅读的假新闻和真新闻,已整理为表格文件(NEWSCONTENT.xlsx),记录了每条新闻的编号与具体内容。其次是脑影像数据,为每位参与者提供了结构成像(T1)、静息态功能成像和任务态功能成像三类MRI图像,任务态数据还包含每条新闻的呈现时间、参与者的分享意愿评分与准确性判断等行为指标。这些图像均已转换为国际通用的BIDS标准格式,并通过“mri_deface”工具去除面部特征以保障隐私。

最后,数据集中还包含了参与者的基础人口学信息与心理测量结果,如“思维反思能力”和“错失恐惧感”等相关量表,便于研究者开展个体差异分析。该数据已在OpenNeuro平台上线(https://doi.org/10.18112/openneuro.ds005875.v1.0.2),免费向全球科研社区开放,为深入理解假新闻的认知与神经机制提供了重要资源。

结语

这一综合性多模态数据集为后续虚假新闻研究奠定了基础。基于此数据集,研究员们首次可以深入研究人类处理虚假信息的神经基础,如哪些脑区对判断新闻真假性至关重要,哪些脑区与分享决策相关;任务1中嵌入的准确性评估,为研究“准确性启动”如何影响信息分享行为提供了一个自然的实验范式。这一设计与心理学家 Pennycook 等人提出的理论相呼应,即通过提醒人们关注信息的准确性,可以有效减少在线虚假信息的传播;任务2的区组设计明确区分真假新闻,允许直接比较受众对虚假信息的行为和神经反应,探索大脑如何区分真假信息;结合人口统计-问卷-神经影像三元组数据,可研究个体关于媒体素养的差异,比如认知需求高的人是否更善于识别虚假新闻;结合神经模式和行为指标,可识别错误信息易感性的神经认知标记,为预测谁更容易受虚假信息影响提供生物学基础。

这一研究成果有望转化为多种实际应用:基于脑科学发现设计更有效的媒体素养培训流程,针对大脑处理虚假信息的特点进行干预;开发基于神经标记的虚假新闻易感性评估工具,帮助识别易受虚假信息影响的个体;根据用户认知特点和神经模式,开发智能算法帮助筛选信息;设计基于脑机接口的媒体素养训练项目,帮助人们增强对虚假信息的免疫力。在人工智能生成内容日益普及的今天,理解人类大脑如何处理虚假信息变得前所未有地重要。

这项研究不仅为虚假新闻研究提供了宝贵的数据资源,也展示了多学科交叉融合的研究范式,将神经科学、心理学、传播学和数据科学有机结合,为应对数字时代的信息挑战提供了科学支持。随着研究的深入,我们有望更好地理解人类认知如何被虚假信息操纵,以及如何增强我们的"认知防火墙"。

在信息真假难辨的时代,这项研究为我们走向一个更真实、更理性的信息社会点亮了一盏科学的明灯。正如研究团队所期望的,这一开放获取的数据库将促进跨文化和跨学科的协作研究,共同应对虚假新闻这一全球性挑战。

声明:本文来自共时读书会,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。