Skip to content

鲁棒性评测介绍

鲁棒性是指模型在面对不同类型的异常、噪声、干扰、变化或恶意攻击时,能够保持稳定性和高效性的能力。目前的基础模型可以在给定数据输入X 的情况下, 经过其定义的计算Fθ(·),得到模型期望的输出 Y,而鲁棒性可以理解为:在给定扰动噪音ΔX的情况下,模型的输出Fθ(X+ΔX)是否等于期望的输出Y,量化该差异为ΔYΔY 越小代表该模型鲁棒性能越好。

对于大语言模型而言,构建的扰动噪音要求不影响人类对输入X的理解。因此,团队在构建文本噪音时,会针对生成的测试样例设计ΔX,并要求X+ΔX与原始的X在人类理解层面上的差异不大,但又容易使模型的输出犯错。

本期鲁棒性评测数据集和评测结果分为两个部分:

  • 内容扰动鲁棒性评测:针对选择问答、文本分类测试集进行字符(Char)、单词(Word)、句子(Sentence)三个级别进行内容扰动以及对抗性扰动(即采用代理模型和相关算法进行对抗性攻击),生成了不同的扰动数据集。
  • 格式扰动鲁棒性评测:针对选择题,进行选项格式扰动,考察模型是否真正理解了问题和选项并遵从指令的格式要求作答。例如,四个选项的内容调换顺序,或者将 A、B、C、D 改为 B、D、C、E。

评测数据集

CSL

鲁棒性数据集的构建采用三种扰动,分为字符级别(char),句子级别(sentence),单词级别(word),扰动后数据集名称如下:

扰动数据集名称扰动方法
C-morphonymdisturbance-char-morphonym
W-maskedlmdisturbance-word-masked-lm
S-backtranslationdisturbance-sentence-back-translation

C、W、S、Adv分别是Char、Word、Sentence、adversarial的缩写

  • 字符(char)级别

    随机挑选3到15个字符进行替换,扰动方式如下

      1. 相似字符变换

      扰动样例

      {
      "id": 1,
      "abst": "免疫滋珠是免疫微球的一种,它是包被有单克隆抗体的球型磁性微粒,可峙异性地与靶物质结合使之具有磁响应姓,可以保证被粉离靶细胞的形态和功能的完整,具有灵敏度高、特异性高、检测速度快、重蝮性好、操作简单和不需要昂贵的仪器设备等优点,本文就该技术应用于肿瘤细胞的分离、富集与检测以及肿瘤的生物学研究和磁导向治疗、免疫磁性净化寺龄域的研究进展作一综述.",
      "keyword": ["综述", "循环肿瘤细胞", "免疫磁珠技术"],
      "label": "1"
      }
      1. 同音字符变换

      扰动样例

      {
      "id": 1,
      "abst": "键立了三维格子玻尔幔方法(LBM)-元胞自动机(CA)耦恰数置模型,迸用该漠型模拟研究了Al-4.7%Cu(质量纷数)固溶体搭金的凝固过程.该耦哈模型采通元胞自动机方法模拟枝晶的生长,同时采基于分子动力学理论的格子玻尔滋曼方法模拟给金凝固过程中的温度场、流杨以及蓉质场.模拟结果再现了拾金凝固过程中的三维枝晶型貌变化以及溶质富集过程,并将三维流场因素考虑进去,定量研究了自然对流、过冷度对单枝晶形貌和盛粉分布的影响.研究表明,在纯扩散条件下,枝晶呈现忖称的生长现橡,模拟自庙枝晶隐态生长的尖端速度、尖端判泾和过铃度的关系与Lipton-Glicksman-Kurz(LGK)理论模型吻塔得较好.在自然对流条件下,枝晶的生长形貌呈现不对称性,膀枝晶性长在迎流方向上拉至了促进,在顺流方向上受到了抑制.榕体过伶度对枝晶生长的影响较大,过冷度的增架导致枝晶生长驾快,二姿枝晶增多且呈现出粗化现象,枝晶尖端固液界面处的溶质浓度篇高,加重了溶质偏析.",
      "keyword": ["枝晶生长", "三维LBM-CA模型", "数值模拟", "流场"],
      "label": "1"
      }
  • 句子(sentence)级别

    对摘要和关键词进行回译扰动(翻译为英语,再翻译为中文),扰动方式如下

    • csl_test_public_back_translation_abst_keyword (对摘要和关键词都进行了回译扰动)

    扰动样例

    {
      "id": 1,
      "abst": "免疫磁珠是免疫微球的一种。它们是涂有单克隆抗体的球形磁性颗粒。它们可以特异性地与目标物质结合,使其产生磁响应,确保分离的目标细胞的形态和功能。其完整且具有灵敏度高、特异性高、检测速度快、重现性好、操作简单、不需要昂贵的仪器设备等优点。本文讨论该技术在肿瘤细胞分离、富集和检测以及肿瘤生物学方面的应用。本文综述了科学研究及磁引导治疗、免疫磁净化等领域的研究进展。",
      "keyword": ["综述", "循环肿瘤细胞", "磁免疫珠技术"],
      "label": "1"
    }
    • csl_test_public_back_translation_only_abst (仅对摘要进行了回译扰动)

    扰动样例

    {
      "id": 1,
      "abst": 针对船舶航行中的混沌运动控制问题,从船舶操纵运动的非线性模型出发,提出一种基于受控混沌系统Melnikov函数的矩形脉冲摄动控制方法。该控制方法利用矩形脉冲来扰动混沌系统的参数。通过求解混沌系统的同宿轨道,构造受控混沌系统的Melnikov函数,并结合Melnikov函数简单零点出现的边界条件,从数学上确定微扰脉冲参数的值,避免了需要实现混沌控制时控制脉冲参数。选择的盲目性。船舶混沌运动控制仿真实验表明,该方法能够快速将系统混沌运动稳定到周期轨道上,其幅度降低至原混沌系统的8.5%;同时,实验结果表明,该方法在船舶混沌运动控制中能够有效发挥作用。",
      "keyword": ["同宿轨道", "航向保持", "参量微扰", "矩形脉冲"],
      "label": "1"
    }
  • 词语(word)级别

    采用掩码语言建模方式对词语进行替换

    扰动样例

    {
    "id": 1,
    "abst": "免疫磁珠是免疫微球的一种,它是包被有单克隆状的球型磁性微粒,可特异性地与靶物质结合使之具有磁响应性,可以保证被被靶细胞的形态和功能的完整,具有灵敏度高、特异性高、检测速度快、重复性好、操作简单和不需要维护的仪器设备等优点,本文就该技术运用于肿瘤细胞的形成、富集与检测以及其的生物学研究和磁导向治疗、免疫磁性净化等应用的研究进展作一综述.",
    "keyword": ["综述", "循环肿瘤细胞", "免疫磁珠技术"],
    "label": "1"
    }

中文MMLU

扰动数据集名称扰动方法
rand更换选项内容顺序
ref更换选项名称
  • 更换选项内容顺序 在选择问答数据集中,随机更改选项的顺序, 并相应修改正确答案。

    原始样例

    {
    "question":"舌骨的胚胎起源是什么?"
    "choices":["第一咽弓","第一和第二咽弓","第二咽弓","第二和第三咽弓"],
    "answer":"D"
      }

    扰动样例

    {
    "question":"舌骨的胚胎起源是什么?"
    "choices":["第二和第三咽弓","第一咽弓","第一和第二咽弓","第二咽弓"],
    "answer":"A"
    }
  • 更换选项名称 将选项 A/B/C/D 更换为 B/C/D/E,且不改变选项内容和顺序。

    原始样例

    {
    "question":"舌骨的胚胎起源是什么?"
    "choices":["第一咽弓","第一和第二咽弓","第二咽弓","第二和第三咽弓"],
    "answer":"D"
      }

    扰动样例

    {
    "question":"舌骨的胚胎起源是什么?"
    "choices":["第一咽弓","第一和第二咽弓","第二咽弓","第二和第三咽弓"],
    "answer":"E"
    }

鲁棒性指标(RB-index)

针对原始数据集以及不同的扰动数据集我们有AccorgAccdist1Accdist2Accdist3...AccdistTAcc指模型在该数据集下的评测指标,org指原始数据集,dis1...T指不同的扰动数据集)。

在该数据集上的鲁棒性指标计算公式为:

Robustness=1TAccorgΣi=1T(AccorgAccdisti)

鲁棒性指标数值越小说明模型鲁棒性越好,可以为负数(多在NLP中出现)