误差及数据处理基础理论知识综述

  计量小编 · 2012-11-07 08:58 · 110097 次点击

前言
由于各行各业有各自的误差理论及数据处理理论，但基础理论都是一致的，大同小异。现就在检验（测量）领域的误差理论及数据处理基础知识进行理论文字上的综述，尝试作一次理论上的探讨，与各位同仁共同学习和提高，如有不妥及错误之处请各位批评指正。
一、误差基础知识
在各种测量领域，我们经常使用一些术语，例如测量误差、测量准确度和测量不确定度等来表示测量结果质量的好坏。现我们从上述三个术语的定义出发，给出这些术语的基本概念，并指出它们之间的差别，以利于正确使用这些术语。
（一）测量结果
测量结果的定义是“由测量所得到的赋予被测量的值”，因此测量结果是通过测量得到的被测量的最佳估计值。由于任何测量都存在缺陷，因而通常测量结果并不等于真值。完整表述测量结果时，必须给出其测量不确定度，必要时还应说明测量所处条件，或影响量的取值范围。以便使用者可以正确地利用该测量结果。
测量结果可能是单次测量的结果，也可能是由多次测量所得。对于前者，测得值就是测量结果；若为多次测量所得，则测得值的算术平均值才是测量结果。因此在给出测量结果时，通常说明它是示值、未修正测量结果或已修正测量结果，同时还应表明它是否为几个值的平均。
测得值，有时也称为观测值，是指从一次观测中由测量仪器或量具的显示装置中所得到的单一值。一般地说，它并不是测量结果。测量结果是指对测得值经过恰当的处理（如按一定的规则确定并剔除测得值中的离群值）、修正（指必须加上由各种原因引起的必要的修正值或乘以必要的修正因子）或经过必要的计算而得到的最后提供给用户的量值。因此测得值或观测值是测量中得到的原始数据，是测量过程的一个中间环节。对于间接测量而言，测得值或观测值往往具有和被测量不同的量纲。而测量结果则是整个测量的最后结果。在不会引起混淆的情况下有时也将测得值称为测量结果。
（二）测量结果误差
1、测量误差的定义
测量误差的定义是：测量结果减去被测量的真值。
注：
真值从理论上说，样品中某一组分的含量必然有一个客观存在的真实数值，称之为“真实值”或“真值”。用“μ”表示。但实际上，对于客观存在的真值，人们不可能精确的知道，只能随着测量技术的不断进步而逐渐接近真值。实际工作中，往往用“标准值”代替“真值”。
标准值采用多种可靠的分析方法、由具有丰富经验的分析人员经过反复多次测定得出的结果平均值，是一个比较准确的结果。实际工作中一般用标准值代替真值。例如原子量、物理化学常数：阿佛伽得罗常数为6.02×10等。与我们实验相关的是将纯物质中元素的理论含量作为真实值。
（1）由于真值不能确定，实际上用的是约定真值。
（2）当有必要与相对误差相区别时，此术语有时称为测量的绝对误差。注意不要与误差的绝对值相混淆，后者为误差的模。
根据误差的定义，测量误差是测量结果与被测量真值之差。一个量的真值，是在被观测时本身所具有的真实大小，只有完善的测量才能得到真值。任何测量都存在缺陷，完善的测量是不存在的，因此真值是一个理想的概念。既然真值无法确切地知道，因此误差也无法确切地知道。故在实际工作中，误差只能用于已知约定真值的情况，但此时还必须考虑约定真值本身的不确定度。
产生误差的原因是测量过程的缺陷，而测量过程的缺陷可能是由各种各样的原因引起的，因此测量结果的误差往往是由多个分量组成的。误差与测量结果有关。而测量结果只有通过测量才能得到，因此误差也只能通过测量得到。通过分析评定的方法是无法得到误差的。对于同一个被测量，当在重复性条件下进行多次测量时，可能得到不同的测量结果，因此这些不同测量结果的误差是不同的。
由定义还可知误差是两个值之差，因此误差表示的是一个差值，而不是区间。当测量结果大于真值时误差为正值，当测量结果小于真值时误差为负值。因此误差既不可能、也不应当以“±”号的形式出现。
测量误差常称为绝对误差，这是为区别于相对误差而言的。相对误差定义为测量误差除以被测量的真值，实际上只能用测量误差除以被测量的约定真值，而在具体工作中则通常用测量结果来代替约定真值得到相对误差。绝对误差的量纲与被测量的量纲相同，而相对误差是无量纲量，或者说其量纲为1。
2、误差的分类
误差按其性质，可以分为系统误差和随机误差两类。
系统误差的定义为：
在重复性条件下，对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。
注：
（1）如真值一样，系统误差及其原因不能完全获知。
（2）对测量仪器而言，其系统误差也称为测量仪器的偏移。
a.系统误差
由定义可知，由于系统误差仅与无限多次测量结果的平均值有关，而与在重复性条件下得到的不同测量结果无关。因此，在重复性条件下得到的不同测量结果应该具有相同的系统误差。
由于系统误差和真值有关，而真值是无法确切知道的，只能用约定真值代替，因而可能得到的只是系统误差的估计值，并具有一定的不确定度。由于误差等于负的修正值，因此系统误差的不确定度就是修正值的不确定度。
不宜按过去的说法将系统误差分成已定系统误差和未定系统误差。也不宜说未定系统误差按随机误差处理。未定系统误差其实是不存在的，过去所说的未定系统误差从本质上说并不是误差，而是不确定度。
系统误差一般来源于影响量，它对测量结果的影响已经被识别并可以定量地进行估算。这种影响称之为“系统效应”。若该效应比较显著，也就是说如果系统误差比较大，则可在测量结果上加上修正值而予以补偿，得到修正后的测量结果。
b.随机误差
随机误差的定义为：测量结果与在重复性条件下，对同一被测量进行无限多次测量所得结果的平均值之差。
注：
（1）随机误差等于误差减去系统误差。
（2）因为测量只能进行有限次数，故可能确定的只是随机误差的估计值。
在无限多次测量结果的平均值中，已经不含有随机误差分量，故其只存在系统误差。由于测量不可能进行无限多次，因而在测量结果中随机误差和系统误差分量都存在。在重复性条件下得到的不同测量结果具有不同的随机误差，但有相同的系统误差。
1993年前，随机误差被定义为在同一量的多次测量过程中，以不可预知方式变化的测量误差分量。这里所谓的不可预知分量是指在相同测量条件下的多次测量中，误差的符号及其绝对值变化不定的分量。其大小用多次重复测量结果的实验标准差表示。
1993年后，随机误差是按其本质来定义的。但由于该定义中涉及无限多次测量所得结果的平均值，因此与系统误差一样，能确定的同样只是随机误差的估计值。随机误差一般来源于影响量的随机变化，故称之为“随机效应”。正是这种随机效应导致了测量结果的分散性。
就单个测量结果而言，随机误差的符号和绝对值是不可预知的。但就相同条件下多次测量结果而言，其总体上仍存在一定的规律性，称为统计规律性。

 误差, 误差, 数据处理, 基础理论, 知识, 综述

5 条回复

计量小编 2012-11-07 09:01: 三、在实际工作中如何提高准确度：
1. 减少测量误差
测定过程中要进行重量及体积的测定，为保证检验分析结果的准确度，就必须减少测量误差。例：在重量和容量滴定分析中，称量是最关键的第一步，应减少称量误差。称量相对误差＜0.1%。一般的分析天平的称量误差为±0.0001克，试样重量称量时必须等于或大于0.2克，才能保证相对误差在0.1%以内。使用的玻璃仪器应是：容量瓶、移液管、滴定管等精度较高的定量玻璃仪器。
2. 增加平行测定次数，减少随机误差
增加平行测定次数，可以减少随机误差，如测定次数过多，并没有多大的意义，反而增加自己的工作量，在实际检测分析工作中，平行测定4次左右即可达到目的。
3. 消除测定过程中的系统误差
（一）、检查方法：
(1)对照试验：选用组成与试样相近的标准试样进行测定，测定结果与标准值作统计处理，判断有无系统误差。
(2)比较试验：用标准方法和所选方法同时测定某一试样，测定结果做统计检验，判断有无系统误差。
(3)回收试验：称取等量试样两份，在其中一份试样中加入已知量的待测组分，平行进行两份试样测定，由加入被测组分量是否定量回收，判断有无系统误差。
（二）、消除方法
(1)做空白实验：在不加试样的情况下，按试样分析步骤和条件进行分析实验，所得结果为空白值，从试样测定结果中扣除。可以消除试剂、蒸馏水和容器引入的杂质。
(2)校准仪器：对砝码、移液管等进行校准，消除仪器引起的系统误差。
(3)引用其它方法校正。

计量小编 2012-11-07 09:00: 二、数据处理
1、有效数字和数值修约
（1）有效数字
0,1,2,3,4,5,6,7,8,9这些数码叫数字，一个以上的数字组合构成一个数值。
在一个数值中每个数字所占位置叫数位，小数点后的第一位叫十分位，以下依次为百分位、千分位••••；小数点前的第一位叫个位，其前位依次为十位、百位、千位••••。一个数值中每个数位上的数字都应是有效的，只有末位数允许是估计数字，但其波动辐度不得大于±1。例如末位数字为5时可能是4 或6，而其余的各个数字都是可信的数字（定位的0例外）。
表达一个数值中由几个数字组成的，叫有效数字位数。位数多少，除了反映量值的大小之外，在分析领域中还反映该数值的准确程度。例如0.6705g草酸钠，这个数值在量值上为0.6～0.7g之间，在准确程度上，可信数字截取在千分位上的0，在万分位的数字5是可疑的，但其波动范围小于0.000 2g。数码“0”的作用变化比较多，一个数值中“0”是否为有效数字，要根据“0”的位置及其前后的数字状况而定。常见的有以下四种情况：
①位于非“0”数字之间的“0”，如2.005，1.025两个数值中的三个“0”都是有效数字。
②位于非“0”数字后面的一切“0”都是有效数字（全整数尾部“0”除外），
如2.250 0，1.025 0。
③前面不具非零数字的“0”，如0.002 5中的三个“0”都不是有效数字，只起定位作用。
④整数中最后的“0”可以是有效数字，也可以不是。例如用普通天平称取1.5g试剂，若必须用mg表示，则要写成1 500mg，此数值中最后两个“0”从表观上是有效数字，但实际上不是，因为粗天平不能达到如此高的准确度。为了避免误解，可用指数形式表示，上例可记为1.5×103mg，或记为1 500mg±100mg这便明白地表示出只有两位有效数字。
（2）数据的原始记录
数值的有效数字的位数是反映其准确程度的主要标志。为了确保数据应有的准确度，从正确地记录原始数据开始，对任何一个有计算意义的数据都要审慎地估量，正确地记载有效数字的位数。
例如50 ml滴定管的最小分度值为0.1ml，又因为允许增加一位估计数字，可以记录到两位小数，如12.34ml。记下这一数值表明十分位上的3是刻度指示值，确切可信；百分位的4则是估计判读的，是可疑数字，并知其波动范围为0.02ml，
其相对误差为（0.02/12.34）×100%=0.16%。若在原始记录中仅记为12.3ml，则表示可能产生1.6％的相对误差。由于原始记录不合理致使数据的准确度下降一个数量级。但也不可能任意增加有效数字的位数。如前例记成12.340则是明显失真，因为不可能估计出两位数字。原始记录的有效数字位数，即不可少，也不可多。记取的原则是根据仪器、仪表指示的最小分度值如实记录并允许增加一位估计数字。
实验室通用的计量仪表可记取的位数如下：万分之一天平小数点后第四位即万分位。上皿天平小数点后第二位即百分位。分光光度计吸收值记到小数点后第三位即千分位。玻璃量器记取的有效数字位数须根据量器的允许误差和读数误差决定。
如：一等无分度吸管（移液管）2～50ml的容量记取的准确容量应为保留小数点后两位，100ml的记取小数点后一位；一等量入式量瓶，容量10～50ml的记取准确容量应为保留小数点后两位，100～2 000ml 的应为保留小数点后一位。在一系列操作中，使用多种计量仪器时，有效数字以最少的一种计量仪器的位数表示。
（3）表示精密度的有效数字根据分析方法和待测物的浓度不同，一般只取1～2位有效数字。
（4）分析结果有效数字所能达到的位数不能超过方法最低检测质量浓度的有效位数所能达到的位数。例如，一个方法的最低检测质量浓度为0.02mg/L，则分析结果报0.088mg/L就不合理，应报0.09mg/L。
（5）校准曲线相关系数只舍不入，保留到小数点后出现非9的一位，如0.999 89时取值为0.999 8。如果小数点后都是9时，最多保留小数点后4位。校准曲线斜率b的有效位数，应与自变量x的有效数字位数相等，或多比x多保留一位。截距a的最后一位数，则和因变量y数值的最后一位取齐，或最多比y多保留一位数。
（6）近似计算规则
为了确保最终结果的数值中只包含有效数字（定位的“0”例外），在运算中要遵守下列原则：
①加减运算
最终计算结果中保留的小数点有效位数，应与参加运算的数值中小数位数最少者相同。
例：
11.14＋5.912=17.052 25→17.05
11.14－5.912 25＝5.227 75→5.23
上例最终结果只能保留两位小数，因为11.14的末位数字4 本身就不可信，其后的数字则更不可信。
②乘除运算
得数经修约后，保留的有效数字位数应与参与运算的几个数值中有效数字位数最少者相同。
③对数运算
对数的有效数字位数应和原数（真数）的相同。
④平方、立方、开方计算结果的有效数字位数应和原数的相同。
⑤π、е等的有效位数，须参照与之相关的数据决定保留的位数。
⑥来自一个正态总体的一组数据，多于4个时，其平均值的有效数字位数可比原数的增加一位。
⑦用于表示方法或分析结果精密度的标准差，其有效数字的位数一般只取一位，当测定次数很多时可取两位，且最多只能取两位。
⑧报告分析结果有效数字位数，应根据分析方法的精密度即标准差的大小决定。通常可取四分之一个标准差的首数所在位数，应为分析结果的尾数。例如某一测定结果为25.352，标准差为1.4，四分之一标准差为0.35，其首位数字所在数位是十分位，即定为该结果的末位，即报为25.4。
（7）数值修约
数值修约原则：四舍六入五留双。
五后面完全为零的五舍弃，五前面的双数留下；五后面不完全为零的五就往前进一。修约时须一次性修约出结果，不得连续进行修约。
2、异常值的统计检验
一组（群）正常的测定数据，应是来自具有一定分布的同一总体；若分析条件发生显著变化，或在实验操作中出现过失，将产生于正常数据有显著性差别的数据，此类数据称为离群数据或异常值。
仅怀疑某一数据可能会歪曲测定结果，但尚未经过检验判定为异常值时，数据为可疑值。
剔除离群数据，会使测定结果更客观；若仅从良好愿望出发，任意删去一些表观差异较大并非离群数据，虽由此得到认为满意的数据，但并不符合客观实际。因此，对可疑数据的取舍，必须参照下述原则处理。
①仔细回顾和复查产生可疑值的试验过程，如果是过失误差，则舍弃。
②如果未发现过失，则要按统计程序检验，决定是否舍弃。
（2）异常值的判断准则
计算的统计量不大于显著性水平α＝0.05的临界值，则可疑数据为正常数据，应保留。
计算的统计量大于α＝0.05的临界值但又不大于α＝0.01的临界值，此可疑数据为偏离数据，可以保留，取中位数代替平均数值。
计算的统计量大于α＝0.01的临界值，此可疑值为异常值，应予剔除，并对剩余数据继续检验，直到数据中无异常值为止。
（3）异常值的检验方法
①Dixon检验法
用于一组测定数据的一致性检验和剔除异常值检验。
②Grubbs检验法
用于多组测定均值的一致性检验和剔除离群值的检验。也适用于实验室内一系列单个测定值的一致性检验。
③Cochran最大方差检验法
用于多组测定值的方差一致性检验和剔除离群方差检验。
检出限（XN）：
分析方法的检出限是指95％概率，能定性区别于零的最低浓度或量。
测定下限（XB）：
是具有给定的概率（如95％），在定量上可检出非零的最低浓度或量。
未检出：
低于检出限（XN）的测定结果。

计量小编 2012-11-07 09:00: 根据定义，测量不确定度是与测量结果相联系的参数，意指测量不确定度是一个与测量结果“在一起”的参数，在测量结果的完整表述中应该包括测量不确定度。
既然测量不确定度是与测量结果相联系的参数，就是说只有测量结果才有不确定度，或者说不是测量结果就没有不确定度。因此一般不用测量不确定度来表示测量仪器的特性，因为没有对测量仪器的不确定度下过定义，只有用测量仪器得到的测量结果才有不确定度。而测量仪器的特性用仪器的示值误差或最大允许误差等术语来描述。一般尽可能不要使用“测量仪器的不确定度”或“计量标准的不确定度”这种说法。
但我们在不少场合仍能经常见到“测量仪器的不确定度”或“计量标准的不确定度”这种说法。这时可以将测量仪器或计量标准的不确定度理解为它们所提供的标准量值的不确定度。测量仪器或计量标准所提供的标准量值是上级部门进行校准或检定时得到的测量结果，因此它应该有不确定度。
当用测量仪器或计量标准对一测量对象进行测量时，测量结果的不确定度可能来自于许多方面。其中有一部分分量来自于测量仪器或计量标准，因此也可以将测量仪器或计量标准的不确定度理解为在测量结果的不确定度中，由测量仪器或计量标准所引入的那部分不确定度分量。因此更确切地说，应该是“测量仪器所引入的不确定度”，而不是“测量仪器的不确定度”。
对于经过校准而已给出的其示值误差的测量仪器，有时也简单地将该示值误差的不确定度叫做测量仪器的不确定度。实际上它们还是测量结果的不确定度，因为示值误差就是对该仪器进行校准时的测量结果。

在测量不确定度的发展历史中，曾将不确定度理解为“表征被测量真值所处范围的一个参数”和“由测量结果给出的被测量估计值的可能误差的度量”。这些在历史上曾经使用过的定义从概念上来说与现有定义并不矛盾，但由于在定义中分别使用了真值和误差这两个理想化的概念，使得该定义变得实际上难以操作。
（五）测量误差和测量不确定度的重要区别
由于过去的“误差”一词使用上的混乱，因此准确地区分误差和不确定度的概率是十分重要的。测量误差和测量不确定度的主要区别如下：
（1）测量误差和测量不确定度两者最根本的区别在于定义上的差别。误差表示测量结果对真值的偏离量，因此它是一个确定的差值，在数轴上表示为一个点。而测量不确定度表示被测量之值的分散性，它以分布区间的半宽度表示，因此在数轴上它表示一个区间。
（2）按出现于测量结果中的规律，误差通常分为随机误差和系统误差两类。随机误差表示测量结果与无限多次测量结果的平均值（也称为总体均值）之差，而系统误差则是无限多次测量结果的平均值与真值之差，因此它们都是对应于无限多次测量的理想概念。由于实际上只能进行有限次测量，因此只能用有限次测量的平均值，即样本均值作为无限多次测量结果平均值的估计值。
也就是说，在实际工作中我们只能得到随机误差和系统误差的估计值。而不确定度是根据对标准不确定度的评定方法不同而分成A类评定和B类评定两类，它们与“随机误差”和“系统误差”的分类之间不存在简单的对应关系。“随机”和“系统”表示两种不同的性质，而“A类”和“B类”表示两种不同的评定方法。
目前，国际上一致认为，为避免误解和混淆，不再使用“随机不确定度”和“系统不确定度”这两个术语（这两个术语在采用不确定度概念的初期，曾被许多人经常使用，并且至今还有不少人在不正确地使用）。在进行测量不确定度评定时，一般不必区分各不确定度分量的性质。若必须要区分时，也应表示为“由随机效应引入的不确定度分量”或“由系统效应引入的不确定度分量”。
（3）误差的概念与真值相联系，而系统误差和随机误差又与无限多次测量的平均值有关，因此它们都是理想化的概念。实际上只能得到它们的估计值，因而误差的可操作性较差。而不确定度则可以根据实验、资料、经验等信息进行评定，从而是可以定量操作的。
（4）根据误差的定义，误差表示两个量的差值。当测量结果大于真值时误差为正值，当测量结果小于真值时误差为负值。因此误差既不应当也不可能以“±”号的形式出现。而根据规定，不确定度以分散性区间的半宽度表示，且恒为正值，故在不确定度之前也不能冠以“±”号。即使不确定度是由方差经开方后得到，也仅取其正值。
（5）误差和不确定度的合成方法不同。误差是一个确定的值，因此对各误差
分量进行合成时，采用代数相加的方法。而不确定度表示一个区间，因此当对应于各不确定度分量的输入量彼此不相关时，用方和根法进行合成（也称为几何相加），否则应考虑加入相关项。
（6）已知系统误差的估计值时，可以对测量结果进行修正，达到已修正的测量结果。修正值即为系统误差的反号。但不能用不确定度对测量结果进行修正。对已修正测量结果进行不确定度评定时，应考虑修正不完善引入的不确定度分量，即应考虑修正值的不确定度。
（7）测量结果的不确定度表示在重复性或复现性条件下被测量之值的分散性，因此测量不确定度仅与测量方法有关、而与具体测得的数值大小无关。此处所述的测量方法应包括测量原理、测量仪器、测量环境条件、测量程序、测量人员、以及数据处理方法等。而根据定义，测量结果的误差仅与测量结果以及真值有关，而与测量方法无关。
例如，用钢板尺测量某一物体的长度，得到测量结果为14.5mm。如果为测量得更为准确而改用卡尺进行测量，并假设得到的测量结果仍为14.5mm。不少人可能会认为由于卡尺的测量准确度较高，而测量误差更小一些。但实际上由于两者的测量结果相同，真值也相同，因此它们的测量误差是相同的。两者的测量不确定度则是不相同的，因为如果分别用两种方法进行多次重复测量的话，它们的测量结果的分散性无疑是不同的。
（8）测量结果的误差和测量结果的不确定度两者在数值上没有确定的关系。
虽然测量误差和测量不确定度都可用来描述测量结果，测量误差是描述测量结果对真值的偏离，而测量不确定度则描述被测量之值的分散性，但两者在数值上并无确定的关系。测量结果可能非常接近于真值，此时其误差很小，但由于对不确定度来源认识不足，评定得到的不确定度可能很大。也可能测量误差实际上较大，但由于分析估计不足，评定得到的不确定度可能很小，例如当存在还未发现的较大误差时。
（9）误差是通过实验测量得到的，而不确定度是通过分析评定得到的。由于误差等于测量结果减去被测量的真值，因此只有在已知约定真值的条件下才能通过测量结果得到误差，因此误差是由测量得到的，而不可能由分析评定得到。不确定度则可以通过分析评定得到，当然有时还得辅以必要的实验测量。
（10）误差和不确定度是两个不同的概念，测量得到的误差肯定不会有不确定度。反之也是一样，评定得到的不确定度可能存在误差。例如，在测量仪器的检定或校准中，主要的目的是给出测量仪器的示值误差。换句话说，示值误差就是检定或校准的测量结果，这时不确定度评定的目的就是要估算出所测得的示值误差的不确定度。反之，评定得到的不确定度也会存在误差，当知道不确定度的约定真值时，就可以得到不确定度的误差。文件《测量不确定度表示指南》（GUM）给出了评定测量不确定度的基本方法，任何领域的测量不确定度评定都应按GUM给出的方法进行。但在某些情况下也可以采用本领域内约定的简化或近似方法来评定测量不确定度。
例如，文件ISO/TS14253-2就给出了几何量测量领域评定测量不确定度的简化
方法。该文件定义用GUM方法评定得到的不确定度为约定真值不确定度，即不确定度的约定真值，而用该文件给出的近似方法评定得到的不确定度称为近似不确定度，因此它与约定真值不确定度之差就是所得测量不确定度的误差。
（11）对观测列进行统计分析得到的实验标准差表示该观测列中任一个被测量估计值的标准不确定度，并不表示被测量估计值的随机误差。
（12）自由度是表示测量不确定度评定可靠程度的指标，它与评定得到的不确定度的相对标准不确定度有关。而误差则没有自由度的概念。
（13）当了解被测量的分布时，可以根据置信概率求出置信区间，而置信区间的半宽度则可以用来表示不确定度，而误差则不存在置信概率的概念。

计量小编 2012-11-07 08:59: （四）测量结果的不确定度
首先要注意定义中“被测量之值”这一说法的含义。一般说来，“被测量之值”可以理解为被测量的真值，但在这里不能直接将“被测量之值”理解为“真值”，因为“真值的分散性”的说法无法理解。由于《通用计量术语及定义》JJF1001-1998中给出“测量结果”的定义为：由测量所得到的赋予被测量的值，将两者进行比较可以发现这里的“被测量之值”似乎应该可以理解为“测量结果”，但它与我们通过测量所得到的“测量结果”仍有差别。
在对被测量进行测量时，最后给出一个测量结果，它是被测量的最佳估计值（可能是单次测量的结果，也可能是重复性条件下多次测量的平均值）。而这里“被测量之值”应理解为许多个测量结果，其中不仅包括通过测量得到的测量结果，还应包括测量中没有得到但又是可能出现的测量结果。
例如，用一台电压表测量某一电压，且电压表读数不加修正值，若对于该测量点电压表的最大允许误差为±1V，用该电压表进行了20次重复测量，则该20个读数的平均值就是测量结果，还可以由它们得到测量结果的分散性。
但“被测量之值”的分散性就不同了，它除了包括测量结果的分散性外，还应包括在受控范围内改变测量条件（例如温度）所可能得到的测量结果，当电压表的示值误差在最大允许误差范围内变化时所可能得到的测量结果，以及所有系统效应对测量结果的影响。
由于后者不可能在“测量结果的分散性”中出现，因此“被测量之值的分散性”应比“测量结果的分散性”大，也包含更多的内容。这就是在定义的注（3）中所说的在分散性中包括那些由系统效应所引起的不确定度分量，而系统效应引入的不确定度分量在测量结果的分散性中并没有反映出来。
根据定义，测量不确定度表示被测量之值的分散性，因此不确定度表示一个区
间，即被测量之值可能的分布区间。而测量误差是一个差值，这是测量不确定度和测量误差的最根本的区别。在数轴上，误差表示为一个“点”，而不确定度则表示为一个“区间”。
测量不确定度是测量者合理赋予给测量结果的，因此测量不确定度将或多或少与评定者有关，例如与评定者的经验，知识范围和认识水平等有关。因此测量不确定度评定将或多或少带有一些主观色彩。定义中的“合理”是指应该考虑各种因素对测量结果的影响所做的修正，特别是测量应处于统计控制状态下，即处于随机控制过程中。也就是说测量应在重复性条件或复现
性条件下进行。
为了表征这种分散性，测量不确定度可以用标准偏差，或标准偏差的倍数，或说明了置信水准区间的半宽度来表示。
当测量不确定度用标准偏差σ表示时，称为标准不确定度，统一规定用小写拉丁字母“u”表示，这是测量不确定度的第一种表示方式。但由于标准偏差所对应的置信水准（也称为置信概率）通常还不够高，在正态分布情况下仅为68.27%，
因此还规定测量不确定度也可以用第二种方式来表示，即可以用标准偏差的倍数kσ来表示。这种不确定度称为扩展不确定度，统一规定用大写拉
丁字母U 表示。于是可得标准不确定度和扩展不确定度之间的关系：
U ＝kσ＝ku （2—1）式中，k 为包含因子（有时也称为覆盖因子）。
扩展不确定度U 表示具有较大置信水准区间的半宽度。包含因子有时也写成kP的形式，它与合成标准不确定度uc（y）相乘后，得到对应于置信水准为p 的扩展不确定度UP＝kP uc（y）。在不确定度评定中，有关各种不确定度的符号均是统一规定的，为避免他人的误解，一般不要自行随便更改。
在实际使用中，往往希望知道测量结果的置信区间，因此还规定测量不确定度也可以用第三种表示方式，即用说明了置信水准的区间的半宽度a 来表示。实际上它也是一种扩展不确定度，当规定的置信水准为p 时，扩展不确定度可以用符号Up表示。
测量不确定度的第二种和第三种表示方式给出的实际上都是扩展不确定度。当已知包含因子k时，扩展不确定度U 是从其中包含多少个（k个，k 即为包含因子）标准不确定度u的角度出发所描述的扩展不确定。而当已知p时，扩展不确定度UP则是从该区间所对应的置信水准p的角度出发来描述的扩展不确定度。
对于前者，已知k而不知道p，后者则正好相反，已知p而不知道k。两者各自分别从不同的角度出发来描述扩展不确定度，因此包含因子k与置信水准p之间应该存在某种函数关系，但它们之间的关系与被测量的概率密度分布有关。也就是说，只有在知道被测量分布的情况下，才可以由k确定p，或由p确定k。
而在测量不确定度评定中，经常会遇到已知置信水准p而需要确定包含因子k的情况，这就是为什么在测量不确定度评定中经常需要考虑各输入量以及被测量分布的原因。而在过去的误差评定中一般不讨论分布问题。JJF1059-1999《测量不确定度评定与表示》规定，当置信水准p为0.99和0.95时，UP可分别简单地以U99和U95表示。
误差可以用绝对误差和相对误差两种形式来表示，不确定度也同样可以有绝对不确定度和相对不确定度两种形式。绝对形式表示的不确定度与被测量有相同的量纲。相对形式表示的不确定度，其量纲为1，或称为无量纲。绝对不确定度常简称为不确定度，而相对不确定度则往往在其不确定度符号“U”或“u”上加上脚标“rel”以示区别。被测量x的标准不确定度u（x）和相对标准不确定度urel（x）之间的关系为：
u（x）
urel（x）＝—— （2—2）
x
扩展不确定度也同样可以有绝对和相对两种形式，绝对扩展不确定U（x）和相对扩展不确定度Urel（x）之间也有同样关系：
U（x）
Urel（x）＝—— （2—3）
x
式中（2—2）和式（2—3）中的x应取其真值。由于真值无法知道，实际上用的是约定真值。而在实际工作中一般常以该量的最佳估计值，即测量结果来代替。
由于式（2—2）和式（2—3）可知，若随机变量x 的值有可能为零，则不能采用相对误差或相对不确定度的表示形式。由于测量结果会受许多因素的影响，因此通常不确定度由多个分量组成。对每一个分量都要评定其标准不确定度。评定方法分为A，B两类。

测量不确定度的A类评定是用对观测列进行统计分析的方法进行的评定，其标准不确定度用实验标准差表征；而测量不确定度的B类评定则是指用不同于对观测列进行统计分析的方法进行的评定。
因此可以说所有与A类评定不同的其他评定方法均称为B类评定，它可以由根据经验或其他信息的假定概率分布估算其不确定度，也以估计的标准偏差表征。所有各不确定度分量的合成称为合成标准不确定度，规定以符号uc表示，它是测量结果的标准偏差的估计值。
由于不论A类评定或B类评定，它们的标准不确定度均以标准偏差表示，因此两
种评定方法得到的不确定度实质上并无区别，只是评定方法不同而已。在对各不确定度分量进行合成得到合成标准不确定度时，两者的合成方法也无区别。因此在进行不确定度评定时，过分认真地讨论每一个不确定度分量究竟属于A类评定或是B类评定是没有必要的。
不少人习惯上将由A类评定和B类评定得到的不确定度分别方便地称为A类不确定度和B类不确定度。这一说法也未尝不可，但不能由此而得到一个不恰当的结论：不确定度分为A类不确定度和B类不确定度两类。对不确定度本身并不分类，每一个分量的标准不确定度都要用标准偏差表示，而所谓的A类和B类仅是为了叙述方便起见而对其按评定方法进行的分类，而不是对不确定度本身的分类。

计量小编 2012-11-07 08:58: 随机误差的统计规律性主要表现在下述三方面：
随机误差的统计规律性：
（1）对称性
对绝对值相等而符号相反的误差，出现的次数大致相等。也就是说，测得值以其算术平均值为中心对称地分布。
随机误差的统计规律性：
（2）有界性
指测得值的随机误差的绝对值不会超过一定的界限。也就是说，不会出现绝对值很大的随机误差。
随机误差的统计规律性：
（3）单峰性
所有的测得值以其算术平均值为中心相对集中地分布，绝对值小的误差出现的机会大于绝对值大的误差出现的机会。
由于随机变量的数学期望值等于对该随机变量进行无限多次测量的平均值，因此也可以说，随机误差是指测量误差中数学期望值为零的误差分量，而系统误差则是指测量误差中数学期望值不为零的误差分量。
根据定义，误差、系统误差和随机误差均表示两个量值之差，因此随机误差和系统误差也都应该具有确定的符号，同样也不应当以“±”号的形式出现。由于随机误差和系统误差都是对应于无限多次测量的理想概念，而实际上无法进行无限多次测量，只能用有限次测量的结果作为无限多次测量结果的估计值，因此可以确定的只是随机误差和系统误差的估计值。
误差经常用于已知约定真值的情况，例如经常用示值误差来表示测量仪器的特性。
3、误差、随机误差和系统误差之间的关系由误差、随机误差和系统误差的定义可知：
误差= 测量结果-真值=（测量结果-总体均值）+（总体均值-真值）= 随机误差+系统误差
或测量结果= 真值+误差= 真值+随机误差+系统误差
由此可知，误差等于随机误差和系统误差的代数和。既然误差是一个差值，因此任何误差的合成，不论随机误差或系统误差，都应该采用代数相加的方法。这一结论与我们过去常用的误差合成方法不一致。过去在对随机误差进行合成时，通常都采用方和根法。两者的区别在于随机误差定义的改变。
1993年之前，随机误差用多次重复测量结果的实验标准差表示，因此当时随机误差用一个“区间”来表示。1993年国际上对“随机误差”一词的定义作了原则性修改后，随机误差表示测量结果与多次测量所得结果的平均值（即总体均值）之差，因此随机误差已不再表示一个“区间”，而是表示测量结果与总体均值之差。并且测量结果是真值、系统误差和随机误差三者的代数和。
由于误差、随机误差和系统误差都是两个量值之差，因此不论它们是否能确切地知道，任何误差的合成都应该采用代数相加的方法，而不能采用过去常用的方和根法合成。
过去人们常常会误用“误差”这一术语。例如，通过经典的误差分析方法给出的结果往往是被测量值不能确定的范围，而不是真正的误差值。按定义，误差与测量结果有关，即不同的测量结果有不同的误差。合理赋予被测量的每一个值各有其自己的误差，而并不存在一个共同的误差。
也有人将误差分为四类：系统误差、随机误差、漂移和粗差。但主要还是前面两类。漂移是由不受控的影响量的系统影响所引起的，常常表现为时间效应或磨损效应。因此漂移可以用单位时间内的变化或使用一定次数后的变化来表示。从实质上来说，漂移是一种随时间或随使用次数而变化的系统误差。
测量结果中还可能存在粗差，粗差是由测量过程中不可重复的突发事件所引起的。电子噪声或机械噪声可以引起粗差。产生粗差的另一个经常出现的原因是操作人员在读数和书写方面的疏忽以及错误地使用测量设备。必须将粗差和其他几种误差相区分，粗差是不可能再进一步描述的。粗差既不可能被定量地描述，也不能成为测量不确定度的一个分量。
由于粗差的存在，使测量结果中可能存在异常值。在计算测量结果和进行测量不确定度评定之前，必须剔除测量结果中的异常值。在测量过程中，如果发现某个测量条件不符合要求，或者出现了可能影响到测量结果的突发事件，可以立即将该数据从原始记录中剔除，并记录下剔除原因。在计算测量结果和进行不确定度评定时，异常值的剔除应通过对数据作适当的检验，并按一定的规则进行。
无论随机误差或系统误差，所有的误差从本质上来说均是系统性的。如果发现某一误差是非系统性的，则主要是因为产生误差的原因没有找到，或是对误差的分辨能力不够所致，因此，可以说随机误差是由不受控的随机影响量所引起的。由随机效应引入的不确定度可以用标准偏差以及分布类型来表示。多次测量结果的平均值常常作为估计系统误差的基础。
测量结果的准确度常常简称为测量准确度，其定义为：测量结果与被测量的真值之间的一致程度。
注：
（1）不要用术语精密度代替准确度。
（2）准确度是一个定性的概念。

（三）测量结果的准确度
由于无法知道真值的确切大小，因此准确度被定义为测量结果与被测量的真值之间的接近程度，为了获得可靠的结果，在实际工作中人们总是在相同条件下，多测定几次，然后求平均值，作为测定值。一般把这几次在相同条件下的测定叫平行测定。如果这几个数据相互比较接近，就说明分析的精密度高。精密度是保证准确度的先决条件;高精密度不一定保证高准确度。于是准确度就成为一个定性的概念。既然准确度是一个定性的概念，就不应该将其定量化。
所谓“定性”，意味着可以说：准确度为0.25级、准确度为3等及准确度符合××标准等。也就是说，准确度只是指出符合某一等别或级别的技术指标要求，或符合某技术规范的要求。不应该用具体的量值来表示准确度，例如，尽量不使用下述各种表示方式：准确度为0.25%、16mg、≤16mg及±16mg等，即准确度后不要和具体数值连用。
既然准确度是一个定性的概念，因此准确度不是一个量。它是不能作为一个量来进行运算的。
定义还指出，不要用精密度来代替准确度。其原因是过去在不同领域中对“精密度”这一术语的用法各不相同而无法统一，因此在《国际通用计量学基本术语》（VIM）第二版中未对术语“精密度”下定义。既然没有定义，那就无法准确地使用这一术语。
过去常将精密度理解为反映在规定条件下各独立测量结果间的分散性。多次测量结果间的分散性可能很小，但并不表明测得值与真值之间的差值一定很小，也就是说，其误差不一定很小。
至今，在化学分析领域中“精密度”这一术语仍在经常采用。在该领域中，“精密度”一词定义为：在规定条件下所获得的测量结果之间的一致程度。由定义可知，精密度只取决于随机误差的分布，而与真值或约定真值无关。精密度用测量结果的实验标准差来定量表示。较大的标准偏差表示较小的精密度。
因此可以说实际上是用“不精密度”这一术语来定量表示“精密度”。由于在VIM第二版中和《通用计量术语及定义》JJF1001-1998中没有给出“精密度”这一术语的定义，因此建议除化学分析领域以外，一般不要使用“精密度”这一术语。
过去习惯使用的“精度”和“精密度”也同样不要再定量使用，因为在前述两个文件中也没有给出它们的定义。
测量结果的不确定度的定义为：表征合理地赋予被测量之值的分散性，与测量
结果相联系的参数。
注：
（1）此参数可以是诸如标准偏差或其倍数，或说明了置信水准的区间的半宽度。
（2）测量不确定度由多个分量组成。其中一些分量可用测量列结果的统计分布估算，并用实验标准偏差表征。另一些分量则可用基于其它信息的假定概率分布估算，也可用标准偏差表征。
（3）测量结果应理解为被测量之值的最佳估计，而所有的不确定度分量均贡献给了分散性，包括那些由系统效应引起的（如，与修正值和参考测量标准有关的）分量。

误差及数据处理基础理论知识综述

5 条回复

 回复

 今日话题

 最新文章

 热门话题

关于仪器网

仪器信息网

仪器计量技术

服务条款

官方客服