誤差論によるデータ整理

1. 誤差と有効数字

ある量を測定する場合、いくら測定に注意を払っても、真の値を見いだすことは不可能である。測定値より真値を引いた値を誤差と呼び、次式で表す。

  (1)

また、ある小さな正数

   (2)

を満たすとき、を誤差限界と呼ぶ。このとき、次式が成立する。

   (3)

さて、一般に数値は小数で表されるが、より小さい小数位は無意味であるので、これを適当に処理して有限小数で表す。このようにして残された意味のある数字を有効数字と呼ぶ。

例 測定値、測定誤差(限界)のとき、測定値をどのように表すべきか。

答 題意より真値はの間にある。そこで、小数以下第2位は信頼性があるが、第3位以下は信頼性が無いと見なす。この場合、一般には小数以下第4位を四捨五入して、次のように表す。

 

2. 誤差の伝播と有効数字

測定値を、測定誤差をとするとき、測定値の加減乗除による総合誤差は次式で表される。

加減算では  (4)

乗算では   (5)

除算では  、(の場合) (6)

例 測定値が375.1, 374.8, 375.0, 374.9, 374.7で測定誤差がそれぞれ3のとき総和を求めよ。

答 総和は1874.5、総合誤差は、したがって、真値は1859.51889.5の間にあることになる。したがって、総和はと表す。

 

3. 平均値

ある量を同一の条件のもとで回測定して得られた測定値を全部加えて、その個数で割った値を算術平均値と呼ぶ。

  (7)

 また、精度が異なる条件で回測定して得られた測定値は、その重み(精度誤差)を考慮して整理する。これを重み付き平均値と呼ぶ。

  (8)

われわれが測定を行う場合、その測定値には、ある正しい値があることを暗に仮定しており、実際の測定値はその正しい値と若干の誤差を有すると考えられる。この正しいと予想される値を真の値と呼び、測定値と真の値との差を誤差と呼ぶ。

また、同一条件で同じ測定を何回行っても、測定値はばらついた値をとる。このバラツキの小さい測定を精密な測定といい、バラツキの小さい程度を精密さという。他方、同じ条件で無限回数の測定を行ったと考えた場合の平均値を母平均と称するが、この母平均も真の値とは等しくならず、その差をカタヨリという。試料平均と測定値の差を残差、母平均と測定値との差を偏差といい、それらの関係を図1に示した。

 

 

 

4. 測定値の標準誤差

 個の測定値がどれだけばらついたかを示す数値として、誤差の標準偏差である標準誤差がある。

   (9)

また、標準誤差の逆数にを乗じた値を精度指数という。

   (10)

の値が高い程、精度の良い測定であることを意味する。

 

5. 正規分布

測定値のばらつきは、一般には図2に示すガウスの誤差曲線といわれる確率密度関数により近似され、これを正規分布といい、次式で表される。

            (11) (11)

ここで、:母平均)は誤差、は次式を満たすように、

  (12) (12)

決定された係数であり、は前述した精度指数である。ここで、が等しくが異なる場合は、母平均の値が異なる。すなわち、曲線の方向への平行移動に相当し、が等しくが異なる場合はのまわりのバラツキの違いを表し、が大なるほど母平均のまわりに密集していることを示している。

もし、誤差が正規分布に従うならば、(9)式で定義された標準誤差は、誤差の2乗平均に相当する。なぜならの2乗平均は、

  (13)

上式の分母は1であり、また、とすれば

  (14)

となり(10)式に等しい。

誤差が正規分布に従うとき、誤差がからの間にある確率がちょうどであるようなの値を確率誤差といい、幾何学的には母平均から4等分線までの値に等しい。このときの値は、次式を計算することにより(16)式のように得られる。

   (15)

   (16)

また、測定値の誤差がを越えない確率は

  (17)

となる。たとえば誤差がを越えることは平均して1000回に3回の割合でしか起こらない。このことはを越えるような偏差をもつデータがもし得られたなら、何か特別な理由があるか、また測定上のミスと考えるのが妥当であることを意味している。したがって、このような数値は除外して整理することが良いことを示している。

 

最小2乗法による実験式の導出

最小2乗法の原理

ある現象の規則性を調べるために、2つの変数についての実験を行った結果、ある種の相互関係が得られた場合、これを数式的にあらわしたものが実験式であり、の関数として整理する方法として最小2乗法が用いられる。

 最小2乗法とは残差の2乗の和が最小になるように現象に対し予測された関数のそれぞれの係数を決定する方法であり、残差とは番目のデータに対して予測された関数値と測定されたデータとの差、すなわちである。ゆえに、

(18)

の値が最小になるようにの係数を決定する。

なお、現実には測定データそれぞれの精度が異なることが多く、このような場合にはそれぞれの残差に対して重みを付けなければならない。

 

2.  実験式導出の簡単な例(重み無しの場合)

a)一次関数の場合

が1次関数にあると推定された場合、と置き、残差の2乗の和

(19)

が最小となるように係数を決定する。このためには、

(20)

となればよく、次の2つの式が得られる。

(21)

上式より、次の連立1次方程式(正規方程式)が得られ、これらの解よりが決定される。

(22)

ただし,

(23)

特にと推定される場合には

(24)

となり,比例係数は次のように求められる.

(25)

(26)

 

  1. 二次関数の場合

  が2次関数の関係にあると推定された場合、と置き、次の3つの式が得られる.

(27)

  上式より次の正規方程式が得られ,これらの解よりおよびが決定される.

   (28)

(29)

ただし,

  1. 指数関数および対数関数の場合

  が指数関数あるいは対数関数の関係にあると推定された場合は,両辺の対数をとることにより1次関数の場合と同様の手法を用いる事が出来る.

たとえば,の場合

   (30)

(31)

となり1次関数の場合の方法がそのまま適用出来る.

 

データの整理例

  1. ある量
について12回の測定を行ったところ,第3表のような値が得られたとする.

まず,算術平均[(7)式],および測定値の標準誤差[(9)式]を求めると,

第7番目のデータは3シグマの法則()によって除去すべきであると判断されるので,これを

除いて同様の計算を行うと

また,算術平均の標準誤差は次式で計算される.

となり,結局次のように整理される.

  1. ある材料の引張強さを測定して次のデータを得た.

  

  これらの値から,引張強さの下限を,確率で求めてみよう.

  前と同様の数値処理によって

  

  

  

  を得る.の場合のガウス曲線の積分値が

  

  であるためには,であることが誤差関数表から知られる.

  従って,確率では

  

  であり,下限値は

  

  と見積もられる.