numpy.polyfit()を用いた多項式最小二乗法

numpy.polyfit()を用いて多項式最小二乗法、グラフにプロット 04-polynomial-lsq-plot.py

import sys 起動時引数を取得するため、sysモジュールをimport import csv from pprint import pprint from math import sqrt sqrt()を使えるようにmathモジュールからimport import numpy as np from matplotlib import pyplot as plt #============================= # 大域変数の定義 #============================= infile = 'data.csv' fitrange = [0, 10.0] フィッティング範囲を指定する変数 argv = sys.argv sysモジュールを使って起動時引数を取得する print("argv=", argv) 起動時引数 argvの最初の要素 argv[0] はpythonスクリプトのパスであることを確認する。そのため、起動時引数の要素数 len(argv) は 1以上。 if len(argv) >= 2: 起動時引数が与えられると、argvの要素数は2以上になる fitrange[0] = float(argv[1]) 引数が与えられたら、フィッティング範囲下限とする if len(argv) >= 3: fitrange[1] = float(argv[2]) 引数が2つ与えられたら、 2つ目はフィッティング範囲上限とする print("fitting range: ", fitrange) #============================= # csvファイルの読み込み #============================= i = 0 x = [] y = [] with open(infile, "r") as f: reader = csv.reader(f) for row in reader: if i == 0: header = row else: xi = float(row[0]) if fitrange[0] <= xi <= fitrange[1]: xiがフィッティング範囲にあるときのみ,x, yリストに追加 x.append(xi) y.append(float(row[1])) i += 1 print("header:", header) print("x:", x) print("y:", y) #======================================= # numpy.polyfit()による多項式最小二乗 #======================================= print("polynomial fit start:") ret = np.polyfit(x, y, deg = 2, full = True) full = Trueを指定すると、戻り値はいろいろな情報を含んだリストになる print("ret=", ret) 戻り値を確認 ai = ret[0] 戻り値の最初は、最適化したパラメータのリスト residual = sqrt(ret[1][0] / len(x)) 2つ目の戻り値は残差二乗和。解析データが複数の場合もあるので、リストで与えられる。最初の残差二乗和を使って平均平方根に変換。 print(" lsq result: ai=", ai) print(" residual=", residual)#======================================= # グラフをプロット #======================================= xmin = min(x) プロット範囲を決めるため、min(), max()を使って元データの上下限を取得 xmax = max(x) ncal = 100 フィッティング結果を滑らかに表示するためのデータ点数 xstep = (xmax - xmin) / (ncal - 1) フィッティング結果を計算する際のxメッシュ間隔 xc = [] フィッティング結果のx値のリスト yc = [] フィッティング結果のx値のリスト for i in range(ncal): フィッティング結果のプロットデータxc,ycの計算 xi = xmin + i * xstep yi = np.poly1d(ai)(xi) xc.append(xi) yc.append(yi) #元データを〇、線なしでプロット。labelで指定した文字列が凡例 (legend) として使われる plt.plot(x, y, label='raw data', marker = 'o', linestyle = 'None') #フィッティングデータを破線でプロット plt.plot(xc, yc, label='fitted', linestyle = 'dashed') #CSVのheaderの最初をx軸ラベルに設定 plt.xlabel(header[0]) #CSVのheaderの2つ目をy軸ラベルに設定 plt.ylabel(header[1]) #判例をプロットするように指定 plt.legend() plt.show()