optimize_mup.py 技術ドキュメント

プログラムの動作

optimize_mup.py は、Hall効果測定やその他の実験データ（主に温度$T$に対する移動度$\mu$のデータ）を多項式移動度モデルにフィッティングするためのPythonプログラムです。半導体材料における電荷キャリアの移動度特性を解析し、その温度依存性や複数の散乱メカニズムの寄与を定量的に評価することを目的とします。

主な機能:

データ読み込み: Excelファイル (.xlsx) から実験データ（$V_g$, $V_d$, $I_d$ または $T$, $\mu$など）を読み込みます。
パラメータ初期化: フィッティングパラメータの初期値を設定します。線形回帰 (Linear Regression) やLasso回帰 (Lasso) を用いた初期フィッティングをサポートし、多項式移動度モデルの初期パラメータを推定します。
移動度モデルフィッティング: 複数の物理的散乱メカニズム（KGB、イングレイン、光学フォノン、その他多項式成分）を考慮した移動度モデルに対し、実験データへのフィッティングを行います。tklib.tksci.tkoptimize_flex モジュールが提供する柔軟な最適化機能を利用します。
結果の可視化: フィッティング結果、各散乱メカニズムによる移動度成分、およびその重みを温度の関数としてグラフ表示します。
データ出力: フィッティングされた移動度モデルのパラメータ、各移動度成分の計算結果などをExcelファイルに出力します。

解決する課題: このプログラムは、半導体デバイスや材料の研究開発において、実験的に得られた移動度データから物理的な散乱メカニズムとそのパラメータを抽出し、材料の特性を理解・予測することを支援します。特に、複数の散乱機構が複合的に移動度に影響を与える複雑な系において、それぞれの寄与を分離し定量化するのに役立ちます。

原理

このプログラムは、半導体のキャリア移動度 $\mu$ の温度依存性を、複数の散乱メカニズムに基づくモデルによって表現し、実験データにフィッティングします。一般的なキャリア移動度は、Matthiessenの法則に基づき、様々な散乱機構による移動度の逆数の総和として表現されます。 $$ \frac{1}{\mu_{total}} = \sum_i \frac{1}{\mu_i} $$ ここで $\mu_i$ は各散乱メカニズム（格子散乱、イオン化不純物散乱、界面散乱、粒界散乱など）による移動度です。

optimize_mup.py は、特に以下の移動度成分を考慮したモデルを使用していると推測されます。

KGB散乱 ($\mu_{KGB}$): Grain Boundary (粒界) 散乱に関連する移動度。
Ingrain散乱 ($\mu_{ingrain}$): 結晶粒内での散乱、例えば格子散乱やイオン化不純物散乱などを複合的に含む可能性のある移動度。
光学フォノン散乱 ($\mu_{op}$): 光学フォノンによる散乱移動度。
多項式成分 ($\mu_{pi}$): その他の複合的な散乱や経験的な補正を表現するための多項式または指数関数的な移動度成分。

プログラム内で cmu.cal_mu_list(T_list, Eb, s_phi, Eop, aop, pi, ai, rettype = 'all') が呼び出されており、これは温度 $T$ と複数のモデルパラメータ ($E_b, s_\phi, E_{op}, a_{op}, p_i, a_i$) を入力として、各移動度成分を計算していることを示唆しています。ここで、

$E_b$: 障壁エネルギーに関連するパラメータ。
$s_\phi$: 粒界ポテンシャルに関するパラメータ。
$E_{op}, a_{op}$: 光学フォノン散乱のパラメータ。
$p_i, a_i$: 多項式成分のパラメータ。

フィッティングは、これらのモデルパラメータを調整し、モデルから計算される全移動度 $\mu_{cal}$ が実験的に観測された移動度 $\mu_{obs}$ との誤差を最小化することで行われます。最小化アルゴリズムには、tklib.tksci.tkoptimize_flex モジュールが提供する非線形最適化手法が利用されます。初期フィッティングには sklearn ライブラリの線形回帰やLasso回帰も用いられ、探索空間の効率的な縮小が図られます。

各移動度成分の重みは cmu.cal_weight_list 関数によって計算され、それぞれの散乱メカニズムが全移動度にどの程度寄与しているかを視覚的に評価できます。

必要な非標準ライブラリとインストール方法

このプログラムは、以下の非標準ライブラリに依存しています。

numpy: 数値計算を行うための基本的なライブラリ。
pandas: データ構造とデータ解析ツールを提供するライブラリ。
matplotlib: グラフ描画のためのライブラリ。
scikit-learn: 機械学習ライブラリ。特に LinearRegression と Lasso を使用します。
tklib: プログラム内で多用されているカスタムライブラリ。tkimport, tkutils, tkvariousdata, tkapplication, tkparams, tksci などのサブモジュールを含みます。

tklib 以外のライブラリは、pipコマンドでインストールできます。

pip install numpy pandas matplotlib scikit-learn

tklib のインストールについて: tklib は標準のPythonパッケージインデックス (PyPI) に登録されていないカスタムライブラリです。プログラムのエラーメッセージによると、tklib モジュールはユーザーが明示的に PYTHONPATH に追加するか、または実行ディレクトリ内に適切に配置する必要があります。

具体的な手順としては、tklib の配布元からソースコードを入手し、例えば以下のような方法でPythonがアクセスできるように設定します。

ソースコードの配置: プログラム optimize_mup.py と同じディレクトリ、またはそのサブディレクトリに tklib フォルダを配置します。例えば、optimize_mup.py の隣に tklib フォルダが存在するようにします。
PYTHONPATH の設定: 環境変数 PYTHONPATH に tklib モジュールが含まれるパスを追加します。例えば、tkProg/tklib/python のような構造になっている場合、tkProg ディレクトリのパスを PYTHONPATH に追加します。

# Linux/macOS の場合
export PYTHONPATH="/path/to/tkProg:$PYTHONPATH"

# Windows の場合 (コマンドプロンプト)
set PYTHONPATH="C:\path\to\tkProg;%PYTHONPATH%"

# Windows の場合 (PowerShell)
$env:PYTHONPATH="C:\path\to\tkProg;$env:PYTHONPATH"

上記の $PYTHONPATH に追加するパスは、tklib が含まれるルートディレクトリであり、tklib 自体ではないことに注意してください。

必要な入力ファイル

プログラムは主に以下の種類の入力ファイルを必要とします。

データファイル (Excel形式): --infile 引数で指定される主要な入力データファイルです。Excel (.xlsx) 形式を期待します。 plot_fit 関数内の処理 (df.iloc[:, 0], df.iloc[:, 1], df.iloc[:, 2:]) から、最低でも3列のデータが必要とされます。
- 1列目: $V_G$ (ゲート電圧) または $T$ (温度)
- 2列目: $V_D$ (ドレイン電圧) またはその他の補助的なデータ（オプション）
- 3列目以降: $I_d$ (ドレイン電流) または $\mu$ (移動度) などの測定値
plot_weight 関数の mf.read_input_data とその後の処理 (T_list = xdata_list[0], mu_list = ydata_list[0]) から、温度に対する移動度データの場合、以下の構造を想定できます。

T(K)

mu(cm^2/Vs)

...

250

500

...

275

450

...

300

400

...
設定ファイル (.in, .ini, .prm または .xlsx): プログラムの動作やフィッティングパラメータに関する設定を定義するファイルです。--parameterfile 引数で指定できます。指定しない場合、プログラムが自動的に探索または生成する場合があります。 main 関数冒頭で app.make_config_files(arg_config_file = 'arg_config.xlsx', fit_config_file = 'fit_config.xlsx') が呼ばれていることから、Excel形式の設定ファイルもサポートされます。

設定ファイルには、フィッティングのアルゴリズム、探索範囲、プロットの設定、初期パラメータなどが記述されます。具体的な内容は tkParams クラスと optimize_mup_mf.py モジュールによって定義されます。

生成される出力ファイル

プログラムは、実行モードに応じて以下のファイルを生成します。

ログファイル:
- ファイル名: cfg.logfile (デフォルトは入力ファイル名に基づき {infile_body}-log.txt のようなパス)。
- 内容: プログラムの実行中にコンソールに出力されるメッセージ、エラー、警告などが記録されます。
フィッティング履歴ファイル:
- ファイル名: {infile_body}-history.xlsx (例: data-history.xlsx)。
- 内容: フィッティングの各イテレーションにおけるパラメータ値、誤差などの履歴が記録されます。plot_fit 関数でフィッティング結果を読み込む際に参照されます。
パラメータファイル:
- ファイル名: 設定ファイルとフィッティングパラメータファイルは、mf.save_parameter_files で保存されます。デフォルトは入力ファイル名に基づいて自動生成されるか、指定されたパスに保存されます。例: {infile_body}-fit_params.prm。
- 内容: 最適化されたモデルパラメータ (Eb, s_phi, Eop, aop, pi, ai など) およびフィッティングに関する設定が保存されます。
移動度成分出力ファイル:
- ファイル名: mu_components.xlsx (plot_weight モードで生成)。
- 内容: 温度 $T$ ごとの観測移動度 mu(obs) と、各散乱メカニズム（KGB、Ingrain、光学フォノン、多項式成分）による移動度成分が列挙されます。以下の列を含むExcelファイルが生成されます。 ['T(K)', 'mu(obs)', 'KGB', 'mu,ingrain', 'mu,op'] + [f'mu({p})' for p in pi]
プロット: プログラムはフィッティング結果や移動度成分のグラフをMatplotlibを用いて表示します。これらはインタラクティブなウィンドウで表示され、手動で画像ファイルとして保存することが可能です。

コマンドラインでの使用例 (Usage)

optimize_mup.py は、様々な実行モードと引数をサポートしています。基本的な実行コマンドと引数は以下の通りです。

python optimize_mup.py [mode] [--infile <input_file>] [--parameterfile <config_file>] [options]

主要な引数:

[mode]: 実行する操作を指定します。
- mk_config: デフォルトの設定ファイル (arg_config.xlsx, fit_config.xlsx) を生成します。
- init: フィッティング条件を初期化し、初期パラメータを推定します。
- lfit: 線形回帰による初期フィッティングを実行します。
- lasso: Lasso回帰によるフィッティングを実行します。
- fit: 主なフィッティング処理を実行します。
- plot: 入力データ、フィッティング結果、または移動度成分をプロットします。
  - plot fit <fit_result_file>: フィッティング結果をプロットします。
  - plot weight: 移動度成分とその重みをプロットします。
  - plot mu_T: 移動度の温度依存性をプロットします。
- clean: ログファイルや一時ファイルをクリーンアップします。
- kill: 関連するPythonプロセスを終了させます（注意して使用）。
--infile <input_file>: 測定データが格納されたExcelファイル (.xlsx) を指定します。
--parameterfile <config_file>: フィッティングや実行設定を定義するファイル (.in, .ini, .prm, .xlsx) を指定します。
--daemon: プログラムをデーモン（バックグラウンド）として実行します。
--nohup: HUPシグナルを無視して実行します。
その他のオプション: tklib.tkParams で定義される様々なパラメータをコマンドラインで直接指定できます（例: --fplot 1, --fontsize 14 など）。

コマンドラインでの具体的な使用例

ここでは、一般的なワークフローに沿った具体的な使用例を説明します。

デフォルト設定ファイルの生成: まず、設定ファイルのテンプレートを生成します。
```
python optimize_mup.py mk_config
```
実行結果の説明: このコマンドを実行すると、カレントディレクトリに arg_config.xlsx と fit_config.xlsx というExcelファイルが生成されます。これらのファイルには、コマンドライン引数やフィッティングに関するデフォルトパラメータが含まれており、必要に応じて編集してプログラムの挙動をカスタマイズできます。
フィッティングの実行: 仮に、my_data.xlsx という名前のデータファイル（1列目に温度、2列目以降に移動度データが含まれると仮定）と、先ほど生成した fit_config.xlsx を使用してフィッティングを実行する場合。
```
python optimize_mup.py fit --infile my_data.xlsx --parameterfile fit_config.xlsx
```
実行結果の説明: このコマンドは、my_data.xlsx のデータと fit_config.xlsx の設定に基づいて、移動度モデルのパラメータを最適化します。
- コンソールにはフィッティングの進行状況やパラメータの更新が表示されます。
- my_data-log.txt のようなログファイルが生成され、詳細な実行ログが記録されます。
- my_data-history.xlsx というファイルに、フィッティングの各イテレーションでのパラメータと誤差の履歴が保存されます。
- 最適化されたパラメータは、fit_config.xlsx または別の指定されたパラメータファイルに保存されます。
フィッティング結果と移動度成分のプロット: フィッティングが完了した後、その結果を視覚的に確認します。特に各移動度成分の寄与を確認したい場合は plot weight モードを使用します。
```
python optimize_mup.py plot weight --infile my_data.xlsx --parameterfile fit_config.xlsx
```
実行結果の説明: このコマンドは、my_data.xlsx のデータと、最後にフィッティングで得られたパラメータ（fit_config.xlsx に保存されている、またはプログラム内部で保持されている）を使用して、以下の情報をプロットします。
- 実験データとフィッティングモデルによる移動度の温度依存性。
- KGB、イングレイン、光学フォノン、多項式成分など、各移動度成分の温度依存性。
- 各移動度成分が全体に占める重みの温度依存性。
- 同時に、mu_components.xlsx というExcelファイルが生成され、各温度における観測移動度と計算された各成分移動度が記録されます。
プロットはMatplotlibのウィンドウで表示され、ユーザーはこれを操作したり、画像ファイルとして保存したりできます。

T(K)	mu(cm^2/Vs)	...
250	500	...
275	450	...
300	400	...