guess_speaker プログラム仕様

テキストファイルから話者を推測し、整理された形式で出力するスクリプト。

このスクリプトは、入力された会話テキストを解析し、OpenAIのGPTモデルとFunction Calling機能を使用して会話内の話者を識別し、各発言を話者ごとに整理して出力ファイルに保存します。主に半導体・材料科学分野の講義テキストにおける誤字・誤訳の訂正、改行、話者推測を目的としています。

guess_speaker.py 技術ドキュメント

ai.guess_speaker.main()

スクリプトの主要な処理を実行します。

入力テキストファイルを読み込み、環境変数やコマンドライン引数から設定をロードします。その後、OpenAIのGPTモデルに対し、Function Callingを使用して話者推測のリクエストを送信します。 GPTからの応答を解析し、話者情報を含む整形されたテキストを標準出力と指定された出力ファイルに保存します。

ai.guess_speaker.print_speakers(json_str: str)

JSON文字列から話者とテキストを抽出し、標準出力に表示します。

与えられたJSON文字列を解析し、会話の各ターン（発言）について話者名と発言内容を "[話者名]: テキスト" の形式でコンソールに出力します。

パラメータ:: json_str (str) -- 話者情報と会話ターンを含むJSON形式の文字列。
戻り値:: None
戻り値の型:: None

ai.guess_speaker.save_text_to_file(filename: str, content: str)

指定された内容をファイルに保存します。

指定されたファイル名でファイルを開き、提供された内容を書き込みます。書き込みに成功した場合はメッセージを表示し、失敗した場合はエラーメッセージを表示します。

パラメータ:

filename (str) -- 保存するファイルのパス。
content (str) -- ファイルに書き込む内容。

戻り値:

None

戻り値の型:

None

ai.guess_speaker.save_with_speakers(json_str: str, outfile: str)

JSON文字列に含まれる話者ごとの発言をファイルに保存します。

与えられたJSON文字列を解析し、その中の "turns" 配列から各発言を "[話者名]: 発言テキスト" の形式で指定されたファイルに書き出します。

パラメータ:

json_str (str) -- 話者情報と会話ターンを含むJSON形式の文字列。
outfile (str) -- 出力先のファイルパス。

戻り値:

None

戻り値の型:

None

ai.guess_speaker.text_with_speakers(json_str: str)

JSON文字列から話者とテキストを抽出し、整形された単一の文字列として返します。

与えられたJSON文字列を解析し、会話の各ターン（発言）について話者名と発言内容を "[話者名]: テキスト

" の形式で連結し、一つの文字列として返します。

param json_str:

話者情報と会話ターンを含むJSON形式の文字列。

type json_str:

str

returns:

整形された会話テキスト。

rtype:

str