guess_speaker プログラム仕様
テキストファイルから話者を推測し、整理された形式で出力するスクリプト。
このスクリプトは、入力された会話テキストを解析し、OpenAIのGPTモデルとFunction Calling機能を使用して 会話内の話者を識別し、各発言を話者ごとに整理して出力ファイルに保存します。 主に半導体・材料科学分野の講義テキストにおける誤字・誤訳の訂正、改行、話者推測を目的としています。
- ai.guess_speaker.main()[ソース]
スクリプトの主要な処理を実行します。
入力テキストファイルを読み込み、環境変数やコマンドライン引数から設定をロードします。 その後、OpenAIのGPTモデルに対し、Function Callingを使用して話者推測のリクエストを送信します。 GPTからの応答を解析し、話者情報を含む整形されたテキストを標準出力と指定された出力ファイルに保存します。
- ai.guess_speaker.print_speakers(json_str: str)[ソース]
JSON文字列から話者とテキストを抽出し、標準出力に表示します。
与えられたJSON文字列を解析し、会話の各ターン(発言)について 話者名と発言内容を "[話者名]: テキスト" の形式でコンソールに出力します。
- パラメータ:
json_str (str) -- 話者情報と会話ターンを含むJSON形式の文字列。
- 戻り値:
None
- 戻り値の型:
None
- ai.guess_speaker.save_text_to_file(filename: str, content: str)[ソース]
指定された内容をファイルに保存します。
指定されたファイル名でファイルを開き、提供された内容を書き込みます。 書き込みに成功した場合はメッセージを表示し、失敗した場合はエラーメッセージを表示します。