#https://okumuralab.org/~okumura/python/markitdown.html
#https://self-development.info/markitdown%e5%85%a5%e9%96%80-%e3%82%b7%e3%83%b3%e3%83%97%e3%83%ab%e3%81%a7%e5%8a%b9%e7%8e%87%e7%9a%84%e3%81%aa%e6%96%87%e6%9b%b8%e5%a4%89%e6%8f%9b%e3%83%84%e3%83%bc%e3%83%ab/

#https://blog.beachside.dev/entry/2024/12/17/120000
#画像解析に必要: Azure API
#AOAI_ENDPOINT=xxx
#AOAI_API_KEY =xxxx
#AOAI_API_VERSION=2024-10-21
#AOAI_DEPLOYMENT_CHAT=xxxxx

import os
import sys
from markitdown import MarkItDown
from openai import OpenAI
from dotenv import load_dotenv, find_dotenv


infile = None

if len(sys.argv) > 1: infile = sys.argv[1]


markitdown = MarkItDown()
result = markitdown.convert(infile)
print(result.text_content)



# 環境変数の読み込み
_ = load_dotenv(find_dotenv())
#print("API Key:", os.getenv("OPENAI_API_KEY"))

 
# OpenAIクライアントの初期化
client = OpenAI()
 
# MarkItDownの設定
if ".jpg" in infile.lower(): 
    print("Analyze image file {infile}")
    md = MarkItDown(mlm_client=client, mlm_model="gpt-4o-mini")
#    result = md.convert("japanese.jpg", mlm_prompt="画像情報を抽出してください。")
    result = md.convert("japanese.jpg", mlm_prompt="画像について説明してください。")
#    result = md.convert("japanese.jpg", mlm_prompt="画像からテキストを抽出してください。")
else:
    print("Analyze {infile}")
#    md = MarkItDown(mlm_client=client, mlm_model="gpt-4o-mini")
    md = MarkItDown()
    result = md.convert(infile)

print(result.text_content)
