・Microsoft には Azure AutoML 、Googleには Cloud auto ML と呼ばれる同様のツールがサービス提供されているが、こちらは従量課金の有料サービスであるため、モデルを作成する際はもとより、出来上がったモデルを利用する際にも費用が掛かる。PyCaretは無料。
・これらをAutoML(自動マシーンラーニング、自動機械学習)という。
https://cloud-ace.jp/column/detail318/
・PyCaretの公式ドキュメントはこちら
https://pycaret.gitbook.io/docs/
使うメソッド
・元となるデータを設定
from pycaret.datasets import get_data
dataset = get_data('diamond')
・環境をセットアップする
from pycaret.regression import *
exp_reg101 = setup(dataset, target = 'Price')
・アルゴリズムを比較する
compare_models()
・モデルを作成する(比較した結果良かったものを引数で指定)
model = create_model('et')
・モデルを調整する
tuned_model = tune_model(model)
・モデルをプロットする
plot_model(tuned_model)
・モデルを完成させる (= finalize)
final_model = finalize_model(tuned_model)
・作成したモデルを使用して予測する
unseen_predictions = predict_model(final_model, data=data_unseen)
unseen_predictions.head()
from pycaret.utils import check_metric
check_metric(unseen_predictions.Price, unseen_predictions.Label, 'R2')
・モデルをセーブする
save_model(final_model,'Final Test Model 20220802')
・モデルをロードする
saved_model = load_model('Final Test Model 20220802')
・ロードしたモデルを利用する
new_prediction = predict_model(saved_model, data=data_unseen)
オススメ導入資料
https://www.youtube.com/watch?v=35pS0YgMsAo
・Jinja2が必要というエラーが発生した場合の対処
https://qiita.com/hasegatk/items/c835ba6243efbb4e53d2
参考
https://resanaplaza.com/2022/03/20/%E3%80%90%E3%82%84%E3%81%95%E3%81%97%E3%81%8F%E5%9B%B3%E8%A7%A3%E3%80%91pycaret%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9%EF%BC%88windows%EF%BC%89/
https://rightcode.co.jp/blog/information-technology/machine-learning-automation-pycaret
https://openstandia.jp/oss_info/pycaret/
https://aiacademy.jp/media/?p=954
https://torch.classcat.com/2020/12/18/pycaret-2-2-tutorials-regression-reg101/