機械学習というものを試してみましたその2

開発日記

2022.04.23

概要
ML.NETで画像分類を試してみる
結果（精度比較）
今後

概要

機械学習というものを試してみましたの続きです。
前回はサンプルをほぼそのまま使わせていただいたせいか、精度（文章の画像を文章と判定した数/全数）が85%と満足いくものではありませんでした。
パラメータやアルゴリズム、トレーニングデータの変更などいろいろと精度を上げる方法はありますが、ML.NETを試すことにしました。

ML.NETで画像分類を試してみる

ML.NETはウィザードに従うだけでモデルを作ることができるので、説明は省略します。
前回CUDAをインストールしたのですが、ML.NETではCUDA（バージョン10）が要求され、インストールしたのはバージョン11で使えなかったため、CPUでトレーニングしました。
トレーニングした結果はこんな感じです。
トレーニングデータでの制度は99%のようです。

結果（精度比較）

前回同様、テストデータを用いて「文章の画像を文章と判定した数/全数」及び「文章以外の画像を文章以外と判定した数/全数」が何パーセントかを求めました。

	ML.NET	機械学習（前回）	自分で考えた判定条件
文章	91%	85%	72%
文章以外	97%	99%	98%

今後

前回よりは精度向上しましたが、まだまだ満足できる精度ではありません。
トレーニング結果の「最高の精度:98.66%」との差については、
・精度を求める計算式の違いによるもの
・トレーニングデータとテストデータの違い
が考えられます。
トレーニングデータとテストデータは人力で分けたのですが、分け方に偏りがあったのでしょうか…
トレーニングデータとテストデータの分け直しも考えて進めていきたいと思います。