機械学習というものを試してみました その2

スポンサーリンク

概要

機械学習というものを試してみましたの続きです。
前回はサンプルをほぼそのまま使わせていただいたせいか、精度(文章の画像を文章と判定した数/全数)が85%と満足いくものではありませんでした。
パラメータやアルゴリズム、トレーニングデータの変更などいろいろと精度を上げる方法はありますが、ML.NETを試すことにしました。

ML.NETで画像分類を試してみる

ML.NETはウィザードに従うだけでモデルを作ることができるので、説明は省略します。
前回CUDAをインストールしたのですが、ML.NETではCUDA(バージョン10)が要求され、インストールしたのはバージョン11で使えなかったため、CPUでトレーニングしました。
トレーニングした結果はこんな感じです。
トレーニングデータでの制度は99%のようです。

結果(精度比較)

前回同様、テストデータを用いて「文章の画像を文章と判定した数/全数」及び「文章以外の画像を文章以外と判定した数/全数」が何パーセントかを求めました。

ML.NET機械学習(前回)自分で考えた判定条件
文章91%85%72%
文章以外97%99%98%

今後

前回よりは精度向上しましたが、まだまだ満足できる精度ではありません。
トレーニング結果の「最高の精度:98.66%」との差については、
・精度を求める計算式の違いによるもの
・トレーニングデータとテストデータの違い
が考えられます。
トレーニングデータとテストデータは人力で分けたのですが、分け方に偏りがあったのでしょうか…
トレーニングデータとテストデータの分け直しも考えて進めていきたいと思います。

コメント

タイトルとURLをコピーしました