概要
機械学習というものを試してみましたの続きです。
前回はサンプルをほぼそのまま使わせていただいたせいか、精度(文章の画像を文章と判定した数/全数)が85%と満足いくものではありませんでした。
パラメータやアルゴリズム、トレーニングデータの変更などいろいろと精度を上げる方法はありますが、ML.NETを試すことにしました。
ML.NETで画像分類を試してみる
ML.NETはウィザードに従うだけでモデルを作ることができるので、説明は省略します。
前回CUDAをインストールしたのですが、ML.NETではCUDA(バージョン10)が要求され、インストールしたのはバージョン11で使えなかったため、CPUでトレーニングしました。
トレーニングした結果はこんな感じです。
トレーニングデータでの制度は99%のようです。
結果(精度比較)
前回同様、テストデータを用いて「文章の画像を文章と判定した数/全数」及び「文章以外の画像を文章以外と判定した数/全数」が何パーセントかを求めました。
ML.NET | 機械学習(前回) | 自分で考えた判定条件 | |
文章 | 91% | 85% | 72% |
文章以外 | 97% | 99% | 98% |
今後
前回よりは精度向上しましたが、まだまだ満足できる精度ではありません。
トレーニング結果の「最高の精度:98.66%」との差については、
・精度を求める計算式の違いによるもの
・トレーニングデータとテストデータの違い
が考えられます。
トレーニングデータとテストデータは人力で分けたのですが、分け方に偏りがあったのでしょうか…
トレーニングデータとテストデータの分け直しも考えて進めていきたいと思います。
コメント