画像認識モデルを訓練するために必要となる画像データを準備します。
こちらのデータセットにアノテーションを行うことによって訓練データとしてモデルの訓練が可能になります。
高精度の画像認識モデルを作成する場合、1クラスにつき数百~数千の画像データが必要になるためデータ拡張技術と呼ばれる手法を用いて1つの画像から複数の画像を生み出すことが可能です。
画像の中にあるオブジェクトに対して正解ラベルを付与することによって、AIを訓練させるためのデータセット(訓練データ)を作成します。
ProLabelでは、自社で訓練されたAIモデルを搭載し、画像の中にあるオブジェクトを自動で検出しラベル付けを行います。
アノテーションに使用した画像ファイルデータとアノテーション情報を保存したファイルを用いてあたなの画像認識モデルを訓練します。
(訓練したいモデルによって必要なファイルの形式が異なるためモデルのフォーマットにそって、txt,xml,csv,jsonの中から出力してください。)
プロジェクト単位でのアノテーション管理が可能です。新規プロジェクトを作成し自動アノテーションしたいクラスを設定した後に、画像ファイルをアップロードしてください。プロジェクトが作成された後でも画像ファイルの追加やプロジェクトとマージが可能です。
ステップ1でアップロードされた画像の中から自動でオブジェクトを検出し、バウンディングボックスの付与とラベル付けが行われます。アノテーション確認モードやバウンディングボックスのハイライト機能などを用いてアノテーション漏れががないかを確認・修正を行います。プロジェクトの中断、保存も可能ですのでいつでも効率よくアノテーション作業を行うことができます。
アノテーションデータの出力フォーマットはtxt,xml,csv,jsonに対応しています。訓練したモデルによって必要なファイルの形式が異なるため、モデルのフォーマットにそって出力してください。
データ拡張とは、画像に対して反転やぼかしなど特定の処理を加えて、新たにデータセットに追加することで訓練データとして用いる画像数を増やすことです。既存の画像データセットへのラベル付けが終了後、ProLabelのデータ拡張機能を使用することで簡単にデータセットの枚数を増やすことができます。データ拡張を用いて新たに追加された画像はラベル情報を保存しており、自動ラベリングが行われるため、増えた画像に対してのアノテーション作業が不要になります。
お問い合わせはこちら