AI研究所 - AI(人工知能)に脅かされないために、AI(人工知能)を作る側の人間になる -

HOME  >  商用利用可能な機械学習用教師データセットの共同販売開始へ!

公開日:2020.08.25 

商用利用可能な機械学習用教師データセットの共同販売開始へ!

AI(人工知能)のニュース

こんにちは!AI研究所の見習い研究員Chisatoです。
本日は、AIテックベンチャーのグローバルウォーカーズ社と画像素材のPIXTAの、機械学習用教師データセットにおける業務提携に関するtopicsです。

グローバルウォーカーズ株式会社とピクスタ株式会社は、機械学習用教師データ作成サービスの販売強化のため、ピクスタ社が運営するコンテンツ素材のマーケットプレイス「PIXTA」にて保有する人物を主とした画像データを、グローバルウォーカーズの提供する機械学習・深層学習向け教師データ作成サービス「Annotation One」にて、クライアント企業の要望に合わせた教師データセットとして作成し、販売開始しました。

グローバルウォーカーズは、ディープラーニング(深層学習)・画像処理技術の領域で高度な技術と知見を保有しているAIテックベンチャーです。研究開発型のAIスタートアップとして、画像処理技術・3D姿勢推定・AI-OCRなど多岐にわたり自社研究開発をおこない、ロボティクスやIoTへのAI導入といったクライアント企業のプロジェクト受託開発も手掛けています。
一方、PIXTAはプロ・アマチュア問わず誰もが自ら制作した写真・イラスト・動画・音楽をインターネット上で売買できるデジタル素材のマーケットプレイスとして 2006 年 5 月に開設されました。あらゆるジャンル、媒体のクリエイティブを支える豊富なイメージ画像・動画・音楽を取り揃え、日本を中心に、アジア各国の生活・文化にそった豊富なアジア素材が特徴です。

業務提携について

今回の業務提携により、クライアント企業に対して、要望にあった人物を主とした「画像収集」とアノテーション(タグ付け)された「画像データ」をまとめて短期間で提供することができます。また、商用利用可能な人物画像(特に日本人)の収集に課題をもたれている多くのクライアント企業にとっては有効な教師データを短期間で収集することができ、機械学習・深層学習の開発スピードの向上につなげることが可能になります。
特に、日本人の顔画像においては肖像権の観点から、インターネット上にある人物画像などを使って機械学習・深層学習の教師データにすることが難しく、また教師データとして利用できるほどのデータ数をあつめることも難しい現状です。「PIXTA」の画像は数多くの日本人の顔画像を保有し商用利用が可能なため、これらの画像にグローバルウォーカーズによるアノテーションデータを付与することで効率的に画像収集し教師データとすることが可能になります。クライアント企業は教師データとして利用したい画像収集を依頼すれば、短期間で教師データを取得することができるようになります。

また、AI開発プロジェクトにおいて継続的なアノテーション作業が必要なクライアント企業向けに、専用のアノテータ―を利用いただくことが可能なラボ型アノテーション「GWラボ」も用意しています。
「GWラボ」はグローバルウォーカーズのミャンマー法人で運営しており、安価かつ熟練したアノテータ―による高品質なアノテーション作業を提供します。

機械学習用教師データ作成サービス 概要

ピクスタ社が運営する「PIXTA」が保有する人物を主とした画像素材を機械学習・深層学習用教師データセットとして提供します。グローバルウォーカーズは自社で運営する教師データ作成のためのクラウドサービス「Annotation One」を利用し、ピクスタ社が提供する画像素材に、アノテーション(タグ付け作業)を施しクライアント企業へ納品します。
今後は、汎用的に利用可能な両社オリジナルのデータセットのパッケージ展開や、「PIXTA」の特徴でもある人物画像を用いて、自動運転、スポーツ、医療ヘルスケア、外観検査など多岐にわたるパッケージ展開も視野に検討中です。

アノテーションイメージ

アノテーションしたデータを、ピクスタ社「PIXTA」よりご紹介します。

外接矩形用データ(Bounding Box)

対象となる物体に対して外接矩形の情報を付与します。人物の場合は、顔・体・全身などのクラスごとに矩形を付与することができます。機械学習では幅広い分野で利用されている手法です。自動運転、セキュリティ、製品の外観検査、農業、WEB上での画像による検索など多岐にわたります。

領域分割用データ(Semantic Segmentation)

1画素単位でどの物体のカテゴリーの範囲であるのかを取得するためのアノテーション手法です。
自動運転、ロボティクス、医療診断画像など人体検知のほか、工業製品検査、土木建設現場などの高精細な情報を必要とする分野で多く利用されています。

姿勢推定用データ(Key Point)

人物の骨格に合わせてポイントをアノテーションします。スポーツ・医療・ヘルスケア・駅空港などの分野で効果が期待されます。

グローバルウォーカーズとPIXTAによる、機械学習・深層学習用データセットの共同制作・販売サービスに注目です!


参考になったら「いいね!」と「シェア」をお願いします!!

このエントリーをはてなブックマークに追加
AI(人工知能)セミナー開催中