アノテーションサービス6選!特徴や内容からサービスを徹底比較

こんにちは、AI研究所の松田です。
今回ご紹介していくのは、AIモデル構築において必須の工程であるアノテーションを実施する際に便利な「データアノテーションサービス」です。その中でも、特徴的なアノテーションサービスを6つ厳選し、徹底比較してみました。

実際にアノテーションを実施していくには、作業工数や事業部間の連携、アノテーションルールの作成などさまざまな決定事項を設定していかなくてはなりません。
また、自社の抱えているAI開発プロジェクトを成功に導くためには、高品質かつ十分な量の「教師データ」を集めることも重要となってきます。
現在ではアノテーションサービスを提供する企業も多く、その提供方法も多種多様になっており、データ量が膨大になった場合など自社で賄えきれない部分を補填してくれる頼りになる存在となっています。

そこで、数あるアノテーションサービス企業の中から、独自性や柔軟性のある企業を下記にピックアップしました。これからアノテーションサービスを利用とされる企業など是非ご参考にしてみてください。

アノテーションとは

まずアノテーションとは、AIに指示するためのデータに注釈として言葉を教えてあげることを言います。
画像認識なら画像に「これが人間だ」と記入したり、音声認識なら「これは犬の声」と教えてあげたりすることです。
アノテーションの基本に関しては下記記事でも詳しく紹介しています。

アノテーションとは?やり方や活用事例を元にアノテーションを徹底解説

アノテーションサービス6選

それでは早速そんなアノテーションを手伝ってくれるサービスを6つ紹介していきます!
アノテーションを行ってくれるサービスを比較したい人はぜひ参考にしてください。

アノテーションサービス①株式会社Appen(アッペン)

アノテーションサービス①株式会社Appen(アッペン)

参照:https://appen.bizroad-svc.com/

1996年に設立された株式会社Appenは、オーストラリアに本社を構え、世界各国に9支社の拠点を持つグローバルな企業です。
1000人以上の従業員に加え、100万人以上ものクラウドワーカーで構成されており、経験豊富な「プロジェクトマネージャー」による高品質なサポートも提供できる体制を整えています。

世界中のお客さまに向け、自然言語処理系のデータ生成及びアノテーションを始めあらゆるサービスの提供をしており、その中でも大きな特徴として、「Appenデータアノテーション・プラットフォーム」が挙げられます。

全世界100万人以上からなるクラウドワーカーとアノテーションツールに機械学習を採用するなど、最先端のモデルを組み合わせることにより機械学習プロジェクトに必要なトレーニングデータが作成できるサービスです。
また、トレーニングが必要なデータをプラットフォームにアップロードするだけで、機械学習モデルの正確な情報を作成するために必要なアノテーション・判断・ラベルを用意してくれます。

その他音声データにおいては、170ヵ国・235以上の言語や方言への対応実績が挙げられます。
参照テキストの有無に関わらず、音声収録・文字起こし・自然言語処理・手書き文字認識などに必要なAIモデル精度向上のためのデータ生成・アノテーションを行っています。

全世界に100万人以上ものクラウドワーカーを有しているのは、他の企業にはない特性と言えるでしょう。また、アノテーション工程に機械学習を採用しているため、データを1からつくる必要はなく、アノテーションにおける判断の提案及び編集が容易に行えるのもプロジェクト進行に多大な影響を与えてくれるでしょう。

株式会社Appenの概要

Appenの事業内容やサービスの概要はこちらになります。

住所オーストラリア本社
Level 6, 9 Help Street Chatswood NSW 2067
設立1996年
事業内容アノテーションサービス
実績・グローバルエンタープライズ企業とのプロジェクト実績多数あり(Google・Microsoft・Amazon・Metaなど)
・2021年度BIG Innovation Award受賞
提供サービス・トレーニングデータ(文章・画像・音声・映像・センサー)
・データ収集(画像および映像データ・発話データ・文章データ)
・言語サービス
価格・日本語の音声収録の場合: 1時間の音声収録あたり、スクリプトの提供なしで15,000円が目安。
・画像データ収録の場合: 対象物、収録場所により異なる。1イメージあたり1,000円が目安。

アッペンのサービス詳細はこちら

アノテーションサービス②株式会社ヒューマンサイエンス

アノテーションサービス②株式会社ヒューマンサイエンス
参照:https://www.science.co.jp/annotation/index.html

1985年に設立された翻訳や教育、人材派遣など多様なサービスを展開している株式会社ヒューマンサイエンスが提供している「高精度・セキュリティ重視のアノテーション代行サービス」です。

このサービスの大きな特徴として、4,800万件以上もの教師データのアノテーション実績があり、その中にはGAFAMをはじめとした幅広い企業とのプロジェクト参画があります。

それに伴い他のサービスに引けを取らない自然言語処理、医療支援、自動運転開発、建築などさまざまな分野への柔軟な体制づくりをされています。また、プロジェクトには、専属のプロジェクトマネージャーによるアノテーター教育/研修があり、高品質な教師データの作成を実現しています。

利用しているアノテーションツールの中には「AnnoFab」があり、お客さまのクラウドサービスの利用やIPアドレスの制限など、セキュリティ面に配慮した体制づくりもされています。

そして、リモートワークが普及してきた現在、オンラインやオンサイト、お客様環境への常駐など案件に応じた運用方法でサービスを提供しています。オフショアのアノテーション業務を契約企業に委託しているため、国内と変わらない品質を低コストで提供しています。

今回ご紹介するサービスの中では最も設立年数があり、GAFAM系列との参画などこれまでの実績からも有力な選択肢となりそうです。

株式会社ヒューマンサイエンスの概要

ヒューマンサイエンスの会社概要は下記になります。

住所 〒163-0710
東京都新宿区西新宿2-7-1 小田急第一生命ビル10階
設立1985年3月
事業内容・マニュアル作成
・翻訳
・教育・eラーニング
・AI・アノテーション
・人材派遣
実績・先進的医療機器のAI開発
・自動運転AIの精度向上
・AIアシスタントのユーザーリクエスト理解度向上
提供サービス・自然言語処理・文章生成
・音声認識・意図抽出
・画像アノテーション
・動画アノテーション
・位置情報評価・ルート作成
・ドキュメント分析・コンテンツの判定
・OCR・データ変換
・機械翻訳評価
価格資料請求・見積・打合せ・提案は無料

アノテーションサービス③Datatang株式会社

アノテーションサービス③Datatang株式会社

参照:https://www.datatang.co.jp/

2011年に設立され、計7か所の拠点を世界各地に展開しているDatatang株式会社。これまでに全世界で1,000社以上の企業や研究機関にデータサービスを提供しています。

データサービスを総合的に展開しているということもあり、アノテーションサービスのみならず45,000セット、合計2,500TBを超えるデータセットを保有している世界トップクラスのAI学習用データサービスプロバイダーとしての実績があります。

例を挙げてみると、世界各国の言語に対応したスマートフォン収集音声データ、ジェスチャーや表情に関する識別データ、自動運転に適用したストリートビューの画像物体検出データなどあらゆる状況に応じたデータセットを保有しています。

これらデータセットをそのまま提供する場合もあれば、お客様の要望に応じたアノテーションを実施してからデータセットを提供することも可能となっています。また、中国にアノテーションセンターを約1,000人体制で構築しており、「Shujiajia Pro」と呼ばれる独自のアノテーションツールを使用することで大規模なアノテーションを実現しています。

そして、ISO9001に基づいた厳格な品質検査管理システムやGDPR(EU圏における一般データ保護規制)によって定められている規定及び義務の遵守、データセキュリティ管理ルールに沿った管理をデータ保護官専門職の設置など、セキュリティに配慮した環境が整備されています。

「世界トップクラスのAI学習用データサービスプロバイダー」ということもあり、大規模かつ独自ツールの使用による柔軟性を兼ね備えています。それに加え、万全なセキュリティ体制を構築しているため、他にはない圧倒的な強みと言えるでしょう。

Datatang株式会社の概要

Datatangのサービス内容や事業内容はこちらになります。

住所〒101-0063
東京都千代田区神田淡路町2-105 ワテラスアネックス6階
設立2020年2月
事業内容・AI学習データ提供
・AI学習データの収集・アノテーション・プラットフォーム提供
実績中国、米国、韓国でサービスを展開する中で、1000社近くの先進的な企業との取引実績あり。
提供サービス・物体検出…セマンティックセグメンテーション、3D点群バウンディングボックス
・音声…会話音声テキスト化(コールセンター、複数人音声)、自動区切り
・オブジェクトセグメンテーション
・キーポイント
価格公式サイトからお問い合わせください。

アノテーションサービス④SBイノベンチャー株式会社

アノテーションサービス④SBイノベンチャー株式会社

参照:https://tsk-pf.com/

2012年に設立されたソフトバンクのグループ会社、SBイノベンチャー株式会社が提供する「TASUKI」は、AIモデル開発に必要なアノテーションデータの収集・加工を代行するサービスです。

「アノテーションをやめよう」というコンセプトのもと、AIエンジニアの負担を軽減させ、よりAIエンジニアのリソースを “知的生産活動” に専念できるように配慮したアノテーション代行サービスとなっています。

こちらのサービスは、ソフトバンク株式会社が100%出資しているため、ソフトバンクのAI開発経験をもとに生まれた独自のツール「TASUKI」によって、アノテーションを実施する上でポイントとなっている仕様書の作成を簡単に作成できるのが特徴です。

また、アノテーションの際には、さまざまな課題が発生することがいしばしばあります。その一例を挙げてみると、「アノテーションルールの資料作成に時間がかかってしまう・・・」「アノテーション依頼時に気づかなかった部分のやり直しが発生・・・」「アノテーションに使える大量のデータがない・・・」などといった課題がつきものです。

これらの課題に対し、「TASUKIを使用したアノテーション作業マニュアルの作成」「チャット機能による認識齟齬の早期解決」「画面上からリアルタイムでの簡単レビュー」など、これまでどの企業にも抱えてきた課題に対応しています。

何と言っても、ソフトバンクのグループ会社という信頼性が担保されています。また、あらゆる開発において独自のツールである「TASUKI」を使用することで迅速な対応力、親和性が付加されています。

SBイノベンチャー株式会社の概要

SBイノベンチャーの実績や価格はこちらになります。

住所〒105-7529
東京都港区海岸一丁目7番1号
設立1986年12月
事業内容シードビジネスへの投資・育成・管理
実績・5,000枚の画像のトリミングとラベル付け
・大規模手書き文字の収集とアノテーション
・対象画像のトリミングとアノテーション
提供サービス・画像アノテーション
・テキストアノテーション
・ドキュメントアノテーション
・動画アノテーション
・音声アノテーション
・データ収集
価格詳細な料金については、公式サイトからお問い合わせください。
※特別価格のトライアルあり。

アノテーションサービス⑤株式会社コネクティル

アノテーションサービス⑤株式会社コネクティル

参照:https://ai.zait.jp/

AIに特化したデータ作成、アノテーションサービスを提供している小規模なら無料で利用可能な、株式会社コネクティルの国産クラウド型Webアノテーションツールです。

大きな特徴としては、「AIアノテーションプラットフォーム(AI Annotation Platform)」という国産・国内サーバ稼働の完全自社開発によるWebアノテーションツールを利用することによって、機密性が高いと言われているアノテーションでも安心して利用することができます。

それに加え、豊富なアノテーション機能として作業品質と作業効率にこだわった操作性としてあります。一例を挙げると、操作を最小限に抑え効率性を実現できる「12種類のショートカットキー」、複雑なアノテーションに対応したラベルの表示が調整できる「表示ラベル変更機能」などがあります。

チームでのアノテーション作業も各種管理機能も有しており、低コストで質の高いアノテーションサービスの提供とデータ作成を実現しています。こちらも一例を挙げると、共同作業の際に必要な「作業割り振り機能」、使用するデータを簡単に運用できる「ファイル/フォルダのアップロード・データ出力機能」などがあります。

また、さまざまな種類のオブジェクト(バウンディングボックス、ポリゴン、ライン、ポイントなど)を必要に応じて複数組み合わせて、画像アノテーションを実施することが出来ます。

国産サービス、国内サーバという安心感に加え、チーム開発にも向いている管理体制を得られるのは、非常に価値のある選択肢となりそうです。

株式会社コネクティルの概要

コネクティルの事業内容や提供サービスはこちらです。

住所〒103-0001
東京都中央区日本橋小伝馬町17-13
設立2014年1月
事業内容・IT事業
・女性活躍推進事業
・テレワーク事業
実績・株式会社 Tsunagu.AI
・株式会社 Activate Data
・FRAIM株式会社
・九州工業大学
・株式会社アラヤ
・明治大学 総合数理学部 ネットワークデザイン学科
・株式会社エフィシエント など
提供サービス・画像…バウンディングボックス、セグメンテーション、画像から文字の抽出
・動画…バウンディングボックス、セグメンテーション、ポイントアノテーション
・音声…書き起こし、会話データへの情報付与
・テキスト…Excelデータ等のクレンジング
価格公式サイトからお問い合わせください。

アノテーションサービス⑥株式会社Nextremer

アノテーションサービス⑥株式会社Nextremer

参照:https://www.nextremer.com/

2012年に設立された、石川県金沢市に開発拠点を置くAIベンチャー企業です。こちらの企業は、「Scale up Human Ability(データによって新たな価値を創出し、人の可能性を高め続ける)」をミッションに掲げており、画像認識・自然言語処理を活用したAIモデル開発や、アノテーションサービスを提供しています。

「AIで何をするための学習データが必要なのか」「どのような効果を期待しているのか」など、依頼企業とコミュニケーションから意図を汲み取りながら、要望に応じた柔軟な対応が可能な企業です。

大きな特徴として、要件定義から品質管理までを一貫してお客さまへのサポートを実施していることが挙げられます。そのため、企業・大学・大手研究機関でのAI開発経験を活用し、画一的な学習データの提供にならずにアノテーション工程を任せることができます。

アノテーションチーム(アノテーター)とアルゴリズム開発を行う開発チーム(AIエンジニア)が連携しているため、工程過程における祖語が生じにくく、スムーズなプロジェクト進行を実現することができます。

また、専任の『AIトレーナー』によって、AIの開発・導入から運用まで手厚くサポートしてくれます。アノテーション工程においてプロジェクト成果の鍵となる「教師データ」の作成においても多数の実績を保持しており、お客さまへのヒアリングからデータラベリングのルールの設計など、コンサルティングを含めた高品質な学習データを作成しています。

そして、それぞれの業務を別々の企業が担当するケースも多くありますが、その場合、企業間の相談やすり合わせなどコストが多く発生する可能性があります。そんな時、こちらのサービスを利用することにより、高品質なデータを用意できるだけでなく、円滑なプロジェクト開発をすることができます。

株式会社Nextremerの概要

Nextremerの所在地やサービス内容はこちらになります。

住所高知本社
〒783-0060
高知県南国市蛍が丘1-1-2 南国オフィスパークセンター別棟 3F

東京本社
〒108-0014
東京都港区芝5-29-20 クロスオフィス三田 4FNextremer R&Dセンター
〒920-0862 石川県金沢市芳斉1-3-3 三谷産業芳斉ビル 1F
設立2012年10月
事業内容・AIソリューション事業
実績・HONDA
・OPPO
・カラオケまねきねこ
・FUJITSU など
提供サービス・アノテーション用のデータ収集(ウェブ上のデータ収集、フィールド調査)
・教師データの作成(画像、動画、テキスト、音声)
・その他データ作成に係る周辺業務(マネジメント、アノテーションガイドライン作成、報告資料作成)
価格公式サイトからお問い合わせください。

アノテーションサービスの選び方

アノテーションサービスを上手に選ぶコツは

  • 要件定義を事前にしっかりしておくこと
  • その要件にしっかり対応できるサービスを探すこと
  • 数社見積もりを出して比較すること
  • あまり価格ばかり気にしないこと

があります。
特に、事前にどんなアノテーションの作業を頼みたいのかしっかり決めておくことと、その作業が可能なのかきちんとサービスに確認しておくことが大切です。
また、よくあるのがあまりに価格を気にしすぎてとても安いサービスに依頼してしまうことです。
価格も気になると思いますが、安すぎるサービスは対応や質が悪い場合もあるので価格だけで選ばないようにしておきましょう。

アノテーションのサービスについてまとめ

これまでアノテーションサービスを提供するサービスを6つピックアップして紹介してきました。
AIプロジェクトに欠かすことのできない工程であるアノテーションにおいて、いかに高品質な「教師データ」を作成し、いかに効率的な運用により工数を減らせるかがプロジェクト成功の鍵を握っています。

アノテーションサービスに限らずあらゆるサービスを使用する場合には、サービスの比較や選定に迷うことがあると思いますが、今回紹介した企業の特徴を参考にしてみてください。
さらに、実際に依頼する際にはどのように品質管理を行っているのか、セキュリティ面に配慮した体制が整っているのかなど確認することで、プロジェクト要件に見合ったサービスを選定することができます。

アノテーションのサービスを利用して、アノテーションを効率化していきましょう。

最新情報をチェックしよう!