今回紹介していくのは、AIモデル構築において必須の工程であるアノテーションを実施する際に便利な「アノテーションサービス」です。
その中でも、特徴的なアノテーションサービスを厳選し、特徴や料金価格を比較してみました。
これからアノテーションサービスを利用とされる企業など是非ご参考にしてみてください。
まずアノテーションとは?
まずアノテーションとは、AIに指示するためのデータに注釈として言葉を教えてあげることを言います。
画像認識なら画像に「これが人間だ」と記入したり、音声認識なら「これは犬の声」と教えてあげたりすることです。
アノテーションの基本に関しては下記記事でも詳しく紹介しています。
アノテーションのサービスとは
アノテーションは基本的に自社でも行える作業ですが、AIの知識がある人がアノテーションするのと、知識がない人がアノテーションするのとでは差が出てしまいます。
知識がなくても可能ではありますが、クオリティは担保できません。
そんなアノテーションの作業を代行してくれるのが「アノテーションのサービス」です。
アノテーションサービス6選
それでは早速そんなアノテーションを手伝ってくれるサービスを6つ紹介していきます!
アノテーションを行ってくれるサービスを比較したい人はぜひ参考にしてください。
アノテーションサービス①株式会社Appen(アッペン)
1996年に設立された株式会社Appenは、オーストラリアに本社を構え、世界各国に9支社の拠点を持つグローバルな企業です。
1000人以上の従業員に加え、100万人以上ものクラウドワーカーで構成されており、経験豊富な「プロジェクトマネージャー」による高品質なサポートも提供できる体制を整えています。
世界中のお客さまに向け、自然言語処理系のデータ生成及びアノテーションを始めあらゆるサービスの提供をしており、その中でも大きな特徴として、「Appenデータアノテーション・プラットフォーム」が挙げられます。
全世界100万人以上からなるクラウドワーカーとアノテーションツールに機械学習を採用するなど、最先端のモデルを組み合わせることにより機械学習プロジェクトに必要なトレーニングデータが作成できるサービスです。
また、トレーニングが必要なデータをプラットフォームにアップロードするだけで、機械学習モデルの正確な情報を作成するために必要なアノテーション・判断・ラベルを用意してくれます。
その他音声データにおいては、170ヵ国・235以上の言語や方言への対応実績が挙げられます。
参照テキストの有無に関わらず、音声収録・文字起こし・自然言語処理・手書き文字認識などに必要なAIモデル精度向上のためのデータ生成・アノテーションを行っています。
アッペンが全世界に100万人以上ものクラウドワーカーを有しているのは、他の企業にはない特性と言えるでしょう。
また、アノテーション工程に機械学習を採用しているため、データを1からつくる必要はなく、アノテーションにおける判断の提案及び編集が容易に行えるのもプロジェクト進行に多大な影響を与えてくれるでしょう。
アッペンについては下記記事でも詳しく解説しています。
株式会社Appenの概要
Appenの事業内容やサービスの概要はこちらになります。
住所 | オーストラリア本社 Level 6, 9 Help Street Chatswood NSW 2067 |
設立 | 1996年 |
事業内容 | アノテーションサービス |
実績 | ・グローバルエンタープライズ企業とのプロジェクト実績多数あり(Google・Microsoft・Amazon・Metaなど) ・2021年度BIG Innovation Award受賞 |
提供サービス | ・トレーニングデータ(文章・画像・音声・映像・センサー) ・データ収集(画像および映像データ・発話データ・文章データ) ・言語サービス |
価格 | ・日本語の音声収録の場合: 1時間の音声収録あたり、スクリプトの提供なしで15,000円が目安。 ・画像データ収録の場合: 対象物、収録場所により異なる。1イメージあたり1,000円が目安。 |
アノテーションサービス②株式会社ヒューマンサイエンス
1985年に設立された翻訳や教育、人材派遣など多様なサービスを展開している株式会社ヒューマンサイエンスが提供している「高精度・セキュリティ重視のアノテーション代行サービス」です。
このサービスの大きな特徴として、4,800万件以上もの教師データのアノテーション実績があり、その中にはGAFAMをはじめとした幅広い企業とのプロジェクト参画があります。
それに伴い他のサービスに引けを取らない
- 自然言語処理
- 医療支援
- 自動運転開発
- 建築
などさまざまな分野への柔軟な体制づくりをされています。また、プロジェクトには、専属のプロジェクトマネージャーによるアノテーター教育/研修があり、高品質な教師データの作成を実現しています。
利用しているアノテーションツールの中には「AnnoFab」があり、お客さまのクラウドサービスの利用やIPアドレスの制限など、セキュリティ面に配慮した体制づくりもされています。
そして、リモートワークが普及してきた現在、オンラインやオンサイト、お客様環境への常駐など案件に応じた運用方法でサービスを提供しています。
オフショアのアノテーション業務を契約企業に委託しているため、国内と変わらない品質を低コストで提供しています。
今回紹介するサービスの中では最も設立年数があり、GAFAM系列との参画などこれまでの実績からも有力な選択肢となりますね。
株式会社ヒューマンサイエンスの概要
ヒューマンサイエンスの会社概要は下記になります。
住所 | 〒163-0710 東京都新宿区西新宿2-7-1 小田急第一生命ビル10階 |
設立 | 1985年3月 |
事業内容 | ・マニュアル作成 ・翻訳 ・教育・eラーニング ・AI・アノテーション ・人材派遣 |
実績 | ・先進的医療機器のAI開発 ・自動運転AIの精度向上 ・AIアシスタントのユーザーリクエスト理解度向上 |
提供サービス | ・自然言語処理・文章生成 ・音声認識・意図抽出 ・画像アノテーション ・動画アノテーション ・位置情報評価・ルート作成 ・ドキュメント分析・コンテンツの判定 ・OCR・データ変換 ・機械翻訳評価 |
価格 | 資料請求・見積・打合せ・提案は無料 |
アノテーションサービス③Datatang株式会社
参照:datatang
2011年に設立され、計7か所の拠点を世界各地に展開しているDatatang株式会社。これまでに全世界で1,000社以上の企業や研究機関にデータサービスを提供しています。
データサービスを総合的に展開しているということもあり、アノテーションサービスのみならず45,000セット、合計2,500TBを超えるデータセットを保有している世界トップクラスのAI学習用データサービスプロバイダーとしての実績があります。
例を挙げてみると、世界各国の言語に対応したスマートフォン収集音声データ、ジェスチャーや表情に関する識別データ、自動運転に適用したストリートビューの画像物体検出データなどあらゆる状況に応じたデータセットを保有しています。
これらデータセットをそのまま提供する場合もあれば、お客様の要望に応じたアノテーションを実施してからデータセットを提供することも可能となっています。また、中国にアノテーションセンターを約1,000人体制で構築しており、「Shujiajia Pro」と呼ばれる独自のアノテーションツールを使用することで大規模なアノテーションを実現しています。
そして、ISO9001に基づいた厳格な品質検査管理システムやGDPR(EU圏における一般データ保護規制)によって定められている規定及び義務の遵守、データセキュリティ管理ルールに沿った管理をデータ保護官専門職の設置など、セキュリティに配慮した環境が整備されています。
「世界トップクラスのAI学習用データサービスプロバイダー」ということもあり、大規模かつ独自ツールの使用による柔軟性を兼ね備えています。それに加え、万全なセキュリティ体制を構築しているため、他にはない圧倒的な強みと言えるでしょう。
Datatang株式会社の概要
Datatangのサービス内容や事業内容はこちらになります。
住所 | 〒101-0063 東京都千代田区神田淡路町2-105 ワテラスアネックス6階 |
設立 | 2020年2月 |
事業内容 | ・AI学習データ提供 ・AI学習データの収集・アノテーション・プラットフォーム提供 |
実績 | 中国、米国、韓国でサービスを展開する中で、1000社近くの先進的な企業との取引実績あり。 |
提供サービス | ・物体検出…セマンティックセグメンテーション、3D点群バウンディングボックス ・音声…会話音声テキスト化(コールセンター、複数人音声)、自動区切り ・オブジェクトセグメンテーション ・キーポイント |
価格 | 公式サイトからお問い合わせください。 |
アノテーションサービス④SBイノベンチャー株式会社
参照:Softbank
2012年に設立されたソフトバンクのグループ会社、SBイノベンチャー株式会社が提供する「TASUKI」は、AIモデル開発に必要なアノテーションデータの収集・加工を代行するサービスです。
「アノテーションをやめよう」というコンセプトのもと、AIエンジニアの負担を軽減させ、よりAIエンジニアのリソースを「知的生産活動」に専念できるように配慮したアノテーション代行サービスとなっています。
こちらのサービスは、ソフトバンク株式会社が100%出資しているため、ソフトバンクのAI開発経験をもとに生まれた独自のツール「TASUKI」によって、アノテーションを実施する上でポイントとなっている仕様書の作成を簡単に作成できるのが特徴です。
また、アノテーションの際には、さまざまな課題が発生することがいしばしばあります。その一例を挙げてみると、
- 「アノテーションルールの資料作成に時間がかかってしまう・・・」
- 「アノテーション依頼時に気づかなかった部分のやり直しが発生・・・」
- 「アノテーションに使える大量のデータがない・・・」
などといった課題がつきものです。
これらの課題に対し、「TASUKIを使用したアノテーション作業マニュアルの作成」「チャット機能による認識齟齬の早期解決」「画面上からリアルタイムでの簡単レビュー」など、これまでどの企業にも抱えてきた課題に対応しています。
何と言っても、ソフトバンクのグループ会社という信頼性が担保されています。
また、あらゆる開発において独自のツールである「TASUKI」を使用することで迅速な対応力、親和性が付加されています。
SBイノベンチャー株式会社の概要
SBイノベンチャーの実績や価格はこちらになります。
住所 | 〒105-7529 東京都港区海岸一丁目7番1号 |
設立 | 1986年12月 |
事業内容 | シードビジネスへの投資・育成・管理 |
実績 | ・5,000枚の画像のトリミングとラベル付け ・大規模手書き文字の収集とアノテーション ・対象画像のトリミングとアノテーション |
提供サービス | ・画像アノテーション ・テキストアノテーション ・ドキュメントアノテーション ・動画アノテーション ・音声アノテーション ・データ収集 |
価格 | 詳細な料金については、公式サイトからお問い合わせください。 ※特別価格のトライアルあり。 |
アノテーションサービス⑤株式会社コネクティル
参照:Connectill
AIに特化したデータ作成、アノテーションサービスを提供している小規模なら無料で利用可能な、株式会社コネクティルの国産クラウド型Webアノテーションツールです。
大きな特徴としては、「AIアノテーションプラットフォーム(AI Annotation Platform)」という国産・国内サーバ稼働の完全自社開発によるWebアノテーションツールを利用することによって、機密性が高いと言われているアノテーションでも安心して利用することができます。
それに加え、豊富なアノテーション機能として作業品質と作業効率にこだわった操作性としてあります。
一例を挙げると、操作を最小限に抑え効率性を実現できる「12種類のショートカットキー」や複雑なアノテーションに対応したラベルの表示が調整できる「表示ラベル変更機能」などがあります。
チームでのアノテーション作業も各種管理機能も有しており、低コストで質の高いアノテーションサービスの提供とデータ作成を実現しています。
こちらも一例を挙げると、共同作業の際に必要な「作業割り振り機能」、使用するデータを簡単に運用できる「ファイル/フォルダのアップロード・データ出力機能」などがあります。
また、さまざまな種類のオブジェクト(バウンディングボックス・ポリゴン・ライン・ポイントなど)を必要に応じて複数組み合わせて、画像アノテーションを実施することが出来ます。
国産サービスで国内サーバーという安心感に加え、チーム開発にも向いている管理体制を得られるのは非常に価値のある選択肢となりそうです。
株式会社コネクティルの概要
コネクティルの事業内容や提供サービスはこちらです。
住所 | 〒103-0001 東京都中央区日本橋小伝馬町17-13 |
設立 | 2014年1月 |
事業内容 | ・IT事業 ・女性活躍推進事業 ・テレワーク事業 |
実績 | ・株式会社 Tsunagu.AI ・株式会社 Activate Data ・FRAIM株式会社 ・九州工業大学 ・株式会社アラヤ ・明治大学 総合数理学部 ネットワークデザイン学科 ・株式会社エフィシエント など |
提供サービス | ・画像…バウンディングボックス、セグメンテーション、画像から文字の抽出 ・動画…バウンディングボックス、セグメンテーション、ポイントアノテーション ・音声…書き起こし、会話データへの情報付与 ・テキスト…Excelデータ等のクレンジング |
価格 | 公式サイトからお問い合わせください。 |
アノテーションサービス⑥株式会社Nextremer
参照:nextremer
2012年に設立された、石川県金沢市に開発拠点を置くAIベンチャー企業です。
こちらの企業は、「Scale up Human Ability(データによって新たな価値を創出し、人の可能性を高め続ける)」をミッションに掲げており、画像認識・自然言語処理を活用したAIモデル開発や、アノテーションサービスを提供しています。
「AIで何をするための学習データが必要なのか」「どのような効果を期待しているのか」など、依頼企業とコミュニケーションから意図を汲み取りながら、要望に応じた柔軟な対応が可能な企業です。
大きな特徴として、要件定義から品質管理までを一貫してお客さまへのサポートを実施していることが挙げられます。そのため、企業・大学・大手研究機関でのAI開発経験を活用し、画一的な学習データの提供にならずにアノテーション工程を任せることができます。
アノテーションチーム(アノテーター)とアルゴリズム開発を行う開発チーム(AIエンジニア)が連携しているため、工程過程における祖語が生じにくくスムーズなプロジェクト進行を実現することができます。
また、専任の『AIトレーナー』によって、AIの開発・導入から運用まで手厚くサポートしてくれます。
アノテーション工程においてプロジェクト成果の鍵となる「教師データ」の作成においても多数の実績を保持しており、お客さまへのヒアリングからデータラベリングのルールの設計など、コンサルティングを含めた高品質な学習データを作成しています。
それぞれの業務を別々の企業が担当するケースも多くありますが、その場合企業間の相談やすり合わせなどコストが多く発生する可能性があります。
そんな時こちらのサービスを利用することにより、高品質なデータを用意できるだけでなくアノテーション サービス円滑なプロジェクト開発をすることができます。
株式会社Nextremerの概要
Nextremerの所在地やサービス内容はこちらになります。
設立 | 2012年10月 |
事業内容 | ・AIソリューション事業 |
実績 | ・HONDA ・OPPO ・カラオケまねきねこ ・FUJITSU など |
提供サービス | ・アノテーション用のデータ収集(ウェブ上のデータ収集、フィールド調査) ・教師データの作成(画像、動画、テキスト、音声) ・その他データ作成に係る周辺業務(マネジメント、アノテーションガイドライン作成、報告資料作成) |
価格 | 公式サイトからお問い合わせください。 |
アノテーションサービス⑦TTピーエーム
TTピーエムは東芝デジタルソリューションズ株式会社とトランスコスモス株式会社の合同で出来たアノテーションサービス会社です。
TTピーエムのアノテーションは「アノテーションの差がAIの質を決める」と謳っている通りアノテーションのクオリティに特化しています。
少し費用をかけてもいいからアノテーションのクオリティを上げて、自社AIや自社人工知能の精度を完璧に上げたいという会社にはおすすめのアノテーションサービスです。
アノテーションサービス⑧アディッシュ株式会社
アディッシュ株式会社はインターネットサービスに強いアノテーションサービスの会社です。
特定のユーザーの投稿を感知したり、ネット炎上の対策等を支援している会社なので精度の高いAIの作成には非常に長けています。
アノテーションサービスの中では珍しい、日本の作業センターを多く持っている会社なので、できれば国内で作業をしてほしいという方にはぴったりのアノテーションサービスでしょう。
アディッシュ株式会社の概要
アディッシュ株式会社の所在地やサービス内容はこちらになります。
設立 | 2014年 |
特徴 | 日本国内に作業センターが複数あります |
提供サービス | ・画像分類、動画分類、テキスト、音声分類へのアノテーション作業 ・それにまつわる書き起こし ・その他検出のお手伝い |
価格 | 要見積もりですが、目安としては10万件のラベル付けで100万円〜 |
アノテーションサービス⑨AI学習用文字起こしサービス
「AI学習用文字起こしサービス」は喋るAIやスマートスピーカーを開発する会社向けのアノテーションサービス会社です。
文字起こししたい音声を渡して、それをテキスト化し要望に合わせた納品方法で納品してくれます。
教師データとしては非常に高品質だと話題なので、言葉を話すAIやスマートスピーカーに使いたいという方はこちらのアノテーションサービスもおすすめです。
アノテーションサービスの選び方
アノテーションサービスを上手に選ぶコツは
- 要件定義を事前にしっかりしておくこと
- その要件にしっかり対応できるサービスを探すこと
- 数社見積もりを出して比較すること
- あまり価格ばかり気にしないこと
- セキュリティがしっかりしているか見る
などがあります。
特に、事前にどんなアノテーションの作業を頼みたいのかしっかり決めておくことと、その作業が可能なのかきちんとサービスに確認しておくことが大切です。
また、よくあるのがあまりに価格を気にしすぎてとても安いサービスに依頼してしまうことです。
価格も気になると思いますが、安すぎるサービスは対応や質が悪い場合もあるので価格だけで選ばないようにしておきましょう。
アノテーションサービスについてのよくある質問
アノテーションサービスについて、よくある質問をまとめてみました。
まだまだアノテーションサービスについて知識がない方は参考にしてください。
アノテーションサービスは何をしてくれるのですか?
各社のアノテーションサービスは簡単な機械学習データに対し情報の追記を行ってくれます。そのデータは画像認識や動画認識・音声認識などの精度を上げてくれる効果があります。
アノテーションサービスはいくらぐらいかかりますか?
サービス料金に関してはピンキリなのでなんとも言えませんが、まずは相談無料の会社に0円で相談してみるところから始めるのがおすすめです。そこで価格相場を掴むこともできるでしょう。
アノテーションサービスの相場はいくらですか?
簡単なアノテーションなら1万件依頼した場合、10万円〜15万円が相場となっています。この料金相場を目安にして様々なアノテーションサービスを比較すると良いでしょう。
ただし、相場通りのアノテーションサービスではAIの精度がすごく向上するかと言われるとそうではないので、理想のAIのクオリティに合わせて料金を比較してみてください。
アノテーションのサービスについてまとめ
これまでアノテーションサービスを提供するサービスを6つピックアップして紹介してきました。
AIプロジェクトに欠かすことのできない工程であるアノテーションにおいて、いかに高品質な「教師データ」を作成し、いかに効率的な運用により工数を減らせるかがプロジェクト成功の鍵を握っています。
アノテーションサービスに限らずあらゆるサービスを使用する場合には、サービスの比較や選定に迷うことがあると思いますが、今回紹介した企業の特徴を参考にしてみてください。
さらに、実際に依頼する際にはどのように品質管理を行っているのか、セキュリティ面に配慮した体制が整っているのかなど確認することで、プロジェクト要件に見合ったサービスを選定することができます。
ぜひこの機会にアノテーションのサービスを利用して、自社のアノテーションを効率化していきましょう。