
こんにちは。完全自動化研究所の小佐井です。
「いくつもRPAツールがあるけど何が違うの?」という疑問がありませんか?
この記事ではRPAツールの違いをは、実行環境と画面要素の認識方法により、タイプ分けして解説します。
1) IT歴20年。開発から業務改善まで幅広く経験してきました
2) 複数の企業において2016年からRPA内製化をサポートしています
3) UiPath関連の書籍を出版しています
導入を成功させるためには、それぞれの特徴と自社の環境をマッチングさせることが大切ですので、興味のある方は是非お読みください。
実行環境のタイプ
一般的に次の2つのタイプに分けられます。ただし、両社の区分けは年々縮まってきています。料金体系の差も縮まってきています。
サーバー型RPAツール
(図6)サーバー型RPAツールのイメージ
RPAロボットはサーバー側に設定し、サーバーからの命令でクライアント側のPCを操作します(図6)。
サーバー側で稼働スケジュールや運用監視を一元管理することができます。組織的な完全自動化に向いており、海外の企業で採用されることが多いタイプです。そのため、海外メーカー製が多いのが特徴です。日本では大企業に向いています。
後ほど紹介するデスクトップ型RPAに比べ高価で、サブスクリプション契約の場合、年額500万円以上のものが多いです。ただし、ライセンス形態によっては安価に提供されているものもありますし、「同時実行台数にライセンス費用がかかるが、開発端末の台数は何台でもいい」といったものもあり、条件によってはデスクトップ型RPAより高額とは言えません。








デスクトップ型RPAツール
(図7)クライアント型RPAツールのイメージ
ロボットをクライアントPCにインストールして、デスクトップ上で動作させるタイプです(図7)。ユーザー自身のパソコン内で作成したシナリオをその場で実行でき、自動化の効果を体感しやすいという利点があるので、日本企業では、こちらのタイプを採用していることが多いです。
中央管理しているサーバーからの命令で実行されるサーバー型RPAツールとは違い、基本的に人間のオペレーションによってロボットを実行する(半自動型またはアテンデット型と呼ばれます)という利用方法が多いのが特徴です。
シナリオ実行中に、ダイアログの選択やファイルの指定といった人間の判断や処理を介在させることで、ユーザーの業務をサポートするロボットを作成するパターンが広まっています。
初期投資がサーバー型に比べ安価で、年額数十万円~100万円程度のRPAツールが多いです。
開発ライセンスと実行ライセンスに分かれているツールが多く、組み合わせを工夫することでライセンス費用を抑えられます。
ただし、単純にRPAツールの利用台数を増やしていくと、最初から大規模で利用することを想定しているサーバー型RPAツールより高額になるかもしれないので、ライセンス費用の管理が重要です。
よって、スモールスタートしたい、そして大規模(数十~数千ライセンス)にはならないとわかっている企業には、デスクトップ型のRPAツールが向いています。
近年はデスクトップ型RPAツールにサーバーでの管理機能がオプションで付属しているツールが多くなっていますので、10台を超える規模のデスクトップ型RPAツールを使うようになったら、サーバー型RPAにバージョンアップすることもできるようになりました。
本サイトで紹介しているUiPathやMicrosoftのPower Automate for desktopもライセンスの組み合わせによって、デスクトップ型RPAツールとも、サーバー型RPAツールとも呼べるRPAツールです。








画面要素認識のタイプ
画面要素とは、ボタンやテキストボックスなどを指します。RPAは基本的にデスクトップ画面の操作を自動化するので、ボタンなどの画面要素の認識をどうやって行うかは大事です。
RPAツールが出現したばかりのころは、各RPAツールによって特徴があったのですが、最近のRPAツールは画面要素認識のレベルが上がってきており、大きな差が無くなってきています。
ただ、RPAツールの重要なポイントなので、知識としておさえておきましょう。次の3つのタイプにわけられます。
座標指定
操作対象画面を表示して、入力欄や検索ボタンの位置を人間がマウスでクリックすると、2次元の座標データを記録する方式です。
ロボットの実行時に座標データを呼び出してボタンなどの位置を認識させて動作します。座標指定の方式は、操作対象画面の大きさや表示位置が変わると誤作動するという課題があります。
ただし、私の知っているRPAツールで座標指定のみしかできないものは知りません。後で紹介する方式との組み合わせで提供されることがほとんどです。
SikuliXで座標指定する方法について、次の記事で解説しています。
画像認識
操作対象を画像データとしてキャプチャーして、RPAの開発画面に登録する方式です。
SikuliXは画像認識で動作するRPAです。具体的なイメージを知りたい方はお読みください。
ロボットの実行時に画像データを呼び出して、画面上の画像と照合して対象と特定した後、入力やクリックなどの操作を行います。
座標指定方式と違い、ボタンの位置が変わっても画像が同じであれば修正せずに対応できる利点があります。
また、すべて画像で操作対象の要素を認識するので、直感的で理解しやすくRPA初心者でも習得しやすいRPAツールが多いのが特徴です。
反面、操作対象の画像が変わってしまうと動かなくなってしまうので注意しましょう。
画像要素認識
入力欄やボタンといった画面の要素をHTMLファイルやアプリケーションそのものから読み取って記録する方式です。「UIオブジェクト認識」と呼ばれることもあります。
見た目ではなく、HTMLやアプリケーションの内部構造を解析して実行されますので、画面レイアウトや見た目が変わっても、HTMLファイルの構成要素が変わらなければ、問題無く動作します。
動作が高速で安定していますが、最初は「UIオブジェクト」などの用語と概念を理解しなければならないため、RPA初心者にはハードルが高く感じるでしょう。
RPAツールのタイプのまとめ
一般的にサーバー型RPAは大企業向け、デスクトップ型RPAは中小企業向けと考えられています。
ただし、近年サーバー型RPAとデスクトップ型RPAの差が無くなってきており、「RPAツールをどのように利用するか?」ということで選択するようになってきています。
つまり、ライセンス形態の選び方によって、サーバー型RPAであってもデスクトップ型として利用できるし、その逆もある程度可能というわけです。
私はUiPathをサポートすることが多いのですが、デスクトップ型RPAツールとして使いはじめて、RPAが浸透していくと、サーバー型に移行していくケースが多いです。
画面要素認識の方式は、UiPath、WinActor、Power Automate for desktopなど最近のRPAツールなら、すべての方式をサポートしているので、適切に使い分ける技術を身に付けましょう。
関連する記事
RPAツールについて全体的な解説をしている記事はこちらです。