
画像認識型のRPAツールのメリットって何か教えてください。
という疑問に答えます。
後半では、画像認識型のRPAツールのデメリットについても解説します。
それでは、どうぞ!
画像認識型RPAのメリット

画像認識とは、操作対象を画像データとしてキャプチャーして、RPAの開発画面に登録する方式です。
ロボットの実行時に画像データを呼び出して、画面上の画像と照合して対象と特定した後、入力やクリックなどの操作を行います。
操作対象の要素(ボタンやテキストボックスなど)の位置が変わっても、画像が同じであれば修正せずに対応できるという利点があります。
操作対象の要素ボタンの位置を座標で指定するツールもありますが、この場合は要素の位置が変わると修正が必要です。
また、すべて画像で操作対象の要素を認識するので、直感的で理解しやすくRPA初心者でも習得しやすいRPAツールが多いのが特徴です。
操作対象を画像としてマッチングするため、スクリーン上に表示されているものであればアプリケーションの種類を問わず操作することができるのが特徴です。
画像認識型RPAのデメリット

画像認識型のRPAは、直観的に開発できる反面、操作対象の画像が変わってしまうと動かなくなってしまうというデメリットがあります。
また、スクリーンの解像度を変えたら、認識されない場合もあります。
スクリーン上に同じ画像が複数存在すると、どの画像に対してアクションすればいいのは判断できないという欠点があります。
また、同じような見た目の要素が複数存在すると、間違って意図しない要素に対してアクションが起きてしまうこともあります。
画像認識型には上記のデメリットがあるため、「画像要素認識」という方式を採用しているRPAツールもあります。
入力欄やボタンといった画面の要素をHTMLファイルやアプリケーションそのものから読み取って記録する方式です。「UIオブジェクト認識」と呼ばれることもあります。
見た目ではなく、HTMLやアプリケーションの内部構造を解析して実行されますので、画面レイアウトや見た目が変わっても、内部構造の構成要素が変わらなければ、問題無く動作します。
動作が高速で安定していますが、最初は「UIオブジェクト」などの用語と概念を理解しなければならないため、RPA初心者にはハードルが高く感じるでしょう。
まとめ

というわけで、画像認識型RPAのメリットとデメリットを解説しました。
画像認識型のRPAツールは気軽に使えるし、無料のものもあります。
その代表はSikuliXです。
>>フリーのRPAツール「SikuliX」で自動化を始めよう
また、下記のRPAツールなら、画像認識も画像要素認識もサポートしているので、適切に使い分ける技術を身に付けましょう。
- UiPath
- WinActor
- Power Automate for desktop