スクリーンスクレイピング

某リッチクライアント技術の説明会に参加してきたのですが、
そこで、ちょうど今私の困っている「HTML情報の抽出」がすでに行われていて、驚きました。
ただの勉強不足かもしれませんが、HTML情報を解析し、必要な情報だけを抽出することを
「スクリーンスクレイピング」と呼ぶらしく、おもにアグリゲーションシステムなどで
利用されることが多いみたい。
考えていたのはまさにコレです。


スクレイピングのもととなるパターンの作成方法など考えることはまだありますが、
非常に助かりました。
Javaなどではモジュールとして提供されているものもあるらしいので、
早速勉強してみます。