Web技術の昨今の動向2点 10/2

今日は以下の2つの技術を紹介する。 (各自で詳しく調べてみたり試用してみたりして、結果を報告下さい)

  1. ハイブリッドアプリケーション
  2. スクレイピング

ハイブリッド

ハイブリッドアプリケーション

Cordovaについて

Android(をTargetとした)開発について

準備

手順

スクレイピングの狙い

スクレイピング

背景

ボタンの意味の変化

クローリング技術の諸相

右図のように4つに大別できる。

  1. (GUIアプリケーションとしての)ダウンローダー
  2. (文字によるコマンドとしての)ダウンローダー
  3. スクレイピングのためのライブラリ 4種類
  4. ブラウザを外からコントロールするアプローチ

今回はその4のアプローチを紹介する。

 原理

原理

そのとき、制御される側のブラウザとしては、 + 一般のブラウザをそのまま使う + 自動化のための専用ブラウザ

という選択肢があるだろう。特に、後者のものは、 画面の状態を表示する必要は特にないことから、 表示のない「ヘッドレスブラウザ」と呼ばれる。

主な製品(フリーのものとして)
  1. PhantomJS + CasperJS
  2. Selenium Webドライバー

各自で試用してみてください。