Webページの解析（使用例）

以下のURL（本科目の資料集のページ）は、学内にある公開サーバなので、このページ冒頭にある　　「プロキシの設定」は（学内外どちらでも）不要。
学内で使うときは、ドメイン名として www2.nagano.ac.jp の代わりに単に www2 でもアクセス可。

scala> val tx=io.Source.fromURL("http://www2.nagano.ac.jp/hiraoka/BP/15.html","utf-8").mkString

tx: String = "<!Doctype html>
<meta charset="utf-8">
 :
 :
"     // 途中省略した

scala> val re="<[^>]+>".r

val re="<[^>]+>".r	// HTMLのタグにマッチするシンプルな正規表現

scala> val tags=re.findAllIn(tx)	// マッチするパターンを抜き出して配列に
tags: scala.util.matching.Regex.MatchIterator = non-empty iterator
		// 実際には iterator が返るがOK

タグの配列 * ここで右図のようなタグ（を値として持つ文字列）の配列が得られる。

scala> val tag="<([^ >]).*>".r
scala> tags.map(s=>{val tag(t)=s;t})
// 詳しい解説はここでは省略します