発言駆動日記

何事も発言駆動な日記。HDD

2012-05-11から1日間の記事一覧

まずはWebの新聞をスクレイピングのターゲットに

Groovyで日刊工業新聞のヘッドラインをとってくる。 def urlStr = "http://www.nikkan.co.jp" def url = new URL(urlStr) def html = url.getText('euc-jp') def contents = html.tokenize('\n').findAll{ it =~ /class="entry-content"/ } headLine = [:] c…