2012/02/19
lxmlを使えば、タグの除去も超簡単です!
tostring()もしくはXPathを使ってできるのですね〜。
lxmlは文字コードを厳格に定義しており、入力時は必ず「unicode」化しておく必要があります。
これだけでも注意しておかなければならない点ですが、lxmlには、出力用の「tostring()」というメソッドを持っており、ここでも文字コードの注意が必要となってきます。