2012年9月20日木曜日

HTMLエスケープ in Python2

HTMLエスケープをせざるを得なくなりました。

urllib.unquoteで出来るよって?違うそれは「URLエンコード」別件です。紛らわしいよHTML業界。

  • HTMLエスケープは、特殊文字とHTMLタグを避けるための小細工
  • URLエンコードは、特殊文字を、HTTP GETクエリストリングを避けるための小細工
小生が今知りたいのは前者です。なぜなら後者は有名だから。
結論から言うと、次のうち幾つか。らしい。


別パッケージを入れなきゃならんのは色々アレなので、

  • from xml.sax.saxutils import escape,unescape

辺りで行ってみようかと