HTML → TEXT変換 HTMLのタグを取り除く
インターネットから提供される情報には古い文字中心のものも残ってはい
ますが、WWWでは画像などを使った親しみやすいものが多くなっています。
そして、このような用途を目的に HTML(Hyper Text Make-up Language)
が考案され、使用されています。
ところが、受信した画面をそのままファイルに残して、後刻に MOSAIC 等
のブラウザで読み出す場合はよいのですが、都合によってはテキスト・ファ
イルとして保管し、再生し、印刷したい、ということがあります。そう言っ
たときには、HTML言語で書かれた「タグ」が邪魔で、そのままでは文書
を読みにくくしてしまいます。
このプログラムはWWWのホームページを「ファイル」メニューでディス
クにセーブしたときにできるファイルから、HTMLのタグを取り除くもの
で、MS-Windows 用です。ただし、このプログラムは手間の大部分を省いて
くれますが、テキストを完全に整形してはくれません。自動変換の後は、手
作業で改行を挿入/削除したり、行頭を揃えたりなさって下さい。また、画
像(Image)は単に ||IMG|| という表現に変換しています。テスト用の私製
ホームページ test.htm も同梱していますので、ご賞(笑)味ください。