dhtm2110.lzh ( Filesize: 108,689 )
ホームページで御馴染のHTMLは改行を<br>であらわしているので普通の検索ソフトでは行またがり検索ができないんですよねぇ。それでとりあえず<br>を改行に置換えることを中心にした単純なツールを作ってみました。将来はタグ総てを取り除く対象にする予定なのでプログラム名は"DeHTML"としました。
【処理内容】
・ファイル中の改行記号はHTML文書内では無意味なので削除する。(^_^)
ただし<PRE></PRE>間は除く
・ファイル中の<br>などを改行に置換える。(^_^)
・<head><title><html><h4>とあと少しと</...>を削除する
・<,>などを<>のような普通の表記に戻す
< は <
> は >
& は &
"は "
® は (R)
©は (C) にそれぞれ変換します。
・処理単位にまたがっている可能性のある場合は常識的な範囲の長さであれば、しかるべき処理をおこなう
・処理結果を順次ファイルに吐き出す。(^_^)吐き出す先のファイルは入力HTMLファイルの拡張子を変更したものをDeHTMLが開く。
HTML関係の資料購入費、動作確認用HTML文書入手のための課金・通信費の援助を御願いしたいのでドネーションウェアとさせていただいております。1回試してしまえば処理済みテキストの山が出来てしまいますが(^_^;)よりよいソフト開発のためぜひ開発経費の援助を御願いします。
ソフト名: | DeHTML for OS/2 |
---|---|
動作OS: | OS2 |
機種: | IBM-PC |
種類: | シェアウェア :300円 |
作者: | 浜口 崇 |