高速でHTMLソースを構文解析できる
HTMLの構文解析を行うことができるソフトです。
独自アルゴリズムで作成したパーサによる高速な処理が特徴となっています。
ウェブページのテキスト抽出、ウェブコンテンツ解析等にご利用ください。
◇ 動作条件 ◇
Microsoft Windows 7で動きます。
◇ 機能・実行例 ◇
ひとつのHTMLソースファイルを構文解析し、
「タグ情報ファイル」と「テキスト情報ファイル」に分解します。
◆タグ情報ファイルの見方
a[43],class=_wi|href=/intl/ja/ads/?fg=1|
上記は例としてGoogleトップページの解析結果の「タグ情報ファイル」から一行抜き出したもの。
43回目に出現するaタグは、class、hrefの属性を持ち、属性値は=を挟んで右側の値だと読みます。
各属性情報はご覧のとおりパイプ「|」で区切ってあり、タグ名との境界にはカンマ「,」があります。
◆テキスト情報ファイルの見方
html[0]body[0]div[74]div[85]div[86]div[87]div[88]span[47]a[43],広告
上記は同じ例の「テキスト情報ファイル」から一行抜き出したもの。
先程の43番目のaタグというのは、すでに5つのdivと1つのspanに囲まれており、
リンク表示文字は「広告」であることが読み取れます。
カンマ左はあるテキストを囲っているタグのリスト、
カンマ右はそタグ群に囲まれたテキストの内容となっています。
◆ライセンス取得による機能の変化
GUIに加え、"htmlparser.exe" をコマンドラインから実行できるようになります。
コマンドプロンプトから、もしくはプログラム中でOSコマンドを呼び出すこと
(C言語のsystem関数、Perl言語の``およびsystem関数 等)でご利用いただけます。
これによって、ご自身のプログラム中で呼び出す等、柔軟な使い方が可能となります。
又、ディレクトリ指定によるファイルの一括変換や、
結果ファイルの種類ごとに作成場所を個別指定することが可能になります。
詳しくはREADME.txtをご覧ください。
◇ 有料版の価格・お買い求め方法 ◇
本シェアウェアでは、無料版と有料版を同梱し、有料版をお使いいただける場合には
ライセンスキーを取得していただく形式をとっております。
詳しくはREADME.txtをご覧ください。
本シェアウェアでは、無料版と有料版を同梱し、有料版をお使いいただける場合には
ライセンスキーを取得していただく形式をとっております。
無料版には有料版に特有の機能を除き、試用期間等の特別な試用制限はありません。
有料版の価格は、手数料、消費税等すべてを含めて[648円]となっております。
(14/04/18現在の消費税率8%で計算しています。)
お買い求め方法には、本シェアウェアのダウンロードページ中の「カートに入れる」ボタンから
購入画面へ進む方法(ベクターのシェアウェア送金代行システム)や、銀行振込等があります。
手続きが済みますと、ライセンスキーを取得することができます。
このフォルダ内にある「有料版.zip」を解凍する際にパスワードが求められますので、
このライセンスキーをパスワードとして入力し、解凍してお使いください。
さらに詳しい内容は、ダウンロード後のREADME.txtをご覧ください。
ソフト名: | 最速HTMLパーサ君(シェアウェア版) |
---|---|
動作OS: | Windows 7 |
機種: | IBM-PC |
種類: | シェアウェア |
作者: | シュン・アローザル |
このソフトは有料ソフトです。
※消費税の増税に伴い、ソフト詳細説明や動作環境等に表示されている価格と、実際の価格が異なる場合がございます。ご購入前に必ずご確認ください。
※送金前に「シェアウェアの送金について」をお読み下さい。
※詳細はソフトをダウンロード後、ご確認ください。