Skip to content

Analysis

HTML analysis modules for readability, forms, tables, and metadata extraction.

6 modules

ModuleDescription
HTML可読性分析コンテンツの可読性を分析
フォームを抽出HTMLからフォームデータを抽出
メタデータを抽出HTMLからメタデータを抽出
テーブルを抽出HTMLからテーブルデータを抽出
パターンを検索HTMLで繰り返しデータパターンを検索
HTML構造HTML DOM構造を分析

Modules

HTML可読性分析

analysis.html.analyze_readability

コンテンツの可読性を分析

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

フォームを抽出

analysis.html.extract_forms

HTMLからフォームデータを抽出

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

メタデータを抽出

analysis.html.extract_metadata

HTMLからメタデータを抽出

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

テーブルを抽出

analysis.html.extract_tables

HTMLからテーブルデータを抽出

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

パターンを検索

analysis.html.find_patterns

HTMLで繰り返しデータパターンを検索

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

HTML構造

analysis.html.structure

HTML DOM構造を分析

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Released under the Apache 2.0 License.