Skip to content

Analysis

HTML analysis modules for readability, forms, tables, and metadata extraction.

6 modules

ModuleDescription
Keterbacaan HTMLAnalisis keterbacaan konten
Ekstrak FormEkstrak data form dari HTML
Ekstrak MetadataEkstrak metadata dari HTML
Ekstrak TabelEkstrak data tabel dari HTML
Temukan PolaTemukan pola data berulang di HTML
Struktur HTMLAnalisis struktur DOM HTML

Modules

Keterbacaan HTML

analysis.html.analyze_readability

Analisis keterbacaan konten

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Ekstrak Form

analysis.html.extract_forms

Ekstrak data form dari HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Ekstrak Metadata

analysis.html.extract_metadata

Ekstrak metadata dari HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Ekstrak Tabel

analysis.html.extract_tables

Ekstrak data tabel dari HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Temukan Pola

analysis.html.find_patterns

Temukan pola data berulang di HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Struktur HTML

analysis.html.structure

Analisis struktur DOM HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Released under the Apache 2.0 License.