Skip to content

Analysis

HTML analysis modules for readability, forms, tables, and metadata extraction.

6 modules

ModuleDescription
Lisibilite HTMLAnalyser la lisibilite du contenu
Extraire les formulairesExtraire les donnees de formulaire du HTML
Extraire les metadonneesExtraire les metadonnees du HTML
Extraire les tableauxExtraire les donnees de tableau du HTML
Trouver des motifsTrouver des motifs de donnees repetitifs dans le HTML
Structure HTMLAnalyser la structure DOM du HTML

Modules

Lisibilite HTML

analysis.html.analyze_readability

Analyser la lisibilite du contenu

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Extraire les formulaires

analysis.html.extract_forms

Extraire les donnees de formulaire du HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Extraire les metadonnees

analysis.html.extract_metadata

Extraire les metadonnees du HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Extraire les tableaux

analysis.html.extract_tables

Extraire les donnees de tableau du HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Trouver des motifs

analysis.html.find_patterns

Trouver des motifs de donnees repetitifs dans le HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Structure HTML

analysis.html.structure

Analyser la structure DOM du HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Released under the Apache 2.0 License.