Skip to content

Analysis

HTML analysis modules for readability, forms, tables, and metadata extraction.

6 modules

ModuleDescription
HTML पठनीयतासामग्री पठनीयता का विश्लेषण करें
फ़ॉर्म निकालेंHTML से फ़ॉर्म डेटा निकालें
मेटाडेटा निकालेंHTML से मेटाडेटा निकालें
टेबल निकालेंHTML से टेबल डेटा निकालें
पैटर्न खोजेंHTML में दोहराए जाने वाले डेटा पैटर्न खोजें
HTML संरचनाHTML DOM संरचना का विश्लेषण करें

Modules

HTML पठनीयता

analysis.html.analyze_readability

सामग्री पठनीयता का विश्लेषण करें

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

फ़ॉर्म निकालें

analysis.html.extract_forms

HTML से फ़ॉर्म डेटा निकालें

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

मेटाडेटा निकालें

analysis.html.extract_metadata

HTML से मेटाडेटा निकालें

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

टेबल निकालें

analysis.html.extract_tables

HTML से टेबल डेटा निकालें

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

पैटर्न खोजें

analysis.html.find_patterns

HTML में दोहराए जाने वाले डेटा पैटर्न खोजें

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

HTML संरचना

analysis.html.structure

HTML DOM संरचना का विश्लेषण करें

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Released under the Apache 2.0 License.