Skip to content

Analysis

HTML analysis modules for readability, forms, tables, and metadata extraction.

6 modules

ModuleDescription
ความสามารถอ่าน HTMLวิเคราะห์ความสามารถในการอ่านเนื้อหา
ดึงฟอร์มดึงข้อมูลฟอร์มจาก HTML
ดึง Metadataดึง metadata จาก HTML
ดึงตารางดึงข้อมูลตารางจาก HTML
ค้นหารูปแบบค้นหารูปแบบข้อมูลที่ซ้ำใน HTML
โครงสร้าง HTMLวิเคราะห์โครงสร้าง DOM ของ HTML

Modules

ความสามารถอ่าน HTML

analysis.html.analyze_readability

วิเคราะห์ความสามารถในการอ่านเนื้อหา

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

ดึงฟอร์ม

analysis.html.extract_forms

ดึงข้อมูลฟอร์มจาก HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

ดึง Metadata

analysis.html.extract_metadata

ดึง metadata จาก HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

ดึงตาราง

analysis.html.extract_tables

ดึงข้อมูลตารางจาก HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

ค้นหารูปแบบ

analysis.html.find_patterns

ค้นหารูปแบบข้อมูลที่ซ้ำใน HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

โครงสร้าง HTML

analysis.html.structure

วิเคราะห์โครงสร้าง DOM ของ HTML

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Released under the Apache 2.0 License.