Skip to content

Analysis

HTML analysis modules for readability, forms, tables, and metadata extraction.

6 modules

ModuleDescription
HTML 가독성콘텐츠 가독성 분석
폼 추출HTML에서 폼 데이터 추출
메타데이터 추출HTML에서 메타데이터 추출
테이블 추출HTML에서 테이블 데이터 추출
패턴 찾기HTML에서 반복되는 데이터 패턴 찾기
HTML 구조HTML DOM 구조 분석

Modules

HTML 가독성

analysis.html.analyze_readability

콘텐츠 가독성 분석

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

폼 추출

analysis.html.extract_forms

HTML에서 폼 데이터 추출

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

메타데이터 추출

analysis.html.extract_metadata

HTML에서 메타데이터 추출

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

테이블 추출

analysis.html.extract_tables

HTML에서 테이블 데이터 추출

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

패턴 찾기

analysis.html.find_patterns

HTML에서 반복되는 데이터 패턴 찾기

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

HTML 구조

analysis.html.structure

HTML DOM 구조 분석

Parameters:

NameTypeRequiredDefaultDescription
htmlstringYes-HTML content to analyze

Output:

FieldTypeDescription
typeanyobject
propertiesany

Released under the Apache 2.0 License.