Skip to content

Text

Text analysis: word count, encoding detection, email/URL/number extraction.

6 modules

ModuleDescription
Conteo de CaracteresContar caracteres en texto
Detectar CodificaciónDetectar codificación de texto
Extraer CorreosExtraer todas las direcciones de correo electrónico del texto
Extraer NúmerosExtraer todos los números del texto
Extraer URLsExtraer todas las URLs del texto
Conteo de palabrasContar palabras en el texto

Modules

Conteo de Caracteres

text.char_count

Contar caracteres en texto

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texto para analizar

Output:

FieldTypeDescription
totalnumberTexto para analizar
without_spacesnumberConteo total de caracteres
lettersnumberConteo total de caracteres
digitsnumberContar sin espacios
spacesnumberConteo de letras
linesnumberConteo de dígitos

Detectar Codificación

text.detect_encoding

Detectar codificación de texto

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texto o bytes para detectar codificación

Output:

FieldTypeDescription
encodingstringTexto o bytes para detectar codificación
confidencenumberCodificación detectada
is_asciibooleanCodificación detectada
has_bombooleanNivel de confianza (0-1)

Extraer Correos

text.extract_emails

Extraer todas las direcciones de correo electrónico del texto

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texto para extraer correos
uniquebooleanNoTrueTexto para extraer correos
lowercasebooleanNoTrueDevolver solo correos únicos

Output:

FieldTypeDescription
emailsarrayConvertir correos a minúsculas
countnumberLista de correos extraídos
domainsarrayLista de correos extraídos

Extraer Números

text.extract_numbers

Extraer todos los números del texto

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texto para extraer números
include_decimalsbooleanNoTrueTexto para extraer números
include_negativebooleanNoTrueIncluir números decimales

Output:

FieldTypeDescription
numbersarrayIncluir números negativos
countnumberLista de números extraídos
sumnumberLista de números extraídos
minnumberCantidad de números encontrados
maxnumberSuma de todos los números

Extraer URLs

text.extract_urls

Extraer todas las URLs del texto

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texto para extraer URLs
uniquebooleanNoTrueTexto para extraer URLs

Output:

FieldTypeDescription
urlsarrayDevolver solo URLs únicas
countnumberLista de URLs extraídas

Conteo de palabras

text.word_count

Contar palabras en el texto

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texto a analizar

Output:

FieldTypeDescription
word_countnumberTexto a analizar
unique_wordsnumberRecuento total de palabras
sentence_countnumberRecuento total de palabras
paragraph_countnumberNúmero de palabras únicas
avg_word_lengthnumberRecuento aproximado de oraciones

Released under the Apache 2.0 License.