Skip to content

Text

Text analysis: word count, encoding detection, email/URL/number extraction.

6 modules

ModuleDescription
Conteggio CaratteriConta i caratteri nel testo
Rileva CodificaRileva la codifica del testo
Estrai EmailEstrai tutti gli indirizzi email dal testo
Estrai NumeriEstrai tutti i numeri dal testo
Estrai URLEstrai tutti gli URL dal testo
Conteggio ParoleConta le parole nel testo

Modules

Conteggio Caratteri

text.char_count

Conta i caratteri nel testo

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Testo da analizzare

Output:

FieldTypeDescription
totalnumberTesto da analizzare
without_spacesnumberConteggio totale dei caratteri
lettersnumberConteggio totale dei caratteri
digitsnumberConteggio senza spazi
spacesnumberConteggio delle lettere
linesnumberConteggio delle cifre

Rileva Codifica

text.detect_encoding

Rileva la codifica del testo

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Testo o byte per rilevare la codifica

Output:

FieldTypeDescription
encodingstringTesto o byte per rilevare la codifica
confidencenumberCodifica rilevata
is_asciibooleanCodifica rilevata
has_bombooleanGrado di confidenza (0-1)

Estrai Email

text.extract_emails

Estrai tutti gli indirizzi email dal testo

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Testo da cui estrarre le email
uniquebooleanNoTrueTesto da cui estrarre le email
lowercasebooleanNoTrueRitorna solo email uniche

Output:

FieldTypeDescription
emailsarrayConverti le email in minuscolo
countnumberElenco delle email estratte
domainsarrayElenco delle email estratte

Estrai Numeri

text.extract_numbers

Estrai tutti i numeri dal testo

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Testo da cui estrarre i numeri
include_decimalsbooleanNoTrueTesto da cui estrarre i numeri
include_negativebooleanNoTrueIncludi numeri decimali

Output:

FieldTypeDescription
numbersarrayIncludi numeri negativi
countnumberElenco dei numeri estratti
sumnumberElenco dei numeri estratti
minnumberNumero di numeri trovati
maxnumberSomma di tutti i numeri

Estrai URL

text.extract_urls

Estrai tutti gli URL dal testo

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Testo da cui estrarre gli URL
uniquebooleanNoTrueTesto da cui estrarre gli URL

Output:

FieldTypeDescription
urlsarrayRitorna solo URL unici
countnumberElenco degli URL estratti

Conteggio Parole

text.word_count

Conta le parole nel testo

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Testo da analizzare

Output:

FieldTypeDescription
word_countnumberTesto da analizzare
unique_wordsnumberConteggio totale delle parole
sentence_countnumberConteggio totale delle parole
paragraph_countnumberNumero di parole uniche
avg_word_lengthnumberConteggio approssimativo delle frasi

Released under the Apache 2.0 License.