Skip to content

Text

Text analysis: word count, encoding detection, email/URL/number extraction.

6 modules

ModuleDescription
Nombre de caractèresCompter les caractères dans le texte
Détecter l'encodageDétecter l'encodage du texte
Extraire les e-mailsExtraire toutes les adresses e-mail du texte
Extraire les nombresExtraire tous les nombres du texte
Extraire les URLsExtraire toutes les URLs du texte
Nombre de motsCompter les mots dans le texte

Modules

Nombre de caractères

text.char_count

Compter les caractères dans le texte

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texte à analyser

Output:

FieldTypeDescription
totalnumberTexte à analyser
without_spacesnumberNombre total de caractères
lettersnumberNombre total de caractères
digitsnumberCompter sans les espaces
spacesnumberNombre de lettres
linesnumberNombre de chiffres

Détecter l'encodage

text.detect_encoding

Détecter l'encodage du texte

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texte ou octets pour détecter l'encodage

Output:

FieldTypeDescription
encodingstringTexte ou octets pour détecter l'encodage
confidencenumberEncodage détecté
is_asciibooleanEncodage détecté
has_bombooleanScore de confiance (0-1)

Extraire les e-mails

text.extract_emails

Extraire toutes les adresses e-mail du texte

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texte pour extraire les e-mails
uniquebooleanNoTrueTexte pour extraire les e-mails
lowercasebooleanNoTrueRetourner uniquement les e-mails uniques

Output:

FieldTypeDescription
emailsarrayConvertir les e-mails en minuscules
countnumberListe des e-mails extraits
domainsarrayListe des e-mails extraits

Extraire les nombres

text.extract_numbers

Extraire tous les nombres du texte

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texte pour extraire les nombres
include_decimalsbooleanNoTrueTexte pour extraire les nombres
include_negativebooleanNoTrueInclure les nombres décimaux

Output:

FieldTypeDescription
numbersarrayInclure les nombres négatifs
countnumberListe des nombres extraits
sumnumberListe des nombres extraits
minnumberNombre de nombres trouvés
maxnumberSomme de tous les nombres

Extraire les URLs

text.extract_urls

Extraire toutes les URLs du texte

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texte pour extraire les URLs
uniquebooleanNoTrueTexte pour extraire les URLs

Output:

FieldTypeDescription
urlsarrayRetourner uniquement les URLs uniques
countnumberListe des URLs extraites

Nombre de mots

text.word_count

Compter les mots dans le texte

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Texte à analyser

Output:

FieldTypeDescription
word_countnumberTexte à analyser
unique_wordsnumberNombre total de mots
sentence_countnumberNombre total de mots
paragraph_countnumberNombre de mots uniques
avg_word_lengthnumberNombre approximatif de phrases

Released under the Apache 2.0 License.