Skip to content

Text

Text analysis: word count, encoding detection, email/URL/number extraction.

6 modules

ModuleDescription
Jumlah KarakterHitung karakter dalam teks
Deteksi PengkodeanDeteksi pengkodean teks
Ekstrak EmailEkstrak semua alamat email dari teks
Ekstrak AngkaEkstrak semua angka dari teks
Ekstrak URLEkstrak semua URL dari teks
Jumlah KataHitung kata dalam teks

Modules

Jumlah Karakter

text.char_count

Hitung karakter dalam teks

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Teks untuk dianalisis

Output:

FieldTypeDescription
totalnumberTeks untuk dianalisis
without_spacesnumberJumlah total karakter
lettersnumberJumlah total karakter
digitsnumberHitung tanpa spasi
spacesnumberJumlah huruf
linesnumberJumlah digit

Deteksi Pengkodean

text.detect_encoding

Deteksi pengkodean teks

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Teks atau byte untuk mendeteksi pengkodean

Output:

FieldTypeDescription
encodingstringTeks atau byte untuk mendeteksi pengkodean
confidencenumberPengkodean terdeteksi
is_asciibooleanPengkodean terdeteksi
has_bombooleanSkor kepercayaan (0-1)

Ekstrak Email

text.extract_emails

Ekstrak semua alamat email dari teks

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Teks untuk mengekstrak email
uniquebooleanNoTrueTeks untuk mengekstrak email
lowercasebooleanNoTrueKembalikan hanya email unik

Output:

FieldTypeDescription
emailsarrayUbah email menjadi huruf kecil
countnumberDaftar email yang diekstrak
domainsarrayDaftar email yang diekstrak

Ekstrak Angka

text.extract_numbers

Ekstrak semua angka dari teks

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Teks untuk mengekstrak angka
include_decimalsbooleanNoTrueTeks untuk mengekstrak angka
include_negativebooleanNoTrueSertakan angka desimal

Output:

FieldTypeDescription
numbersarraySertakan angka negatif
countnumberDaftar angka yang diekstrak
sumnumberDaftar angka yang diekstrak
minnumberJumlah angka yang ditemukan
maxnumberJumlah semua angka

Ekstrak URL

text.extract_urls

Ekstrak semua URL dari teks

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Teks untuk mengekstrak URL
uniquebooleanNoTrueTeks untuk mengekstrak URL

Output:

FieldTypeDescription
urlsarrayKembalikan hanya URL unik
countnumberDaftar URL yang diekstrak

Jumlah Kata

text.word_count

Hitung kata dalam teks

Parameters:

NameTypeRequiredDefaultDescription
texttextYes-Teks untuk dianalisis

Output:

FieldTypeDescription
word_countnumberTeks untuk dianalisis
unique_wordsnumberTotal jumlah kata
sentence_countnumberTotal jumlah kata
paragraph_countnumberJumlah kata unik
avg_word_lengthnumberPerkiraan jumlah kalimat

Released under the Apache 2.0 License.