Skip to content

Document

Excel, PDF, and Word document read/write/convert.

8 modules

ModuleDescription
Excel OkuExcel dosyalarından veri oku (xlsx, xls)
Excel YazExcel dosyalarına veri yaz (xlsx)
PDF Formu DoldurPDF form alanlarını verilerle doldur ve isteğe bağlı olarak görüntü ekle
PDF OluşturHTML içeriğinden veya metinden PDF dosyaları oluştur
PDF AyrıştırPDF dosyalarından metin ve meta verileri çıkar
PDF'den Word'ePDF dosyalarını Word belgelerine (.docx) dönüştür
Word Belgesini AyrıştırWord belgelerinden (.docx) metin ve içerik çıkar
Word'den PDF'eWord belgelerini (.docx) PDF dosyalarına dönüştür

Modules

Excel Oku

excel.read

Excel dosyalarından veri oku (xlsx, xls)

Parameters:

NameTypeRequiredDefaultDescription
pathstringYes-Path to the Excel file
sheetstringNo-Sheet name (default: first sheet)
header_rownumberNo1Row number for headers (1-based, 0 for no headers)
rangestringNo-Cell range to read (e.g., "A1:D10")
as_dictbooleanNoTrueReturn rows as dictionaries (using headers as keys)

Output:

FieldTypeDescription
dataarrayÇıkarılan veri satırları
headersarrayÇıkarılan veri satırları
row_countnumberÇıkarılan veri satırları
sheet_namesarraySütun başlıkları

Example: Read entire sheet

yaml
path: /tmp/data.xlsx
as_dict: true

Excel Yaz

excel.write

Excel dosyalarına veri yaz (xlsx)

Parameters:

NameTypeRequiredDefaultDescription
pathstringYes-Path to the Excel file
dataarrayYes-Data to write (array of arrays or array of objects)
headersarrayNo-Column headers (auto-detected from objects if not provided)
sheet_namestringNoSheet1Name of the worksheet
auto_widthbooleanNoTrueAutomatically adjust column widths

Output:

FieldTypeDescription
pathstringOluşturulan Excel dosyasının yolu
row_countnumberOluşturulan Excel dosyasının yolu
sizenumberOluşturulan Excel dosyasının yolu

Example: Write data to Excel

yaml
path: /tmp/output.xlsx
data: [{"name": "Alice", "age": 30}, {"name": "Bob", "age": 25}]

PDF Formu Doldur

pdf.fill_form

PDF form alanlarını verilerle doldur ve isteğe bağlı olarak görüntü ekle

Parameters:

NameTypeRequiredDefaultDescription
templatestringYes-Path to the PDF template file
outputstringYes-Path for the output document
fieldsobjectNo{}Key-value pairs of form field names and values
imagesarrayNo[]List of images to insert with position info
flattenbooleanNoTrueFlatten form fields (make them non-editable)

Output:

FieldTypeDescription
output_pathstringDoldurulan PDF'in yolu
fields_fillednumberDoldurulan PDF'in yolu
images_insertednumberDoldurulan PDF'in yolu
file_size_bytesnumberEklenen görüntü sayısı

Example: Fill form with text fields

yaml
template: /templates/form.pdf
output: /output/filled.pdf
fields: {"name": "John Doe", "id_number": "A123456789", "date": "2024-01-01"}

Example: Fill form with photo

yaml
template: /templates/id_card.pdf
output: /output/id_card_filled.pdf
fields: {"name": "Jane Doe"}
images: [{"file": "/photos/jane.jpg", "page": 1, "x": 50, "y": 650, "width": 100, "height": 120}]

PDF Oluştur

pdf.generate

HTML içeriğinden veya metinden PDF dosyaları oluştur

Parameters:

NameTypeRequiredDefaultDescription
contentstringYes-HTML or text content to convert to PDF
output_pathstringYes-Path for the output document
titlestringNo-Document title (metadata)
authorstringNo-Document author (metadata)
page_sizeselect (A4, Letter, Legal, A3, A5)NoA4Page size format
orientationselect (portrait, landscape)NoportraitPage orientation
marginnumberNo20Page margin in millimeters
headerstringNo-Header text for each page
footerstringNo-Footer text for each page

Output:

FieldTypeDescription
output_pathstringOluşturulan PDF'in yolu
page_countnumberOluşturulan PDF'in yolu
file_size_bytesnumberPDF'teki sayfa sayısı

Example: Generate from HTML

yaml
content: <h1>Report</h1><p>Content here</p>
output_path: /path/to/report.pdf
title: Monthly Report

PDF Ayrıştır

pdf.parse

PDF dosyalarından metin ve meta verileri çıkar

Parameters:

NameTypeRequiredDefaultDescription
pathstringYes-Path to the PDF file
pagesstringNoallPage range (e.g., "1-5", "1,3,5", or "all")
extract_imagesbooleanNoFalseExtract embedded images
extract_tablesbooleanNoFalseExtract tables as structured data

Output:

FieldTypeDescription
textstringÇıkarılan metin içeriği
pagesarrayÇıkarılan metin içeriği
metadataobjectÇıkarılan metin içeriği
page_countnumberSayfa başına metin içeriği

Example: Extract all text from PDF

yaml
path: /tmp/document.pdf
pages: all

PDF'den Word'e

pdf.to_word

PDF dosyalarını Word belgelerine (.docx) dönüştür

Parameters:

NameTypeRequiredDefaultDescription
input_pathstringYes-Path to the input document
output_pathstringNo-Path for the output document
preserve_formattingbooleanNoTruePreserve basic formatting
pagesstringNoallPage range (e.g., "1-5", "1,3,5", or "all")

Output:

FieldTypeDescription
output_pathstringOluşturulan Word belgesinin yolu
page_countnumberOluşturulan Word belgesinin yolu
file_sizenumberDönüştürülen sayfa sayısı

Example: Convert entire PDF to Word

yaml
input_path: /tmp/document.pdf

Example: Convert specific pages

yaml
input_path: /tmp/document.pdf
output_path: /tmp/output.docx
pages: 1-5

Word Belgesini Ayrıştır

word.parse

Word belgelerinden (.docx) metin ve içerik çıkar

Parameters:

NameTypeRequiredDefaultDescription
file_pathstringYes-Path to the Word document (.docx)
extract_tablesbooleanNoTrueExtract tables as structured data
extract_imagesbooleanNoFalseExtract embedded images
images_output_dirstringNo-Directory to save extracted images
preserve_formattingbooleanNoFalsePreserve basic formatting

Output:

FieldTypeDescription
textstringBelgenin tam metin içeriği
paragraphsarrayBelgenin tam metin içeriği
tablesarrayBelgenin tam metin içeriği
imagesarrayParagraf listesi
metadataobjectDizi olarak çıkarılan tablolar

Example: Extract text from Word

yaml
file_path: /path/to/document.docx

Example: Extract with tables and images

yaml
file_path: /path/to/document.docx
extract_tables: true
extract_images: true
images_output_dir: /path/to/images/

Word'den PDF'e

word.to_pdf

Word belgelerini (.docx) PDF dosyalarına dönüştür

Parameters:

NameTypeRequiredDefaultDescription
input_pathstringYes-Path to the input document
output_pathstringNo-Path for the output document
methodselect (auto, libreoffice, docx2pdf)NoautoMethod to use for conversion

Output:

FieldTypeDescription
output_pathstringOluşturulan PDF dosyasının yolu
file_sizenumberOluşturulan PDF dosyasının yolu
method_usedstringÇıktı dosyasının bayt cinsinden boyutu

Example: Convert Word to PDF

yaml
input_path: /tmp/document.docx

Example: Convert with specific output path

yaml
input_path: /tmp/document.docx
output_path: /tmp/output.pdf

Released under the Apache 2.0 License.