Câu hỏi được gắn thẻ [apache-tika]

0 phiếu bầu
0 trả lời
Trích xuất hình ảnh nội tuyến từ PDF bằng apache-tika và python
Tôi cần chuyển đổi tài liệu PDF thành định dạng XML hoặc JSON bao gồm cả hình ảnh nội tuyến. Cho đến nay, tôi có thể tạo XML bằng thư viện py...
yêu cầu 4 tháng trước
0 phiếu bầu
0 trả lời
Sử dụng Apache Tika PDF Parser thay thế văn bản
Gần đây tôi đã thử nhiều trình phân tích cú pháp PDF khác nhau (tika, PDFminer.six, v.v.) để trích xuất tất cả nội dung vào tệp văn bản. Sử dụng...
yêu cầu 4 tháng trước
7 phiếu bầu
1 trả lời
Apache Tika và siêu dữ liệu tài liệu
Tôi đang xử lý đơn giản nhiều loại tài liệu (ODS, MS office, pdf) bằng Apache Tika. Tôi phải nhận được ít nhất:  49 310 không dễ dàng như vậ...
yêu cầu 8 năm trước