0 Câu hỏi: Cách chuyển đổi tọa độ khu vực bảng trong Python Camelot và Tabula-Py

câu hỏi được tạo ra tại Wed, May 8, 2019 12:00 AM

Tôi đã thu được tọa độ của hộp giới hạn bảng bằng Camelot, nhưng tôi cần sử dụng tabula-py để trích xuất dữ liệu bảng, vì camelot chỉ trích xuất dòng đầu tiên trong mỗi ô của bảng, ngay cả trong chế độ mạng. Tôi đã nhận thấy rằng khi xác định cùng một vùng bảng trong tabula-py, 2 trong số các tọa độ kết quả phần lớn khác nhau ở dạng giá trị lạc đà (được hiển thị trong mẫu mã bên dưới). Trong khi các giá trị thứ 2 và thứ 4 trong tabula tương tự như giá trị thứ 1 và thứ ba trong lạc đà, thì các giá trị khác phần lớn khác nhau, làm thế nào tôi có thể dịch các bài đọc này từ các giá trị của lạc đà? Tôi đã cố gắng sử dụng tỷ lệ, và để cộng và trừ các giá trị nhưng tất cả đều vô ích ...

df = tabula.read_pdf (pdf_path, lattice = True, area = (71, 627, 325, 1160), trang = trang)

nhưng giá trị tọa độ lạc đà từ bbox là: 631, 518, 1154, 765     
2
0 Câu trả lời                              0                         
nguồn đặt đây