0 Вопрос: Как переключать координаты области таблицы в Python Camelot и Tabula-Py

вопрос создан в Wed, May 8, 2019 12:00 AM

Я получил координаты ограничивающей рамки таблицы с помощью Camelot, но мне нужно использовать tabula-py для извлечения данных таблицы, поскольку camelot извлекает только первую строку в каждой ячейке таблицы, даже в режиме решетки. Я заметил, что при определении одной и той же области таблицы в tabula-py 2 из полученных координат в значительной степени отличаются от значений camelot (показано в примере кода ниже). В то время как 2-е и 4-е значения в таблице похожи на 1-е и третье значения в Camelot, остальные в значительной степени отличаются, как я могу перевести эти показания из значений Camelot, пожалуйста? Я пытался использовать пропорции, а также складывать и вычитать значения, но все было напрасно ...

df = tabula.read_pdf (pdf_path, lattice = True, area = (71, 627, 325, 1160), pages = page)

но значения координат camelot из bbox: 631, 518, 1154, 765

    
2
0 ответов                              0                         
источник размещен Вот