Extrator de Documentos

Este script foi desenvolvido para extrair conteúdo de texto de diversos tipos de arquivos, incluindo PDFs e imagens. O texto extraído é então processado usando um serviço de IA (neste caso, o GeminiApi) para obter informações ou insights adicionais.

Pré-requisitos

Python 3.x instalado em sua máquina.
Os pacotes Python necessários podem ser instalados com o seguinte comando:
```
pip install -r requirements.txt
```

Uso

Clone o repositório:

git clone https://github.com/seu-nome/extrator-de-documentos.git

Navegue até o diretório do projeto:
```
cd extrator-de-documentos
```
Execute o script com as opções desejadas:
```
python main.py -f /caminho/para/seu/arquivo.pdf -t pdf_text
```
Substitua /caminho/para/seu/arquivo.pdf pelo caminho real do seu arquivo e pdf_text pelo tipo de arquivo desejado.

Opções da Linha de Comando

-f, --file_path: Especifique o caminho do arquivo que deseja processar.
-t, --file_type: Especifique o tipo de arquivo a ser processado (pdf_image, pdf_text, image ou text).

Exemplo

python main.py -f arquivo.pdf -t pdf_image

Licença

Este projeto está licenciado sob a Licença MIT.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
converters.py		converters.py
helpers.py		helpers.py
ia.py		ia.py
main.py		main.py
protocols.py		protocols.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Extrator de Documentos

Pré-requisitos

Uso

Opções da Linha de Comando

Exemplo

Licença

About

Releases

Packages

Languages

felipeit/extrator_de_documentos

Folders and files

Latest commit

History

Repository files navigation

Extrator de Documentos

Pré-requisitos

Uso

Opções da Linha de Comando

Exemplo

Licença

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages