Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

🚀 [Feature]📱PDF/XML parsing #643

Open
ulfgebhardt opened this issue Nov 3, 2018 · 3 comments
Open

🚀 [Feature]📱PDF/XML parsing #643

ulfgebhardt opened this issue Nov 3, 2018 · 3 comments

Comments

@ulfgebhardt
Copy link
Member

ulfgebhardt commented Nov 3, 2018

🚀 Feature

[Bundestag.io] PDF/XML parsing

Inhalte des Plenarsaalprotokolls und der Anträge/Gesetzesentwürfe parsen und verfügbar machen.

Design & Layout

Schedule

@ulfgebhardt ulfgebhardt added this to the Ideas milestone Nov 3, 2018
@ulfgebhardt ulfgebhardt changed the title 🚀 [Budnestag.io] PDF/XML parsing 🚀 [Bundestag.io] PDF/XML parsing Feb 20, 2019
@ManAnRuck
Copy link
Member

drüber gestolpert, jedoch nur überflogen. könnte hilfreich sein

https://medium.freecodecamp.org/how-to-parse-pdfs-at-scale-in-nodejs-what-to-do-and-what-not-to-do-541df9d2eec1

@visionmakery
Copy link
Member

Weiteres Feedback via Mitmachen:
"PDF-Dokumente sollten aus Datenschutzgründen nicht vom Server dipbt.bundestag.de geladen werden, sondern von einem democracy-deutschland.de-Cache- und Archivserver. Bis zur Implementation dieser Anforderung sollten die PDF-Dokumente zumindest via HTTPS geladen werden und nicht via HTTP!vergl.http://dipbt.bundestag.de/dip21/btd/19/009/1900983.pdfvs.https://dipbt.bundestag.de/dip21/btd/19/009/1900983.pdfSchönen Gruß!
"

@ulfgebhardt ulfgebhardt removed this from the Ideas milestone Aug 1, 2019
@visionmakery visionmakery changed the title 🚀 [Bundestag.io] PDF/XML parsing 🚀 [Feature]📱PDF/XML parsing Mar 3, 2020
@visionmakery
Copy link
Member

"Hallo,

vielen Dank für eure tolle App und Initiative.
Ich habe nur einen Punkt, den ich gern verbessert sehen würde, der nervt mich aber ungemein:

Die PDF Dokumente der Anträge sind zwar zoombar, um eine akzeptable Schriftgröße zu bekommen. Aber sie passen sich dabei nicht der Bildschirmgröße an. Will heißen, es gibt keine automatischen neuen Zeilenumbrüche.
Das Lesen der Anträge wird somit umständlich bis zur Nichtnutzung auf Grund von Nervigkeit.

Mir ist bewusst, dass euch die Anträge ggf. nur als eingescannte Dokumente ohne OCR vorliegen, das würde zumindest das Verhalten in der App erklären. Oder eure Readerkomponente ist halt nicht optimal.
Vielleicht gibt es ja trotzdem eine Lösung, dieses kritische Feature zu verbessern, damit die Anträge auch lesbar werden.

Vielen Dank,"

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
Status: No status
Development

No branches or pull requests

3 participants