Durchsuchbares PDF aus TIF erstellen

    ACHTUNG: Mit der neuen EU Drohnenverordnung muß sich jeder Drohnen-Betreiber beim Luftfahrtbundesamt registrieren und seine Drohne mit der e-ID kennzeichnen! Ein passendes Kennzeichen bekommst Du hier im Shop. Außerdem benötigst Du eine Drohnen-Versicherung. Hier geht es zu unserem Drohnen-Versicherungsvergleich. Informationen zum neuen EU Drohnenführerschein gibt es hier.

    • Durchsuchbares PDF aus TIF erstellen

      Hallo,
      irgendwie stehe ich auf dem Schlauch.

      Ausgang: TIF Datei (technische Zeichnung, Drucken nur auf Plotter möglich da 1m hoch und 6m lang)
      Ziel: PDF Dokument das ich nach Text durchsuchen kann, da ich nicht bei jeder Zeichnungsänderung 6m Papier erstellen möchte.

      Wir haben kein CAD Programm, da wir nur Anwender sind und von der Entwicklung 1000km enfernt sind. Die Entwicklung ist auch nicht so kooperativ und die Daten in dem von uns benötigtem Format umzustellen

      Ich kann das TIF mittels Irfanview öffnen. Nachdem ich die Plugins installiert habe, u.a. PDF.DLL, kann ich auch die Tif als PDF speichern. Wenn ich diese jetzt mit PDF XChange Editor öffne kann ich sie aber nicht nach Text durchsuchen.

      Ich habe auch nicht die Möglichkeit beliebige Programme zu installieren.

      Kann mir jemand nen Tipp geben?
      cu Jürgen

      Ich bin nur hier weil mich die Klapse nicht wollte....
    • Auch mit dem XChange kann man da nicht viel anfangen: Ein TIF ist eine Grafikdatei. Wenn man eine Grafikdatei in ein PDF einbindet, bleibt es immer noch ne Grafikdatei und ist als solche nicht als Text editierbar.

      Es hilft in so einem Fall nur, die Textteile der Grafik zu separieren und diese Grafiken mit einem OCR Programm in Text umzuwandeln. Im Web gibt es kostenlose online OCR (einfach googeln nach "online ocr"

      Nur wenn man ein Text-Datei mit eingebundenen Grafiken (z.B. *.DOC oder *.DOCX oder entsprechenden Openoffice Formate) in eine PDF umwandelt, bleiben die Texte im Textformat und lassen sich dann editieren. Wenn Man einen Text als Grafikdatei (Foto) vorliegen hat, kann man diesen nur mittels Texterkennung (OCR) zurückverwandeln in Text.
    • Bist Du sicher, daß die Original Tiff-Datei auch Text enhält und dieser nicht in Pixel umgewandelt ist? Denn wo kein Text vorhanden ist, kann auch die daraus erzeugte PDF-Datei keinen Text daraus erzeugen, nach dem gesucht werden könnte.
      Gruß: Franki

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von Franki ()

    • Franki schrieb:

      Bist Du sicher, daß die Original Tiff-Datei auch Text enhält und dieser nicht in Pixel umgewandelt ist? Denn wo kein Text vorhanden ist, kann auch die daraus erzeugte PDF-Datei keinen Text daraus erzeugen, nach dem gesucht werden könnte.
      Doch, wie oben schon richtig angesprochen, ist "OCR" (optical character recognition) der richtige Suchbegriff. Landläufig auch Texterkennung genannt ;)
      Hierbei versucht die Software Bildinformationen mit Buchstaben abzugleichen. Klappt zwischenzeitlich auch richtig gut.
      Gerade, wenn es aber um Bauzeichnungen geht, solltest Du Dich zweimal vergewissern, dass der Text auch 100%ig richtig (!) umgewandelt wurde.
    • Es soll ja ein PDF bleiben und keine Textdatei (Word o.ä.) werden.

      Ich habe einfach PDF Dateien die sich durchsuchen lassen, andere eben nicht. Was ist da der Unterschied?

      OCR ist nicht gemeint, denn dann will ich die Datei anderweitig bearbeiten.
      cu Jürgen

      Ich bin nur hier weil mich die Klapse nicht wollte....
    • Es ist ein (großer) Unterschied, ob der Inhalt eines PDF Dokumentes als Bild oder als Text hinterlegt ist.
      Bilder lassen sich nunmal nicht durchsuchen.
      Auch wenn deine PDF Text enthält, kann es sein, dass die Informationen dahinter als "Bild"-Daten abgelegt sind. Da die Original-Datei ein TIFF (also eine Bild-Datei) ist, kann daraus ohne OCR (bzw. manuelle Eingabe) kein durchsuchbarer Text werden.
      Insofern musst Du das "Bild" erst wieder in einen Text umwandeln, damit Du einzelne Begriffe/Zeichen darin auch suchen kannst.

      ==> OCR
    • jogie63 schrieb:

      Hallo,
      irgendwie stehe ich auf dem Schlauch.

      Ausgang: TIF Datei (technische Zeichnung, Drucken nur auf Plotter möglich da 1m hoch und 6m lang)
      Ziel: PDF Dokument das ich nach Text durchsuchen kann, da ich nicht bei jeder Zeichnungsänderung 6m Papier erstellen möchte.

      Wir haben kein CAD Programm, da wir nur Anwender sind und von der Entwicklung 1000km enfernt sind. Die Entwicklung ist auch nicht so kooperativ und die Daten in dem von uns benötigtem Format umzustellen

      Ich kann das TIF mittels Irfanview öffnen. Nachdem ich die Plugins installiert habe, u.a. PDF.DLL, kann ich auch die Tif als PDF speichern. Wenn ich diese jetzt mit PDF XChange Editor öffne kann ich sie aber nicht nach Text durchsuchen.

      Ich habe auch nicht die Möglichkeit beliebige Programme zu installieren.

      Kann mir jemand nen Tipp geben?
      Hallo jogie63,
      im kostenlosen PDF XChange PDF Viewer kann man auf "Text erkennen" klicken. Dann wird die Grafik in durchsuchbaren Text umgewandelt. Bei guten Scans oder Grafiken funktioniert das.
      Gruß
    • Eine durchsuchbare Text Datei besteht aus einer Reihe von Bytes. Jeder Buchstabe hat einen bestimmten Byte Wert (ASCII-Code) Da gibt es eine ASCII-Tabelle, in der der Wert jedes Buchstaben aufgelistet ist.

      Man kann einen Text auch fotografieren: Dann bestehen die Buchstaben aber nicht aus zugeordneten Bitfolgen (Bytes), sondern werden als Pixel dargestellt. Die Pixel-Anordnung in einem Bild ist aber so vielfältig, dass sie keinem Buchstaben zugeordnet werden kann. Ein Zeichen in einem Text hat eine bestimmte Ordnung an Bits (Anzahl Bits).

      Wenn also eine PDF Datei aus Text besteht, kann man sie editieren. Wenn der Text aber aus einer fotografischen Abbildung (TIF-Datei) besteht, kann man das NICHT.

      Links ist ein Text Foto, das man nicht editieren kann!Auch wenn der Inhalt etwas anderes suggeriert.
    • Hallo Emil,
      das ist nicht ganz richtig. Wenn Du deine Grafik in ein PDF-Dokument umwandelst und dann wie ich oben geschrieben habe im kostenlosen PDF XChange PDF Viewer auf "Text erkennen" klickst, bekommst Du reinen Text den man auch durchsuchen kann. Ich habe es gerade getestet und es funktioniert.
      Gruß
    • petro88 schrieb:

      das ist nicht ganz richtig. Wenn Du deine Grafik in ein PDF-Dokument umwandelst und dann wie ich oben geschrieben habe im kostenlosen PDF XChange PDF Viewer auf "Text erkennen" klickst, bekommst Du reinen Text den man auch durchsuchen kann. Ich habe es gerade getestet und es funktioniert.
      richtig. Aber das geht eben erst nach einer (OCR)-Texterkennung!
    • Ich hab die kostenlose Version XChange ausprobiert. Da kam bei mir Meldung, dass OCR nur in der (nicht kostenlosen) Vollversion funktioniert. Hab mir dann noch ne ältere Version besorgt, da gibt es zwar im Menü einen "OCR" Button, aber mit dem bekam ich kein Ergebnis.

      Ich bleib bei meinem Weg mit "Online OCR", da brauch ich nichts zu installieren, und die Ergebnisse sind gut.
    • In meiner kostenlosen Version von Xchange Editor funktioniert das tadellos. Ich ziehe eine TIF Datei in den Editor, klicke auf "Text auf Seiten erkennen", und kann die Datei dann als durchsuchbare PDF mit richtigem text speichern. Die Texterkennung funktioniert prima. Ich benutze die immer wenn ich etwas in JPG Screenshots suche.
      Hat den Vorteil dass man nicht irgendwelchen Firmen seine Dokumente schicken muss um deren Server die Texterkennung durchführen zu lassen.
    • Mit der lizensierten Version von Xchange Editor funktioniert das oben eingefügten Bild1.jpg allerdings mit sehr schlechtem Ergebnis. Die Vorlage muss also schon recht gut sein.

      Habe es mit einem selbst erzeugten Tif-Bild probiert und es funktioniert einwandfrei.

      Mein Scanner hat ebenfall eine OCR-Funktion eingebaut und somit kann man jedes Bild welches Text enthält in durchsuchbaren Text wandeln.

      Edit: Nur bei der Größe ist es wohl schlecht zu machen. :saint:
      Gruß vom Nobier
      Nicht wundern meine Tastatur verliert ab und zu Buchstaben und hat auch manchmal ein paar zu viel

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von Nobier ()