Datenformate – Hilfe!
Die Digitalisierung macht Daten zum Archiv der Zukunft. Im Alltag zeigen sich immer wieder mal Probleme, wenn sie von A nach B transferiert werden. Eine kleine Erhellung im Dschungel von Bild und Textdaten.
Jede Software erzeugt bestimmte Daten, die miteinander «kommunizieren» können. Es gibt Einzeldaten (z. B. Bilder aus Kameras), Dokumentdaten (z. B. Worddokumente oder Powerpoint-Präsentationen) und Containerdaten (z. B. PDF), die Unterschiedliches enthalten können. Standards sorgen dafür, dass Daten möglichst verlustfrei von der einen Software zur anderen übertragen werden. Das Bild der Kamera soll in Word importiert und auf dem Drucker ausgegeben werden können, ohne dass es zu Qualitätsverlusten kommt. Im Normalfall sind Softwares so aufeinander abgestimmt, dass Daten miteinander kompatibel sind. In der Praxis gibt es Schwierigkeiten, wenn unterschiedliche Betriebssysteme im Spiel sind (Apple iOS / Windows) oder ältere mit jüngeren Versionen (Windows XP / 10) Da-ten austauschen möchten. Auch fremdsprachige Versionen oder Plug-ins (Programm-ergänzungen) können zu Störungen führen. Zudem ist Microsoft Office inzwischen so ausgebaut, dass Interaktivität möglich ist oder Filme eingebaut werden können. Diese vielschichtige «Übungsanlage» macht es fast unmöglich, dass der Datentausch immer reibungslos verläuft. Ich möchte hier in den Grundzügen aufzeigen, welche Bild- und Textdaten in der Office-Umgebung existieren und welche Stolpersteine im Weg liegen.
Alle Daten brauchen eine Endung, damit sie überhaupt als Datei einer Software identifiziert werden. Diese Endung wird vom Dateinamen mit einem Punkt getrennt. Bei Word trägt das Dokument die Endung .doc. Wer Dokumente anderen zur Verfügung stellen will, hängt zusätzlich ein x an: docx, pptx oder xlsx. Word kann verschiedene Formate speichern, die im Menü «Speichern unter…» ersichtlich sind: .rtf, .txt oder .htm sind beispielsweise reine Textformate, ohne Formatierung und ohne Objekte oder Bilder. An der Endung erkennt man den Dateityp oder von welcher Software die Datei eventuell stammt. Ob gross- oder kleingeschrieben, ist egal. Eine vollständige Liste der Dateiendungen, ihre Erklärung und die Verwendung von digitalen Daten finden Sie auf dem Internet unter wikipedia.org, Suchwort «Liste von Dateinamenserweiterungen».
Pixeldaten
Kameras oder Bildverarbeitungsprogramme wie Photoshop generieren pixelbasierte Bilddateien. Ein einzelner Pixel ist das kleinste darstellbare Element, das als farbiges Quadrat dargestellt wird, sofern man immer weiter in das Bild hineinzoomt. Eine Kamera mit einem 12-Megapixel-Sensor erzeugt eine Bilddatei 4000 × 3000 Pixel. Man kann sich die Bilddatei als einen Haufen kleinster Quadrate vorstellen, die alle eine zugewiesene Farbe aufweisen. Wenn Bilddaten vergrössert werden, wachsen die Quadrate mit. Je grösser das Bild, desto deutlicher werden die Quadrate sichtbar.
Kameras können Bilder in bestimmten Feinheiten auf ihren Sensor aufzeichnen, was mit Auflösung bezeichnet wird. Eine übliche Spiegelreflexkamera kann heute zum Beispiel 24 Megapixel auflösen, was 6000 × 4000 Pixel entspricht. Die Auflösung von Bilddaten wird in pixel per inch (ppi) gemessen. Umgangssprachlich ist auch oft von dpi (dots per inch) die Rede. Im Internet gelten 100 ppi als Standard, in der Office-Umgebung 150 ppi und im hochwertigen Offsetdruck 300 ppi. Es gilt aus technischen Gründen der Umrechnungsfaktor 120, um von Pixel auf die druckbare Grösse in cm zu gelangen: 6000 : 120 = 50 cm; 4000 : 120 = 33,3 cm. Das 24-Megapixelbild kann also im Format 50 × 33,3 cm in Offset gedruckt werden. Wenn die Bilddaten über die geeignete Auflösung hinaus vergrössert werden, entstehen verpixelte Treppenstufen oder andere unschöne Effekte. Pixeldateien haben das Suffix JPG oder JPEG, PNG, TIFF, BMP, GIF, MPG oder MPEG (Video), das Originalformat von Photoshop endet auf PSD.
Eingescannte Dokumente wie Rechnungen oder Zeugnisse werden ebenfalls in einem -Pixelformat abgespeichert. Wenn die Schrift mit dem Cursor nicht mehr bearbeitet werden kann, liegt ein Pixelformat vor, die Buchstaben wurden zu «Bildern» umgewandelt. Wenn die Buchstaben mit dem Cursor «greifbar» sind, wie dies bei PDF sein kann, liegt ein Vektor-format vor. Es wäre wünschenswert, wenn Dokumente wie Arbeits- und Schulzeugnisse oder Testate digital als PDF abgegeben und nicht in Papierform ausgehändigt würden. Es würde den digitalen Transport erleichtern, denn Pixeldaten sind als Dateigrösse sehr schwer. Ein farbiges A4-Blatt ist in einer Auflösung von 150 ppi bereits 6,22 MB gross. Solche Dateien lassen sich schwer an Mails anhängen, sie verstopfen Server und vergraulen Empfänger.
Immerhin gibt’s Komprimierungssoftware, die grosse Dateien erheblich verkleinert. JPG (gesprochen Tschei-Päg) ist ein solches Format für Pixeldaten. Es gibt 12 Stufen, ein Bild mehr oder weniger stark zu komprimieren, mit zunehmenden Qualitätsverlusten (Leserlichkeit der Schrift) und abnehmender Dateigrösse. Logodateien aus dem Internet für Officedateien zu kopieren, ist nicht empfehlenswert, da sie wegen solcher Komprimierungsverluste schlecht aussehen.
Wenn ein Logo in Microsoft Word eingesetzt wird (Einfügen > Bild > Aus Datei), wird es in ein «Word-Format» umgewandelt. Dabei gehen wichtige Informationen, zum Beispiel über die Farben (CMYK oder Pantone), verloren. Der Verlust der Information ist unwiederbringlich; einmal in Word importiert, kann das Logo nicht mehr in den Originalzustand gesetzt werden. Word ist generell als Transportvehikel ungeeignet, Logos einem Grafiker, einer Agentur oder einer Druckerei zu übermitteln.
Daten beinhalten Informationen zur Farbe, die in unterschiedlichen Programmen auch un-terschiedlich interpretiert wird. Deswegen kommt es zu Differenzen der Farbdarstellung in Word, Excel oder Powerpoint, im Webbrowser oder bei der Ausgabe auf einem Büro-drucker. Leider. Die Differenzen in der Farbdarstellung sind bei Logos, Farbflächen oder Bildern einfach hinzunehmen – sie zu eliminieren, ist mit relativ grossem Aufwand (Stichwort Color Management) verbunden.
Vektordaten
Bei der zweite Kategorie Daten liegen mathematische Beschreibungen zugrunde. Kurven und Geraden werden mittels Punkten und Vektoren (Richtungen) definiert (siehe kleine Abbildung). Bei Vektoren kann die Form, Kontur und Füllung beschrieben werden. Diese mathematischen Formeln erzeugen unabhängig von der Grösse immer dieselben Formen. Dadurch werden Buchstaben oder Symbole auf dem Bildschirm oder auf dem Papier immer gleich randscharf abgebildet. Es ist egal, wie gross man die Buchstaben schreibt oder wie weit man in sie hineinzoomt.
Alle grafischen oder typografischen Elemente wie Schrift, Linie, Flächen, Muster und dergleichen sind Vektordaten. Sie können heute farbig, in Graustufen oder schwarzweiss ausgestaltet sein. Ein typisches Anwendungsbeispiel sind Logos, die für alle Zwecke vergrössert werden müssen. Vektordaten haben das Suffix .eps oder .ai, das Originalformat von Adobe Illustrator. Illustrator kann auch das Format PDF ausgeben, die Vektoren bleiben erhalten. Das Vektorformat ist so quasi das Originalformat. Es gibt Anwendungen wie Internet-Tools, die können keine Vektordaten einpflegen, deshalb kann man jede Vektordatei in eine Pixeldatei umwandeln, umgekehrt geht das nicht.
Dokumentdaten
Daten, die mit dem Befehl «Sichern» oder «Sichern unter…» erzeugt werden, kennen alle. Mittlerweile kommunizieren Betriebssysteme so gut miteinander, dass höchstens Probleme entstehen, wenn eine neuere Datei aus Windows 10 auf einem Rechner mit Windows XP geöffnet werden soll. Kein Datenformat ist automatisch rückwärtskompatibel, weil neuere Formatierungsmöglichkeiten im alten Programm nicht dargestellt werden können. Auch von Windows zu Apple und umgekehrt funktioniert heute ein Datentausch weitgehend. Immer wieder zu Schwierigkeiten führen fehlende Schriften, die in der einen Welt nicht vorhanden sind. Standardschriften, die auch im Internet üblich sind, minimieren solche Probleme.
Containerdaten
Das Austauschformat PDF gilt für alle Welten und Betriebssysteme – PDF können alle lesen. Ein PDF ist wie ein Sammelcontainer, der alle Einzeldaten und Programmdaten aufnehmen kann. Beim PDF werden Schriften eingebunden, sodass diese Probleme behoben sind. Zudem kann PDF interaktiv gestaltet sein, Links oder Videoclips kann man einfach einbauen oder damit Formulare zum digitalen Ausfüllen gestalten. PDF ist nicht dasselbe wie ZIP, welches verschiedene Dateien in eine ZIP-Datei verpackt und wieder entpackt. PDF ist das Standardformat für Druckdaten, PDFX-4 ist die neuste Generation. Es ist empfehlenswert, mit Druckdienstleistern vorab Kontakt aufzunehmen, um das richtige PDF für einen pannenfreien Druck zu erzeugen.