<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>vfm-Weblog für Mediendokumentation &#187; Printdokumentation</title>
	<atom:link href="https://www.vfm-online.de/weblog/category/projektportal/technologien/printdokumentation/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.vfm-online.de/weblog</link>
	<description>Austauschplattform für Mediendokumentation und -information</description>
	<lastBuildDate>Fri, 12 Oct 2018 14:52:16 +0000</lastBuildDate>
	<language>de-DE</language>
		<sy:updatePeriod>hourly</sy:updatePeriod>
		<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=3.8.41</generator>
	<item>
		<title>DDR-Tageszeitungen</title>
		<link>https://www.vfm-online.de/weblog/ddr-tageszeitungen-der-staatsbibliothek-zu-berlin/</link>
		<comments>https://www.vfm-online.de/weblog/ddr-tageszeitungen-der-staatsbibliothek-zu-berlin/#comments</comments>
		<pubDate>Fri, 24 May 2013 13:28:26 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Printdokumentation]]></category>
		<category><![CDATA[Projektportal]]></category>
		<category><![CDATA[Referenzprojekte]]></category>

		<guid isPermaLink="false">http://www.vfm-online.de/weblog/?p=76</guid>
		<description><![CDATA[DDR-Tageszeitungen der Staatsbibliothek zu Berlin Name DDR-Tageszeitungen der Staatsbibliothek zu Berlin Projektart Forschung/Anwendung Auftraggeber DFG Laufzeit/Jahr 2012 Auftragnehmer Staatsbibliothek zu Berlin, Fraunhofer IAIS, ArchivInForm Kurzbeschreibung Das von der DFG geförderte Projekt digitalisiert und erschließt semi-automatisch drei DDR-Tageszeitungen (Neues Deutschland, Berliner Zeitung, Neue Zeit) mit allen Ausgaben von 1946-1990. Gut 400.000 Zeitungsseiten werden dabei gescannt, Scan- [&#8230;]]]></description>
				<content:encoded><![CDATA[<h1>DDR-Tageszeitungen der Staatsbibliothek zu Berlin</h1>
<h2>Name</h2>
<p>DDR-Tageszeitungen der Staatsbibliothek zu Berlin</p>
<h2>Projektart</h2>
<p>Forschung/Anwendung</p>
<h2>Auftraggeber</h2>
<p>DFG</p>
<h2>Laufzeit/Jahr</h2>
<p>2012</p>
<h2>Auftragnehmer</h2>
<p>Staatsbibliothek zu Berlin, Fraunhofer IAIS, ArchivInForm</p>
<h2>Kurzbeschreibung</h2>
<p>Das von der DFG geförderte Projekt digitalisiert und erschließt semi-automatisch drei DDR-Tageszeitungen (Neues Deutschland, Berliner Zeitung, Neue Zeit) mit allen Ausgaben von 1946-1990. Gut 400.000 Zeitungsseiten werden dabei gescannt, Scan- und Bildfehler automatisch korrigiert und für die Erschließung zur Verfügung gestellt. Über eine Artikelsegmentierung werden Überschriften, Unterschriften und Artikelblöcke erkannt und auf Artikelebene gruppiert. Dabei werden im automatischen Schritt bereits sehr gute Ergebnisse erzielt. Eine OCR erkennt den Text im Bild und stellt die Artikel als Volltext zur Verfügung. In einer manuellen Nachbearbeitung werden die automatischen Ergebnisse optimiert und anschließend in ein gängiges Austauschformat konvertiert. Die so erschlossenen Ausgaben werden über eine Webseite abrufbar und durchsuchbar sowie zusätzlich als PDF mit Volltext bereitgestellt.</p>
<h2>Eingesetzte Technologien</h2>
<p>Automatische Scan-/Bildkorrektur, <a title="Layout-Analyse" href="http://www.vfm-online.de/weblog/layout-analyse/">Artikelsegmentierung </a>(Optical Layout Recognition, OLR), optische Zeichenerkennung (Optical Character Recognition, OCR), Artikelarchivexporter (für METS/MOTS/ALTO)</p>
<h2>Nutzungspotentiale und Einsatzgebiete</h2>
<p>Digitalisierung und Erschließung von Zeitungsarchiven; Verbesserter Zugriff auf Archivinhalte (Durchsuchbarkeit); Redaktionelle Suche; Erstellung kultureller/historischer Sonderausgaben; Recherchesystem für Historiker</p>
<h2>Webseiten/Links</h2>
<ul>
<li><a href="http://www.iais.fraunhofer.de/zeitungserschliessung.html" target="_blank">http://www.iais.fraunhofer.de/zeitungserschliessung.html</a></li>
<li><a href="http://zefys.staatsbibliothek-berlin.de/ddr-presse" target="_blank">http://zefys.staatsbibliothek-berlin.de/ddr-presse</a></li>
<li><a href="http://www.heise.de/newsticker/meldung/Berliner-Staatsbibliothek-digitalisiert-DDR-Tageszeitungen-1812537.html" target="_blank">http://www.heise.de/newsticker/meldung/Berliner-Staatsbibliothek-digitalisiert-DDR-Tageszeitungen-1812537.html</a></li>
</ul>
<h2>Ansprechpartner</h2>
<ul>
<li>Fraunhofer IAIS &#8211; <a title="Ulrich Wernecke" href="http://www.iais.fraunhofer.de/wernecke.html" target="_blank">Ulrich Wernecke</a>  (Telefon: 02241 14 2530)</li>
<li>ArchivInForm, Staatsbibliothek zu Berlin</li>
</ul>
<h2>Ansprechpartner im Medienunternehmen</h2>
<p>Dr. Lieder (Email)</p>
<h2>Bilder</h2>
]]></content:encoded>
			<wfw:commentRss>https://www.vfm-online.de/weblog/ddr-tageszeitungen-der-staatsbibliothek-zu-berlin/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Layout-Analyse</title>
		<link>https://www.vfm-online.de/weblog/layout-analyse/</link>
		<comments>https://www.vfm-online.de/weblog/layout-analyse/#comments</comments>
		<pubDate>Fri, 24 May 2013 09:22:20 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Printdokumentation]]></category>
		<category><![CDATA[Projektportal]]></category>

		<guid isPermaLink="false">http://www.vfm-online.de/weblog/?p=47</guid>
		<description><![CDATA[Name Layout-Analyse: Artikelsegmentierung von digitalisierten Zeitungsseiten Funktionsweise Bei der Artikelsegmentierung werden Zeitungsseiten automatisch in einzelne Artikel zerlegt. Jeder Artikel wird mit den genauen Koordinationsdaten gespeichert. Im Fall von z.B. Zeitungen werden dann XML-Beschreibungen der logischen und physischen Struktur von Dokumenten auf der Ebene von Artikeln erzeugt. Damit steht jeder Artikel als einzelnes Asset und Datenendpunkt [&#8230;]]]></description>
				<content:encoded><![CDATA[<h2>Name</h2>
<p>Layout-Analyse: Artikelsegmentierung von digitalisierten Zeitungsseiten</p>
<h2>Funktionsweise</h2>
<p>Bei der Artikelsegmentierung werden Zeitungsseiten automatisch in einzelne Artikel zerlegt. Jeder Artikel wird mit den genauen Koordinationsdaten gespeichert. Im Fall von z.B. Zeitungen werden dann XML-Beschreibungen der logischen und physischen Struktur von Dokumenten auf der Ebene von Artikeln erzeugt. Damit steht jeder Artikel als einzelnes Asset und Datenendpunkt zur Verfügung.<br />
Da eine 100% Artikelsegmentierungsgenauigkeit nicht möglich ist, werden häufig manuelle Nacherarbeitungsschritte und -tools verwendet. Trotz des manuellen Nachverarbeitungsaufwands wird durch die automatische Artikelsegmentierung der Aufwand um den Faktor 5 verringert.</p>
<h2>Nutzungspotentiale und Einsatzgebiete</h2>
<p>Erschließung von Zeitungsseiten; Archive in Bibliotheken; Zeitungs- und Zeitschriftenverlage; Unterstützung der redaktionellen Suche; Einfache Erstellung von Zeitungs-Sonderausgaben (Jubiläumsausgaben, Jahresrückblicke, chronologische Themendossiers, etc.)</p>
<h2>Referenzprojekte</h2>
<ul>
<li><a title="DDR-Tageszeitungen der Staatsbibliothek zu Berlin" href="http://www.vfm-online.de/weblog/ddr-tageszeitungen-der-staatsbibliothek-zu-berlin/">Zeitungsarchiv der Staatsbibliothek zu Berlin</a>.</li>
<li>…</li>
</ul>
<h2>Anbieter und Ansprechpartner</h2>
<p>Fraunhofer IAIS (<a href="http://www.iais.fraunhofer.de/diensteplattform-technologien.html">http://www.iais.fraunhofer.de/diensteplattform-technologien.html</a>) &#8211; <a title="Stefan Eickeler" href="http://www.iais.fraunhofer.de/eickeler.html">Dr. Stefan Eickeler</a> (Telefon: 02241 14 1969)</p>
<h2>Bilder</h2>
]]></content:encoded>
			<wfw:commentRss>https://www.vfm-online.de/weblog/layout-analyse/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
