Difference between revisions of "Genealogy2025-03-02"
Jump to navigation
Jump to search
(→Prompt) |
(→Prompt) |
||
Line 39: | Line 39: | ||
7. Formatiere Hausnummern einheitlich mit einfachen Anführungszeichen (z.B. '77d'), damit sie als Strings behandelt werden. | 7. Formatiere Hausnummern einheitlich mit einfachen Anführungszeichen (z.B. '77d'), damit sie als Strings behandelt werden. | ||
+ | </pre> | ||
+ | === ChatGPT 4o === | ||
+ | <pre> | ||
+ | Ich werde die hochgeladene Datei analysieren, den Text extrahieren und eine YAML-Datei gemäß den Vorgaben erstellen. Ich beginne mit der Texterkennung (OCR) des Bildes. | ||
+ | |||
+ | Es gibt ein Problem mit der Tesseract-Spracherkennung für Deutsch („deu“). Ich werde eine alternative Methode zur Texterkennung verwenden. | ||
+ | |||
+ | Die Texterkennung hat einige Fehler aufgrund der alten Druckschrift. Ich werde den Text bereinigen und in das gewünschte YAML-Format konvertieren. | ||
+ | |||
+ | Die YAML-Datei wurde erfolgreich erstellt. Du kannst sie hier herunterladen: | ||
</pre> | </pre> |
Revision as of 09:17, 2 March 2025
- Adressbuch Weimar 1851 GenWiki Seite
- Adressbuch Weimar 1851 Semantische Wiki Seite
- Adreß-Buch der Residenz-Stadt Weimar (1851) GOV Element
- Adressbuch Weimar 1851 Seite 40
Frauenthorstraße: ... 59 Holzhauer, Schloßtast.
⚠️ LLM-generated content notice: Parts of this page may have been created or edited with the assistance of a large language model (LLM). The prompts that have been used might be on the page itself, the discussion page or in straight forward cases the prompt was just "Write a mediawiki page on X" with X being the page name. While the content has been reviewed it might still not be accurate or error-free.
Prompt
Ich habe ein Bild aus einem historischen deutschen Adressverzeichnis (Weimarer Adressbuch 1851, Seite 40). Bitte erstelle eine YAML-Datei mit den Daten aus dieser Verzeichnisseite mit folgenden Spezifikationen: 1. Füge einen Header-Kommentar mit den Quelleninformationen ein: # Source: Weimarer Adressbuch 1851 Seite 40 # https://app.transkribus.org/collection/1950775/doc/7191492/edit?pageid=1 2. Für jeden Eintrag füge diese Felder ein: - name: [Nachname und eventuelle Titel] - strasse: [Straßenname] - hausnummer [Hausnummer] - gebaude: [Gebäudebezeichnung] - beruf: [Beruf] - zeile: [Zeile im Dokument] - spalte: [Spalte im Dokument] - qualitaet: [Geschätzte Genauigkeit der Texterkennung] 3. Straßennamen sollten mit den Hausnummern so angegeben werden, wie sie im Verzeichnis erscheinen. 4. Die Adressen folgen einer Spaltenlogik, bei der Straßennamen als Überschriften im Dokument erscheinen, und nachfolgende Einträge gehören zu dieser Straße, bis eine neue Straße erwähnt wird. 5. Beginne mit Einträgen aus der "Frauenthorstraße" und folge der Spaltenorganisation des Dokuments. 6. Die Felder "beruf" und gebauede werden in Abhängigkeit von der Angabe gefüllt. Beruf bleibt leer, wenn nur die Gebäudebezeichnung vorliegt und umgekehrt 7. Formatiere Hausnummern einheitlich mit einfachen Anführungszeichen (z.B. '77d'), damit sie als Strings behandelt werden.
ChatGPT 4o
Ich werde die hochgeladene Datei analysieren, den Text extrahieren und eine YAML-Datei gemäß den Vorgaben erstellen. Ich beginne mit der Texterkennung (OCR) des Bildes. Es gibt ein Problem mit der Tesseract-Spracherkennung für Deutsch („deu“). Ich werde eine alternative Methode zur Texterkennung verwenden. Die Texterkennung hat einige Fehler aufgrund der alten Druckschrift. Ich werde den Text bereinigen und in das gewünschte YAML-Format konvertieren. Die YAML-Datei wurde erfolgreich erstellt. Du kannst sie hier herunterladen: