Schön langsamt geht's vorwärts
#1
Geschrieben 17 November 2004 - 08:09
Thomas Sebesta/Neunkirchen/Austria
Blog zur Sekundärliteratur: http://sebesta-seklit.net/
Online-Bibliothek zur Sekundärliteratur: http://www.librarything.de/catalog/t.sebesta
Facebook-Gruppe: https://www.facebook...tik.ge/members/
#2
Geschrieben 19 November 2004 - 19:28
Thomas Sebesta/Neunkirchen/Austria
Blog zur Sekundärliteratur: http://sebesta-seklit.net/
Online-Bibliothek zur Sekundärliteratur: http://www.librarything.de/catalog/t.sebesta
Facebook-Gruppe: https://www.facebook...tik.ge/members/
#3
Geschrieben 23 November 2004 - 17:27
Bearbeitet von t.sebesta, 23 November 2004 - 17:54.
Thomas Sebesta/Neunkirchen/Austria
Blog zur Sekundärliteratur: http://sebesta-seklit.net/
Online-Bibliothek zur Sekundärliteratur: http://www.librarything.de/catalog/t.sebesta
Facebook-Gruppe: https://www.facebook...tik.ge/members/
#4
Geschrieben 29 Januar 2005 - 21:23
13.505 Personen
72.753 Werke
16.585 Ausgaben
287 Verlage
zwar noch nicht mit allen möglichen Angaben, aber vorhanden und listbar
dazu
1.568 Serien bzw. Zyklen gelistet und mit Einzelwerk-Listen in Beta-Form ebenso
149 Verlagsreihen
dazu aber eine Anmerkung von Franz-Leo Chomse:
...ich habe alle Werke aus den alten SFHINX Beständen,
die nach der Überprüfung von
Autor, Titel, Werkart
als unbekannt eingestuft worden sind in den Hauptbestand
integriert. Dies ergab ca 60.000 Werke.
Danach habe ich alle fehlenden Verknüpfungen, die direkt
aus den Daten erneuert werden können, neu berechnet.
WorkNameLinks
AwardNameLinks
NamePersonLinks
NamePseudonymLinks
Außerdem habe ich die Werksdaten aus den ISFDB Award Nominierungen
extrahiert und die Verknüpfungen zu WorkBasics neu errechnet. Dies
ergab ca 10.000 zusätzliche Werkssätze.
Die Werke hängen im Moment ziemlich in der Luft, da ich nur Beziehungen
übernehmen konnte, wenn beide Partner aus demselben Originalbestand stammen.
Die anderen müssen warten, bis die übrigen Datensätze aus den SFHINX
Beständen mit ihren Partnern im DSFDB Bestand verknüpft werden können.
Durch die berechneten Verknüpfungen sollten die Werke aber entweder über
Awards oder über einen Personennamen ereichbar sein.
Die Qualität des Bestandes ist noch nicht sehr groß. Leichte Änderungen
in der Schreibweise des Titels oder des Autors führen automatisch zu Doubletten.
(siehe Scheer, K. H. und Scheer, Karl-Herbert).
Dies ist der letzte größerer Datenzuwachs für die nächste Zeit, da als
nächstes die Verlage und Reihen manuell gemischt werden müssen, bevor
die Ausgaben getestet werden können.
Es wird nun am Webend-Team liegen hier reinen Tisch zu machen. Das werden wir auch als nächstes Ziel setzen.
Gruß
Thomas
Thomas Sebesta/Neunkirchen/Austria
Blog zur Sekundärliteratur: http://sebesta-seklit.net/
Online-Bibliothek zur Sekundärliteratur: http://www.librarything.de/catalog/t.sebesta
Facebook-Gruppe: https://www.facebook...tik.ge/members/
#5
Geschrieben 02 Februar 2005 - 11:43
Eine Entschuldigung an diejenigen die Daten via Web eingeben. Wir sind in der Lage die eingegeben Daten in das Arbeitsformat unserer lokalen Hauptkopie zu konvertieren und damit genauso zu bearbeiten wie die vom Projekt SFHINX geerbten Bestände. Das Problem ist wie üblich die Mannpower. Es werden sowohl noch Module für den automatischen Abgleich und solche für den manuellen Abgleich benötigt. Im Moment liegt der Schwerpunkt auf den automatischen Abgleich, während für die via Web eingegebenen Daten ein manueller Abgleich benötigt wird (Änderungen müssen eben manuell überprüft werden). Aber der automaitsche Abgleich und die vorrangige Bearbeitung der SFHINX Bestände liefert größere Mengen an Informationen (bei viel geringerer Qualität) und größere Datenmengen ist das, was wir im Moment für das Testen unserer Skripte benötigen. Änderungen zur Verbesserung der Performance sind eben am einfachstes je früher sie gemacht werden. MfG Franz-LeoWieder eine Lieferung eingetroffen (neuer Stand)
Besucher die dieses Thema lesen: 2
Mitglieder: 0, Gäste: 2, unsichtbare Mitglieder: 0