ssf logo blue Rötter - din källa för släktforskning driven av Sveriges Släktforskarförbund
ssf logo blue Rötter - din källa för släktforskning

Choose language:
Anbytarforum

Innehållet i inläggen på Anbytarforum omfattas inte av utgivningsbeviset för rotter.se

Författare Ämne: SGML och släktforskning  (läst 1762 gånger)

1999-09-18, 11:58
läst 1762 gånger

Utloggad Bo Rosén

  • Anbytare **
  • Antal inlägg: 21
  • Senast inloggad: 2024-01-01, 09:11
    • Visa profil
    • www.bokrosen.eu/bloggen
Hej!
    Jag undrar om någon har erfarenhet av att använda SGML i sitt släktforskande? Vad jag förstår kan man använda det både för analys av materialet och för produktion av läsbara dokument i olika format (tex pdf, ps, html mm)
Jag är själv relativt grön på området, men har använt Docbook under Linux, men detta lämpar sig inte riktigt till genealogiskt material. Däremot  finns det något som heter TEI, för humanistiskt material  
(se http://etext.lib.virginia.edu/TEI.html)
 
Någon som vet något?
 
Bo Rosén

2001-07-20, 03:23
Svar #1

Utloggad Pernilla Herlitz

  • Anbytare *
  • Antal inlägg: 16
  • Senast inloggad: 2014-01-23, 21:56
    • Visa profil
Hej Bo Rosén.
 
SGML skulle vara utmärkt för släktforskning men problemet där liksom i GEDCOM är standardisering av dokument. SGML löser inte problemet själv utan ger oss bara ett verktyg att skapa dokument med struktur. Om vi sedan inte använder samma struktur innebär det problem när vi ska byta mellan varandra (läses svordommar).

2001-07-20, 07:49
Svar #2

Utloggad Kaj Janzon

  • Anbytare *****
  • Antal inlägg: 1293
  • Senast inloggad: 2022-01-14, 10:41
    • Visa profil
    • www.medeltiden.st
Det medeltida Sverige experimenterade en tid med SGML/TEI i samarbete med KTH. Resultaten var mycket lovande men vi tvingades överge projektet pga resursbrist. En del av arbetet kan beskådas på följande adress:
 
http://www.nada.kth.se/~broady/diglit/sgml-docs/jjxrapport/xrapport.html
 
mvh
Kaj Janzon

2001-07-20, 11:23
Svar #3

Utloggad Bo Rosén

  • Anbytare **
  • Antal inlägg: 21
  • Senast inloggad: 2024-01-01, 09:11
    • Visa profil
    • www.bokrosen.eu/bloggen
PWa -
Jag kan inte så mycket om sådant här egentligen, men borde man inte kunna göra en DTD för GEDCOM? Jag är själv inblandad i utvecklingen av ett släktforskningsprogram (som buggjägare och översättare) där den interna databasen är i xml.
Av programmerarens kommentarer att döma, är det mycket olika hur väl olika program följer GEDCOM-standarden, så nog förekommer det en och annan svordom redan nu...
 
Egentligen är det väl en fråga om hela GEDCOM-standarden borde flyttas över till XML.  
 
Mvh,
     Bo

2001-07-20, 11:29
Svar #4

Utloggad Bo Rosén

  • Anbytare **
  • Antal inlägg: 21
  • Senast inloggad: 2024-01-01, 09:11
    • Visa profil
    • www.bokrosen.eu/bloggen
Kaj -  
    Det var just det projektet som fick mig att börja tänka i dessa banor.
Synd att ni inte fick mer pengar, det ser väldigt intressant ut
 
Mvh,
Bo

2001-07-20, 20:39
Svar #5

Utloggad Sten-Sture Tersmeden

  • Anbytare ***
  • Antal inlägg: 489
  • Senast inloggad: 2017-02-14, 20:51
    • Visa profil
I Ancestry.com eller i Eastman's nyhetsbrev någon gång under året läste en jag om att mormonerna som ligger bakom GEDCOM funderade på att använda XML, men senare skippade den tanken. Det sas vidare att XML inte löste det grundläggade problemet med ofullständiga definitioner i GEDCOM. Någon ny GEDCOM tyx det inte heller bli!
Den som är intresserad rekommenderas att leta upp artikeln, ev har jag en utskrift någonstans med web-adress.

2001-07-20, 20:58
Svar #6

Utloggad Pernilla Herlitz

  • Anbytare *
  • Antal inlägg: 16
  • Senast inloggad: 2014-01-23, 21:56
    • Visa profil
Hej Bo Rosén
 
Problemet med GEDCOM är vad jag kan förstå det att programmakarna inte kan eller vill följa den standarden strikt. Detta kan dels bero på att GEDCOM inte är väl definierad men även att den kan vara svår att förstå.
 
Vid ett snabbt blick på standarden så tycker jag att den borde gå att använda (jag ska försöka förklara varför jag tycker så).
 
Du talar om DTD (Document Type Definiton) och det kanske finns ett struktur problem i GEDCOM, jag har som hastigast tittat igenom GEDCOM5.5 och tycker mig se en struktur. Struktur frågan lämnar jag dock över till Kaj Janzon som uppenbarligen har mer kunskap i dessa frågor.
 
Om vi talar om DTD i form av Data Type Definiton så verkar GEDCOM erbjuda iaf relations defintioner (typ, en till många, många till många, etc.). Dessutom verkar den ha storleksdefintion på fälten. Som exempel tar jag ADDRESS_COUNTRY.
 
ADDRESS_COUNTRY:= {Size=1:60}  
The name of the country that pertains to the associated address. Isolated by some systems for sorting or indexing. Used in most cases to facilitate automatic sorting of mail.
 
Den har en beskrivning om innehåll och en storleks def. Det andra exemplet är struktur. Vi tar Individual_Event_Structure som exempel.
 
INDIVIDUAL_EVENT_STRUCTURE:=  
n EVEN                 {1:1}  
  +1 > {0:1}
 
Här kan vi se att GEDCOM visar hur en händelse skall beskrivas. n beskriver vilken nivå händelsen befinner sig på. EVEN är taggen för händelsen. {1:1} antar jag är en relations hänvisning (jmf databas modellering). Sedan kommer det intressanta. Detaljerna, detaljerna kan variera från plats, person, datum, etc.
 
1 EVEN
  2 TYPE Surfade på internet
  2 DATE idag/denna måndad/detta år
  2 PLAC Hemma
 
Sedan kan jag bygga på denna händelse med i princip vad jag vill. Nu kommer poängen med hela grejjen.
 
Trots att det verkar finnas struktur och data definiton i GEDCOM så kvarstår ändå problemet med transformation eller mappning. Varför? Jag misstänker som jag tigigare sagt att det beror på att programvaruhusen inte tar problemet på allvar. Men det kan också bero på semantisk missmatch. Denna term används inom datorspråket när man överför information från ett språk till ett annat, dvs betydelsen finns inte riktigt i det ena språket. Om felet beror på detta så hjälper inte byte från GEDCOM till SGML eller XML.
 
Varför det kan man då fråga sig. Jo om det ligger till så att Program A och Program B inte har exakt samma funktioner eller definerar samma sak som olika saker (tex, nyåret för kinerser och västerlänningar) då uppstår problem när man skall mappa den ena informationen till det andra programmet. Låt oss säga att Program A stödjer homosexuella giftermål, låt oss också säga att GEDCOMn.n stödjer sk. både giftermål och partnerskap och slutligen Program B som inte stödjer homoskexuella giftermål men dock partnerskap. Vad kommer då att hända när man mappar relationen? Program A --> GEDCOM == Giftermål mellan A(pojke) och B(pojke) i kyrka A. GEDCOM --> Program B == Giftermål A(pojke) och B(flicka) i kyrka A eller Partnerskap A(pojke) och B(pojke) men ingen kyrka. Hursomhelst så blir det fel och kan sabba vilken relation som helst (vitsig), men semantisk missmatch verkar dock inte vara det vanligaste transformationsfelet inom släktforskning.
 
Det transformationsfel som verkar vara oftast förekommande är teckentabells fel. Dvs ö blir | eller något. Denna typ av fel är ganska enkelt att komma till rätta med se mitt inlägg under GEDCOM. På tal om detta så kan ni se att { inte skall vara { utan ett vänstermåsvingeklammer, inte bara släktforskningsprogrammen lider av transformationsproblem mellan olika teckentabeller ;)  
 
Jag vet inte om varken du eller jag har blivit klokare men skrivet är det dock!

2001-07-21, 11:56
Svar #7

Utloggad Håkan Skogsjö

  • Anbytare *****
  • Antal inlägg: 1443
  • Senast inloggad: 2013-04-24, 08:42
    • Visa profil
    • www.bokhandeln.ax
PWa, notera ordningsreglerna. Den som deltar i Anbytarforum ska ange sitt riktiga för- och efternamn. Anonyma inlägg är inte tillåtna.

2001-07-21, 13:03
Svar #8

Utloggad Jens Arvidsson

  • Anbytare ***
  • Antal inlägg: 173
  • Senast inloggad: 2011-10-27, 09:36
    • Visa profil
Det förefaller som att intresset för frågor om standardisering för kodning av genealogiska data är betydligt större i USA än i Sverige. Där verkar det vara en del arbete igång för en utveckling på området.
För en tid sedan fördes på epostlistan Gedcom-l en intensiv diskussion om organisationen Gentech (USA-baserad, ett flertal av de större usoniska organisationerna för släktforskning förefaller vara involverade. Bland ledamöterna i Gentech finns Bob Velke, skaparen av The Master Genealogist) och deras projekt Genealogical Data Model, GDM, en teoretisk modell, vilken man ska kunna använda för att skapa en standard för att koda genealogiska data.  
GDM är ganska komplicerad och jag har bara tittat ytligt i specifikationen, men den intressantaste skillnaden mot Gedcom är att de grundläggande enheterna i datastrukturen inte är familjebanden, istället bygger man utifrån grundstenarna för själva forskningsarbetet; de faktiska händelserna som de omnämns i källorna (EVENts och SOURces i Gedcom).  
Praktiska implementationer finns det väl inte mycket av än så länge (specifikationen som finns är publicerad som en RFC (Request For Comments), men vad jag förstår så är arbetsgången i The Master Genealogist upplagd på det här sättet. Det finns också en äldre variant av Gedcom som är upplagd på ett liknande sätt, Event-baserad gedcom, skapat av något av någon amerikansk programmakare. Detta fick dock aldrig något genomslag.
Ett annat projekt som verkar intressant är ett schema för genealogiska data i XML, GedML, som skrivits av en som heter Michael Kay (några år gammalt nu). Se http://users.iclway.co.uk/mhkay/gedml/.

2001-07-21, 13:50
Svar #9

Utloggad Jens Arvidsson

  • Anbytare ***
  • Antal inlägg: 173
  • Senast inloggad: 2011-10-27, 09:36
    • Visa profil
Apropå problemen med Gedcom i dess nuvarande form, så är jag inte kunnig nog att dra egna slutsatser av specifikationen, men vad jag förstått av mer kunniga personers utsagor, så är många av definitionerna i den både för vida och för otydliga. Exempel på det förstnämnda är att källor kan noteras på flera olika sätt, exempel på det sistnämnda är definitionen av taggen EMIG, som en del program tolkar som utflyttning, och andra som emigration.
 
Följden har blivit att det inte finns två programmerare som tolkar Gedcom-standarden lika.
 
Ett annat, och mer grundläggande problem är att Gedcom från början inte skrevs för att släktforskare skulle ha en modell för hur de ska notera data, utan för att mormonkyrkan skulle ha ett sätt att arbeta med de data som de samlar in av sina medlemmar, för användning i religiösa ceremonier (det är också därför som man hittar en hel del taggar som bara är applicerbara på mormoner i standarden).
 
Vad jag som användare av flera olika släktforskningsprogram, där inga utbyten av data dem emellan är helt smärtfria, skulle vilja se, är en standardiseringskommission för genealogiska data, där målet skulle vara att presentera en modell som hanterar de ovanstående problemen. Gentech som jag nämnde i föregående inlägg förefaller vara ett ambitiöst försök åt det hållet, men verkar vara en rent USA-amerikansk affär, och ligger kanske också mer på ett teoretiskt än ett tillämpat plan än så länge.

2001-07-21, 14:37
Svar #10

Bernhard Granholm (Bkvg)

Hej Håkan
Här börjar dyka upp nya förkortningar som SGML m fl när det gäller dataöverföring.
Det kanske tillhör allmänbildningen att veta vad SGML står för. Jag vill dock riskera att bli betraktad som insnöad genom att fråga.  
 
Jag tycker det vore bra om förbundet eller Rötter tog fram en liten ordlista för de beteckningar som förekommit under denna rubrik, med sammanfattande förklaringar.

2001-07-21, 15:06
Svar #11

Utloggad Sven-Ove Brattström

  • Anbytare *****
  • Antal inlägg: 3276
  • Senast inloggad: 2024-02-09, 14:25
  • Bilden är gammal, mera rynkor nu :)
    • Visa profil
Brattis (före 2004 Linewizard) = Sven-Ove Brattström

2001-07-21, 23:44
Svar #12

Utloggad Sten-Sture Tersmeden

  • Anbytare ***
  • Antal inlägg: 489
  • Senast inloggad: 2017-02-14, 20:51
    • Visa profil

2001-07-22, 21:15
Svar #13

Utloggad Jens Arvidsson

  • Anbytare ***
  • Antal inlägg: 173
  • Senast inloggad: 2011-10-27, 09:36
    • Visa profil
Sten-Sture!
 
Intressanta artiklar.  
 
Men om jag förstår innehållet rätt så är det inte arbetet med att XMLifiera Gedcom som mormonerna avbrutit, det är de tidigare aviserade förbättringarna av bristerna i nuvarande gedcomstandard som inte kommer att bli av.

Innehållet i inläggen på Anbytarforum omfattas inte av utgivningsbeviset för rotter.se


Annonser




Marknaden

elgenstierna utan-bakgrund 270pxKöp och Sälj

Här kan du köpa eller sälja vidare böcker och andra produkter som är släktforskaren till hjälp.

Se de senast inlagda annonserna