• Bienvenue sur la nouvelle version du forum Guide de généalogie,

    Si vous avez du mal à vous connecter, faites une demande de réinitialisation de mot de passe : Réinitialiser mon mot de passe
  • Découvrez la nouvelle section du forum : Réalisations dans Généatique. Montrez et partagez vos créations d'arbres dans Généatique !
    Et participez au concours !

G2024 - BUG - Export gedcom 7 n’est pas du gedcom 7.0

Membre actif
BétaTesteur Généatique
G2024 V1.02 annonce être compatible en export de la spécification gedcom 7 mais ce n'est pas le cas.
1694886501940.png
Pourquoi ce n’est pas le cas coté export ? (coté import j'ai déjà dit que c'était très partiel aussi dans d'autres posts). Est-ce potentiellement de la publicité mensongère ou une fonction non finie ?

Je ne cite ci-dessous que les principales non conformités (et oublie volontairement les non-conformités de la 5.5.1 qui sont reconduites par l’encodage en version 7) :

a) L'entête du fichier n’est pas conforme à la spécification
- Le fichier n’est pas codé UTF-8 avec BOM (obligatoire) (*)
- Le tag CHAR est présent alors qu’il a été supprimé (il est même possible de faire un gedcom 7 encodé en ANSEL ce qui est interdit)
- La version n’est pas indiquée complétement ; actuellement on est en 7.0.13 ; indiquer GEDC.VERS 7 ne veut rien dire; la 7.1 arrivera dans les prochaines années. Au moins indiquer 7.0
- Plusieurs tags n’existent plus ou sont mal codés (FORM, …)
- Il manque la section SCHMA relative au codage des tags propriétaires
En fait c'est quasiment un gedcom 5.5.1 qui dit "je suis du 7"; de l'usurpation en quelque sorte...

b) il est possible de coder des notes (tag NOTE) dans des sections indépendantes ; Cela n’existe plus sauf pour les notes partagées (nouveau tag SNOTE). Ce que ne supporte pas Genéatique. Il faudrait retravailler la fenêtre d'export pour éviter les cas impossibles. (*)

c) les tags CONC sont encore utilisés alors que c’est interdit (longueur de ligne indéfinie pour la spécification 7)

d) certains tags auraient dû être renommés pour être conforme à la spécification. Par exemple _DCT en CREA (pour la date de création d’une structure de niveau 0 ); Sachant que Geneatique ne gère la date de création que pour le niveau individu (la spécification est plus large)

e) le tag ROLE est obligatoire dans les structures ASSO (la structure généatique reste un peu specifique)

f) le codage des sources n’est pas conforme (les anciens codages sont supprimés)
etc…

Par ailleurs, tout le jeu de caractère UTF-8 n'est pas supporté en export texte brut (l'export des notes en HTML permet de contourner mais cela impose de vouloir exporter la mise en forme aussi - cf ici)

En l’état, je recommande au CDIP de retravailler cette fonction d’export gedcom 7 et de l’inhiber temporairement tant qu’elle n’est pas opérationnellle Dans l'idéal, il faudrait 2 plans de structure de la généalogie. Une pour la spécification 5.5.1 et une pour la 7.0.x (je n'ai pas cité tous les problèmes, il y a du boulot). Il faudrait à minima implémenter partiellement les sources structurées et mettre l’entête du fichier correctement.
La seule innovation que j'ai remarqué est le codage des formats de notes via le tag MIME avec ajout du HTML qui est un embryon de codage gedcom 7

Bref, cf GEDCOM Specifications , il ne suffit pas d’indiquer "version 7" dans l’en-tête pour que ça ressemble à un gecdom 7.0. Le format gedcom 7.0 est moins permissif que le 5.5.1

A noter : si l’option de production d’un .gdz (container gedcom+médias) était implémentée ( ce qui n’est pas le cas). il faudrait que ce soit une alternative au .zip et que l’option "Exporter les images en chemin complet" soit désactivée. (Les chemins étant obligatoirement relatifs)

Cordialement
Thierry
(*)
1694887429432.png
 
Dernière édition:
Bonjour,
Grande amélioration en G2024 V1.0.4 mais il y a du reste à faire :
l'export Gedcom V7 est maintenant avec la bonne entête (UTF8 avec BOM et l'entête partiellement corrigée, indique bien 7.0), l'export des sources est en référence externe systématique (structurée) mais il y a toujours un problème pour le codage des notes (problème principal)

Encore quelques problèmes ne le rendant pas encore complétement conforme/compatible
- pas de section SCHMA dans le header gedccom pour les tag spécifiques Géneatique
1 SCHMA
2 TAG _ORG <url de description du tag sur un serveur CDIP : page web, fichier ou autre>
...
- tag _MAIL (email dans header ou rubrique) est à renommer en EMAIL (déja vrai en 5.5.1)
- tag _DCT (date création) est à renommer en CREA
- la ligne du header FORM LineageLinked est à supprimer (n'existe plus)
- la ligne du header FILE <gedcomfile> est à supprimer (n'existe plus)
- La ligne LANG FRENCH est à corriger en LANG fr (*) ou à omettre car généralement pas utilisé de toutes façons
- pour le tag NOTE les notes doivent être indiquées sans références externes (dans la structure INDI, FAM, EVT, ...) --(y) Corrigé G2024 V1.1.5
- les tags MIME (format) et TYPE (catégorie) pour les notes doivent être indiqués après la note
n NOTE <Text>
+1 MIME <MediaType>
(y) Corrigé G2024 V1.1.5
- le tag CONT dans la note doit être utilisé seulement si il y a un saut de ligne; Or il est utilisé systématiquement après une ligne NOTE sans valeur (donc provoque un saut de ligne en trop)
n NOTE
+1 CONT texte de la note
induit un saut de ligne avant le texte (ce qui n'est pas le cas); de plus comme dit ci-dessus si il y a un type et format c'est après le texte. (y) Corrigé G2024 V1.1.5
- le codage des rôles dans les personnes citées ne permet pas un échange gedcom bidirectionnel sans perte vers d'autres logiciels (cf détail et proposition ici : G2024 - BUG - Echanges rôles des personnes citées (gedcom 7.0))

Autres remarques :
- la ligne HEAD.DEST ANSTFILE ne veut rien dire, elle est optionnelle et peut être supprimée.
elle désigne maintenant "An identifier for the system expected to receive this document (suivant HEAD.SOUR). En pratique cette ligne pourrait être utilisée pour indiquer une destination spécifique (MYHERITAGE, GENEANET, ...) en cas de codage spécifique. Par exemple HEAD.DEST GENEATIQUE
Dans l'état actuel la ligne peut être supprimée
- les dates gedcom de Geneatique sont formatées avec des 0 (par exemple 01 JUL 1822); La specification indique "...day to be between 1 and a month specific maximum" donc en théorie il faudrait enlever les zeros en début d'entier (ex 1 JUL 1822)
- l'export en rtf reste possible; pourquoi pas mais le format a tendance à devenir obsolète donc intérêt très faible, voire nul. Il n'est conservé par MS que pour compatibilité descendante. En gedcom 7 cela n'a pas vraiment de sens à partir du moment où il y a le format HTML. -- (y)Corrigé G2024 V1.1.3
- L'export "en indenté" reste possible. Ce n'est pas autorisé par la grammaire, mais cela peut avoir un intérêt pour débugger; Pas gênant mais à supprimer
cf §1.3 spécification gedcom 7.0 : Line := Level D [ref D] Tag [D LineVal] EOL
- la structure CHANG_DATE (rubrique DDMF tag CHAN) est exportée sans l'heure. L'heure stockée étant dans Généatique elle pourrait être exportée (également vrai en format 5.5.1) :
n CHAN
+1 DATE <dateExact>
+2 TIME <Time>
- l'import d'un gedcom 7.0 affiche le choix du format de caractère, le choix est superflu, il pourrait être grisé (inhibé). Certains utilisateurs peu informés pourrait être tenté de saisir autre chose que UTF-8 (y) Corrigé G2024 V1.0.5
- le tag SUBM.ADDR est manquant si l'adresse est vide dans les préférences (cf G2023/24 - BUG - Structure Gedcom ADDR manquante dans soumissionnaire)

Cordialement
Thierry
(1) : i.e. selon https://www.rfc-editor.org/rfc/rfc5646.txt
 
Dernière édition:
Bonjour,
Mêmes problèmes avec G2024 V1.0.5, j'en profite pour signaler une non conformité que j'avais oublié.
Dans les événements les objets multimédia sont codés par Généatique comme en 5.5.1 :
2 OBJE
3 FILE <FILENAME>
Cette forme n'est plus autorisée.

Il faut utiliser la forme MULTIMEDIA_LINK du gedcom 7 avec une cross référence sous peine que les images ne soient pas importées par le logiciel tiers :
2 OBJE @<XREF:OBJE>@
avec
0 @<XREF:OBJE> OBJE
1 FILE <FILE REF>
2 TITL <Text légende> // si légende

Cordialement
Thierry
 
Dernière édition:
Bonjour,
Une remarque complémentaire pour les nouveaux utilisateurs de g2024
Geneatique 2024 choisit l’export gedcom 7.0 par défaut or la majorité des utilisateurs actuels n’ont pas encore de logiciels de généalogie compatible.
Donc bien vérifier cette option. Mettre 5.5.1

@cdip :il serait bien d’avoir 5.5.1 par défaut après la premiere installation ou le chargement d’un ancien fichier .egc

Cordialement
Thierry
 
....
@cdip :il serait bien d’avoir 5.5.1 par défaut après la premiere installation ou le chargement d’un ancien fichier .egc

Cordialement
Thierry
En G2024, le modèle d'export gedcom pour Geneanet utilise bien par défaut le 5.5.1 mais il est vrais que ce n'est pas le modèle geneanet.egc qui est proposé par défaut.
 
Bonjour,
Corrections présentes, pour les notes, dans G2024 V1.1.5 :
- Les notes sont maintenant mises au bon endroit dans le Gedcom (i.e. les référence externes ne sont plus possibles)
- les tags CONT parasites sont supprimés.
- les tags MIME/TYPE sont après CONT

Pas vu d'autres différences par rapport à la conformité Gedcom; Cela améliore grandement l'interopérabilité. néanmoins les tags OBJE ne sont pas en référence externe et le header gedcom contient toujours des tags en trop sans contenir de schéma (sans vraiment causer de problème issu du codage 5.5.1 sur ce dernier point)

Donc presque résolu; Cela permet un premier niveau d'interopérabilité sans perdre ou déformer les notes même si les images sont non échangeables via un gedcom 7.0 (et non nonobstant des autres non conformités déjà signalées sur le forum )

Cordialement
Thierry
 
Dernière édition:
Visiblement le cdip a la volonté d'améliorer ses exports gedcom. Je pense que les messages de Thierry sont une aide précieuse même si ils sont un peu dispersés dans le forum. Malheureusement je ne me sens pas capable de faire une synthèse de ce qu'il reste à faire.
 
Visiblement le cdip a la volonté d'améliorer ses exports gedcom. ...je ne me sens pas capable de faire une synthèse de ce qu'il reste à faire.
Bonjour Pascal,
Visiblement oui,
Trouver les anomalies que je signale est facile :
Ce qui n'est pas résolu pose encore des problèmes. Sinon je passe les posts à RESOLU

Cordialement
Thierry
 
...
Trouver les anomalies que je signale est facile :
...
Thierry
Je vais essayer de regrouper tout ça même si je pense que le cdip a déjà noté le principal mais il ne communique pas beaucoup avec les béta-testeurs sur ce qu'il compte faire sur le gedcom. Il faudrait au moins que la version gedcom 5.5.1 soit clean même si je pense que certaines particularités de Généatique ne pourront jamais se plier tout à fait à ces normes.
Je vais essayer de m'y plonger ...
 
Sans oublier l'export des surnoms
 
Sans oublier l'export des surnoms
Et le Tag _EVT qui n'est pas conforme
 

gratuit

Retour
Haut