• Bienvenue sur la nouvelle version du forum Guide de généalogie,

    Si vous avez du mal à vous connecter, faites une demande de réinitialisation de mot de passe : Réinitialiser mon mot de passe
  • Découvrez la nouvelle section du forum : Réalisations dans Généatique. Montrez et partagez vos créations d'arbres dans Généatique !
    Et participez au concours !

A quand un export gedcom au format UTF-8 ?

Membre actif
Bonjour,

Pour l'export gedcom d'un fichier contenant, au passage, des patronymes avec le caractère spécial ß, j'avais choisi le format ANSEL comme conseillé.
Si les patronymes sont bien exportés dans le fichier gedcom, il en est tout autrement dans le logiciel d'import qui ne les reprend pas du tout. Certaines personnes de la base perdent de ce fait leur nom à l'import.

Le "conseillé" pour le format ANSEL ne semble pas d'actualité. A décharge, un export avec le format Windows n'engendre pas le problème.

Adopter pour l'export gedcom un format universel toutes langues et au goût du jour comme UTF-8 serait peut-être la solution pour éviter de se poser la question de la bonne prise en compte des caractères spéciaux ?

La balle est dans le camp du CDIP.
 
Pour moi, la norme GEDCOM c'est une norme qui fixe les règles de création d'un fichier qui permet l'échange de données entre des logiciels de Généalogie, ce n'est pas "le code de la route" de la Généalogie (désolé TOURFL). On peut très bien faire de la Généalogie sans faire d'export GEDCOM.
Bien sûr pour échanger des données, GEDCOM est très pratique et il est souhaitable que les logiciels permettent l'export le plus fidèlement possible par rapport à cette norme puisqu'il semble que seuls les Mormons se sont attaqués à ce moyen d'échange.
L'avantage de Généatique en import, c'est que si un tag perso a été créé dans un fichier GEDCOM, on peut très facilement récupérer la donnée.
La difficulté avec cette norme (je ne sais pas pour la 7.0), c'est que sous un tag de niveau n on peut mettre pratiquement ce que l'on veut comme tag de niveau n+1, et donc plusieurs possibilités pour les mêmes informations. Pour moi dans cette norme, il manque la liste des tag de niveau 1 et les structures des tags que l'on peut mettre sous ces tags de niveau 1, d'où les différences entre les logiciels.
 
Un logiciel a intérêt ../...à introduire des divergences, pour créer des utilisateurs captifs.
Et c'est à l'utilisateur de savoir ce qu'il peut utiliser pour être le plus possible compatible.
Avec mes excuses préalables, je ne suis pas vraiment d'accord.
Un logiciel a intérêt à s'en tenir strictement à la norme en suivant et en s'adaptant en permanence à son évolution. Les logiciels doivent bien s'adapter aux évolutions de W10 et bientôt de W11 !
Les utilisateurs ne sont captifs que par l'ergonomie du logiciel qui justement masque les contraintes techniques. C'est bien ce graphique dynamique qui m'a fait choisir GénéaTique/à la concurrence et non par rapport à une recherche de compatibilité. De ce côté, GT est vraiment une réussite.
A nous utilisateurs de faire évoluer de l'intérieur le CDIP pour que notre logiciel favori se conforme à la norme GEDCOM.
L'union fait la force...
 
J'ai été un peu excessif.
Un logiciel peut rajouter des fonctionnalités très utiles mais qui ne sont pas dans la norme. C'est un plus pour l'utilisateur. La conséquence reste néanmoins une limitation dans les possibilités d'échanges, même si ça n'était pas le but.
 
Le point de convergence de l'ensemble des logiciels de généalogie, c'est la norme GEDCOM.
C'est un peu le "code de la route" de la généalogie.
Je suis surpris que les développeurs (et pas seulement le CDIP) n'intègrent pas ce langage universel comme ligne de conduite.
Tous les éditeurs ont leur déclinaison de la norme gedcom. Hélas. Et le CDIP, comme les autres, ne "colle" pas strictement à la norme.
 
Pour moi, la norme GEDCOM c'est une norme qui fixe les règles de création d'un fichier qui permet l'échange de données entre des logiciels de Généalogie, ce n'est pas "le code de la route" de la Généalogie (désolé TOURFL). On peut très bien faire de la Généalogie sans faire d'export GEDCOM.
Bien sûr pour échanger des données, GEDCOM est très pratique et il est souhaitable que les logiciels permettent l'export le plus fidèlement possible par rapport à cette norme puisqu'il semble que seuls les Mormons se sont attaqués à ce moyen d'échange.
L'avantage de Généatique en import, c'est que si un tag perso a été créé dans un fichier GEDCOM, on peut très facilement récupérer la donnée.
La difficulté avec cette norme (je ne sais pas pour la 7.0), c'est que sous un tag de niveau n on peut mettre pratiquement ce que l'on veut comme tag de niveau n+1, et donc plusieurs possibilités pour les mêmes informations. Pour moi dans cette norme, il manque la liste des tag de niveau 1 et les structures des tags que l'on peut mettre sous ces tags de niveau 1, d'où les différences entre les logiciels.
La norme gedcom permet l'échange de données généalogiques. Il a été développé et modifié au fil des ans par l'Église de JC des saints des derniers jours (les mormons). Contrairement à ce que dit predigny, il n'y a pas de versions tous les ans. La version 5.5 date de 1996, la 5.5.1 a été draftée en 1999 et officialisée fin 2019, la version 7.0 date de février 2021. Les autres versions sont des tentatives, des initiatives plus ou moins abouties, développées par d'autres organismes que le propriétaire de la norme.
 
Pour le UTF-8, c'eut été facile à faire mais aller plus loin n' a guère de sens tant que ce sera la "tour de Babel" sur ce que font les diverses logiciels de généalogie. Quant à la "nouvelle" norme gedcom... il en sort une nouvelle tous les ans et elles se veulent toutes plus "officielles" les unes que les autres !
AH NON !
La norme gedcom a été développée et modifiée au fil des ans par l'Église de JC des saints des derniers jours (les mormons). Contrairement à ce que vous dites, il n'y a pas de versions tous les ans. La version 5.5 date de 1996, la 5.5.1 a été draftée en 1999 et officialisée fin 2019, la version 7.0 date de février 2021. Les autres "versions" sont des tentatives, des initiatives plus ou moins abouties, développées par d'autres organismes que le propriétaire de la norme. Je vous rappelle qu'il existe un copyright pour la norme gedcom, déposée par Family Search (organisme appartenant à l'Église de JC des saints des derniers jours.
 
Avec mes excuses préalables, je ne suis pas vraiment d'accord.
Un logiciel a intérêt à s'en tenir strictement à la norme en suivant et en s'adaptant en permanence à son évolution. Les logiciels doivent bien s'adapter aux évolutions de W10 et bientôt de W11 !
Les utilisateurs ne sont captifs que par l'ergonomie du logiciel qui justement masque les contraintes techniques. C'est bien ce graphique dynamique qui m'a fait choisir GénéaTique/à la concurrence et non par rapport à une recherche de compatibilité. De ce côté, GT est vraiment une réussite.
A nous utilisateurs de faire évoluer de l'intérieur le CDIP pour que notre logiciel favori se conforme à la norme GEDCOM.
L'union fait la force...
Oui, oui, oui! 100 fois oui.
 
Pour rendre un fichier sans BOM lisible par Geneanet, je commence par faire un fichier avec Word ou Notepad avec BOM. Puis avec un lecteur hexadécimal j'efface les trois premiers caractères (le BOM) et envoie le tout à Geneanet ; ça marche sans problème. C'est gratuit et assez simple.
 
Dernière édition par un modérateur:
Un logiciel a intérêt à suivre la norme pour pouvoir dire que l'utilisateur peut échanger avec d'autres (en particulier Geneanet)
Parfaitement d'accord : un logiciel a intérêt à suivre la norme...ce devrait-être un prérequis.
Echanger avec GeneaNet, oui, mais pas seulement...pensez aux nombreux membres d'associations généalogiques qui ont toutes sortes de logiciels de généalogie. Croyez-moi, qui suis gestionnaire de 2 bases associatives, c'est la galère pour fusionner leur Gedcom dans une même base...et pourtant tous les développeurs disent qu'ils gèrent la norme au mieux !!!
Mais il a aussi intérêt à introduire des divergences, pour créer des utilisateurs captifs.
Rien n'empêche aux développeurs de logiciels de généalogie de créer des champs complémentaires "maison" qui n'auront pas de Tags normalisés (_tag).
Toutefois, si ces champs complémentaires "maison" non normalisés existent en Tag GEDCOM normalisé il est hautement souhaité de l'adopter nativement, c'est à mon sens une condition essentielle.
J'ai moi-même créé pas mal de champs complémentaire hors norme, histoire de m'organiser, mais ils ne sont pas destinés à être exporter.
Bien sûr que GT permet de cocher ou non de façon sélective tous les champs de son fichier qu'ils soient normalisés ou non, ce qui présente l'avantage pour l'utilisateur de choisir ce qu'il veut exporter ou non, c'est vraiment un plus de GT.
Par contre, celui qui reçoit le fichier que va-t-t-il faire des champs non normalisés ?
-> soit il les intègre et tous ces champs hors norme feront parti de son propre fichier, venant "le polluer"
-> soit il les refuse et dans ce cas il perd une information précieuse.
-> soit ils sont spécialistes et s'échangent le contenu des Tags non normalisés...j'ai souvent demandé un mode opératoire pour ce cas de figure...jamais vu !
Ce que l'utilisateur fait très rarement car il faut se plonger dans les spécifications du GEDCOM.
Justement, c'est parce que "certains" utilisateurs ne se plongent pas dans la norme GEDCOM que nos logiciels doivent impérativement la respecter.
Le résultat est que c'est le logiciel qui importe qui doit faire des transformations de ce qui est hors norme. C'est ce que fait par exemple GENEANET, qui est capable de prendre en compte les particularités des principaux logiciels.
Le logiciel qui importe un fichier Gedcom devrait faire les transformations...je ne sais pas comment importer des Tags non normalisés sans perturber son propre fichier.
Je note qu'il n'aurait pas à la faire si la norme GEDCOM était respectée de chaque côté (et pas seulement par GT).
Cette transformation n'est pas du domaine d'un utilisateur non averti...c'est vrai que GeneaNet le fait, mais c'est une société (excellente) avec des spécialistes.
Il faut aussi dire que la faute vient de la norme elle-même qui à la fois est trop riche et comporte des manques, et qui a très peu évolué alors qu'elle aurait dû.
Que la Norme ait des manques, c'est certainement vrai, toutefois la norme répond à 99 % des cas de figures.
Elle évolue aussi, voir les derniers post à ce sujet.
Pour garder notre capacité de rêver : tous les développeurs de logiciels de généalogie devraient être membre (ou au moins en faire partie) du consortium GEDCOM pour en comprendre analytiquement les arcanes, la sémantique et se mettre d'accord.
J'arrête de rêver !
 
Pour moi, la norme GEDCOM c'est une norme qui fixe les règles de création d'un fichier qui permet l'échange de données entre des logiciels de Généalogie, ce n'est pas "le code de la route" de la Généalogie (désolé TOURFL). On peut très bien faire de la Généalogie sans faire d'export GEDCOM.
Bien sûr pour échanger des données, GEDCOM est très pratique et il est souhaitable que les logiciels permettent l'export le plus fidèlement possible .../...
Bonjour Alain,
Bon d'accord ce n'est pas la Généalogie qui "le code de la route" de la Généalogie, mais la norme GEDCOM, je pense qu'en bon spécialiste vous aviez rectifié de vous-même.
Comme à priori nous sommes tous les deux musiciens, j'aurais dû faire une comparaison musicale : la norme GEDCOM est à la généalogie ce que les Clés sont à la musique. Fixer les données, fixer le nom des notes.
Cordialement
Jean-Jacques
 
Que le clip développe la prise en compte de l'UTF8 pour l'export quand à la version 7 du gedcom elle peut attendre un an. Ce serais un grand pas et un minimum.
Le logiciel généatique est le seul des grands logiciels français et anglo-saxon à ne pas exporter en UTF8.
 
Bonjour,
Apparemment c'est possible avec notepad ++.
Quelqu'un a-t-il testé ?
Si la question est de savoir si il est possible de convertir un gedcom ANSI en gedcom UTF-8, la réponse est oui. En convertissant en UTF-8 sans BOM et en modifiant la ligne "1 CHAR xxxx" par "1 CHAR UTF-8" dans le fichier GEDCOM cela fonctionne. La conversion en format UTF-8 avec BOM fonctionne aussi pour les logiciels qui le supportent.

Si la question est de savoir si cela solutionne complétement le problème la réponse est non :
> Cela ne traite pas l'impossibilité d'utiliser tout caractère UTF-8 dans Généatique. Actuellement la saisie des noms est limitée dans généatique. Par exemple tous les caractères accentués ne sont pas saisissables/importables. Dans l'état du "marché" des logiciels de généalogie, convertir en UTF-8 n'a que peu d'intérêt à partir du moment où la très grande majorité des logiciels comprennent les jeux ANSEL et/ou ANSI en import. Ce qu'il faudrait c'est que Geneatique supporte les caractères non supportés en ANSI / ANSEL à la saisie et à l'import/export

Le traitement de l'UTF-8 dans Geneatique à plusieurs facettes :
- être capable de saisir et traiter (majuscule/minuscule) un maximum de caractères UTF-8 (tous les caractères occidentaux accentués, le cyrillique, etc... )
- être capable de les importer sans les altérer (éviter de perdre les accents par exemple)
- être capable de les exporter
- être capable de traiter les accentuations dans les noms de fichiers/répertoires (UTF-8 implémenté dans Win10)

Si vous essayez (par exemple) de faire la généalogie de Tadej POGAČAR vous perdrez l'accentuation slovaque. Ce n'est pas qu'un problème d'export GEDCOM.

Je plussoie à nouveau pour une telle évolution mais j'en doute pour G2022.

Cordialement
Thierry
 
Dernière édition:
Il y a plusieurs versions de l'ANSI, pour les différentes écritures. En ce qui nous concerne, quand on dit ANSI, il faut comprendre Latin 9, qui comporte 256 caractères, et, dans les 128 derniers, toutes les lettres accentués et quelque lettres spéciales (le eth et le thorn de l'islandais par exemple) de l'Europe de l'Ouest, plus quelques caractères spéciaux dont les seuls qui me semblent présenter un intérêt sont les guillemets français (« »).
Mais les 128 derniers sont codés différemment en ANSI et UTF-8, d'où la nécessité de la conversion (que notepad++ fait très bien).
Pour l'Europe, il manque dans l'ANSI (latin 9) essentiellement Malte, l'Europe centrale (latin étendu), l'Europe orientale (Cyrillique), le grec.
 
Il y a plusieurs versions de l'ANSI, pour les différentes écritures. En ce qui nous concerne, quand on dit ANSI, il faut comprendre Latin 9, qui comporte 256 caractères, et, dans les 128 derniers, toutes les lettres accentués et quelque lettres spéciales...
Précision : En gedcom, le codage ANSI n'est pas normalisé par la norme. L'extension de la norme de ce que l'on appelle "ANSI" est en fait le codage Windows-1252 (qui est une extension de l'ISO 8859-1 (Latin-1) et qui a été "banalisé" de manière générique par Microsoft sous le terme "ANSI" à l'époque de MSDOS). Ce n'est pas le Latin-9 (ISO 8859-15)

C'est ce codage Windows 1252 (i.e. page de code 1252) qui est utilisé par Généatique et la majorité des logiciels de Généalogie (cf Windows-1252 — Wikipédia ) quand l'on dit ANSI pour Windows.

Cordialement
Thierry
 
Dernière édition:

gratuit

Retour
Haut