• Bienvenue sur la nouvelle version du forum Guide de généalogie,

    Si vous avez du mal à vous connecter, faites une demande de réinitialisation de mot de passe : Réinitialiser mon mot de passe

Export GEDCOM au format UTF8

Membre actif
Jean Costet":16cm299b a dit:
Bonjour,
Compte-tenu des récentes interventions je crois utile de préciser un point sur ma manière de procéder.
Avant d'ouvrir le gedcom avec le bloc-note de windows j'opère deux modifications du fichier à la main.
Tout d'abord j'écris CHAR UTF-8 au lieu de Char ANSI dans le texte et ensuite je modifie l'extension du fichier de .ged en .txt (je ne suis pas certain que ce soit indispensable).
Après l'enregistrement de la codification en UTF-8 je rétablis bien sûr l'extension .ged.
Jean Costet
Merci, Jean, de cette clarification.
 
Membre expert
Comme Jean Costet, je procède de la même manière.
Je créé mon gedcom en ANSI
Ensuite j'utilise le logiciel notepad ++ au lieu du logiciel notepad de windows.
Ce logiciel permet en outre de pouvoir remplacer les tags que certains logiciels ne reconnaissent pas.
Pour en revenir au format UTF8
Je remplace "1 CHAR ANSI" par "1 CHAR UTF-8"
Je supprime aussi 10 lignes dans l’entête
3 ADDR 10, Chaussée Jules César
4 POST F-95527
4 CITY CERGY-PONTOISE
4 CTRY FRANCE
3 PHON (+33).1.34.39.12.12
3 _ADDR http://www.geneatique.com
2 FORM LINEAGE-LINKED
2 POST
2 CITY
1 _MAIL

et pour finir avec notepad ++
Menu édition /sélectionner tout (CTRL A)
Menu /Encodage /Convertir en UTF-8 sans BOM
 
Membre actif
jlturbe":3knyqu90 a dit:
Comme Jean Costet, je procède de la même manière.
Je créé mon gedcom en ANSI
Ensuite j'utilise le logiciel notepad ++ au lieu du logiciel notepad de windows.
Ce logiciel permet en outre de pouvoir remplacer les tags que certains logiciels ne reconnaissent pas.
Pour en revenir au format UTF8
Je remplace "1 CHAR ANSI" par "1 CHAR UTF-8"
Je supprime aussi 10 lignes dans l’entête
3 ADDR 10, Chaussée Jules César
4 POST F-95527
4 CITY CERGY-PONTOISE
4 CTRY FRANCE
3 PHON (+33).1.34.39.12.12
3 _ADDR http://www.geneatique.com
2 FORM LINEAGE-LINKED
2 POST
2 CITY
1 _MAIL

et pour finir avec notepad ++
Menu édition /sélectionner tout (CTRL A)
Menu /Encodage /Convertir en UTF-8 sans BOM
Super! Merci. J'ai suivi la méthode (avec Editplus au lieu de Notepad++). Import nickel dans Webtrees.
Cordialement
 
Moderateur
jlturbe":1n60qakb a dit:
...
et pour finir avec notepad ++
Menu édition /sélectionner tout (CTRL A)
Menu /Encodage /Convertir en UTF-8 sans BOM
Quand je fais cela avec Notepad++ (v7.1), tout le texte disparaît. Si je fais "Menu /Encodage /Encoder en UTF-8 sans BOM" certains caractères sont modifiés mais le texte reste en place.
 
Membre expert
predigny":1dosr262 a dit:
jlturbe":1dosr262 a dit:
...
et pour finir avec notepad ++
Menu édition /sélectionner tout (CTRL A)
Menu /Encodage /Convertir en UTF-8 sans BOM
Quand je fais cela avec Notepad++ (v7.1), tout le texte disparaît. Si je fais "Menu /Encodage /Encoder en UTF-8 sans BOM" certains caractères sont modifiés mais le texte reste en place.
Le texte ne disparait pas chez moi en version Notepad++ (v7.1)
C'est Convertir en UTF-8 sans BOM au lieu de Encoder en UTF-8 sans BOM
 
Moderateur
jlturbe":34czc3xa a dit:
...Le texte ne disparait pas chez moi en version Notepad++ (v7.1)...
Avec un petit fichier gedcom c'est OK mais avec le gedcom d'une généalogie de 90 000 personnes (1 200 000 lignes) ça ne fonctionne plus. Quelle est la limite de Notepad++ ?
 
Membre actif
Bonsoir,
predigny":29u6xu5c a dit:
jlturbe":29u6xu5c a dit:
...Le texte ne disparait pas chez moi en version Notepad++ (v7.1)...
Avec un petit fichier gedcom c'est OK mais avec le gedcom d'une généalogie de 90 000 personnes (1 200 000 lignes) ça ne fonctionne plus. Quelle est la limite de Notepad++ ?
Je viens de tester avec une base de 140006 personnes (2 419 967 lignes) et tout a très bien fonctionné.

Il semble qu'il faille chercher la cause ailleurs (capacité mémoire etc.).
 
Membre actif
Le CDIP a passé la demande de l'export GEDCOM au format UTF-8 à l'èquipe de développement. Ça va peut-être bouger…
 
Membre actif
Une précision trouvée dans l'article Wikipedia sur la norme GEDCOM

"Un fichier GEDCOM est rédigé en texte seul, ASCII ou ANSEL, le jeu de caractères pouvant être UTF-8, ISO-8859-1, ISO-8859-15 ou UTF-16."
 
Membre actif
Le CDIP n'a pas inscrit dans la liste courante des développements l'export gedcom au format UTF-8. La raison officielle est que je suis le seul demandeur. Donc, si les uns ou les autres sont intéressés, manifestez-vous auprès du CDIP.
Merci
 
Membre actif
ddalbiez":2z87idyo a dit:
Le CDIP n'a pas inscrit dans la liste courante des développements l'export gedcom au format UTF-8. La raison officielle est que je suis le seul demandeur. Donc, si les uns ou les autres sont intéressés, manifestez-vous auprès du CDIP.
Merci
Finalement, les développeurs de Webtree, plus réactifs que ceux du CDIP, on modifié leur programme pour accepter les gedcom au format ANSI.
 
Bonjour,
Je serais très content que Généatique puisse exporter des gedcom en UTF-8.
Mais je serais aussi très satisfait que Geneanet puisse traiter correctement des gedcom en ANSI (plus exactement Windows 1252). Geneanet affiche bien les æ et Æ d'ANSI mais ne rend pas sous forme de ligatures les œ et Œ qui sont pourtant beaucoup plus fréquents !
J'ai posé la question du pourquoi de cette discrimination sur un forum de Geneanet sans avoir de réponse.

Jean Costet
PS l'utilisation du clavier français modifié de Galéron rend extrêmement simple la frappe de ces ligatures comme celle des majuscules accentuées, pourquoi s'en priver puisque ANSI sait les coder ?
 
Membre actif
ddalbiez":19ufct78 a dit:
La version 2018 de Geneatique va-t-elle enfin combler cette lacune?

Bonjour
Et bien non, G2018 n'a pas tenu cette promesse.
Cette demande n'a toujours pas été satisfaite.
Plus que la fonctionnalité absente (il y a un work around, un processus d'évitement), c'est le manque de réactivité du CDIP, et son non respect d'une "promesse" moult fois faite, qui me déçoivent.
Dans G2019 peut-être ?
 
Membre actif
Jean Costet":3e22rmbp a dit:
Bonjour,
Mais je serais aussi très satisfait que Geneanet puisse traiter correctement des gedcom en ANSI (plus exactement Windows 1252). Geneanet affiche bien les æ et Æ d'ANSI mais ne rend pas sous forme de ligatures les œ et Œ qui sont pourtant beaucoup plus fréquents !
J'ai posé la question du pourquoi de cette discrimination sur un forum de Geneanet sans avoir de réponse.
La réponse et la description du problème a été apportée sur le forum geneanet : cf https://www.geneanet.org/forum/viewtopi ... 2&start=08 une correction est à l'étude dans une prochaine maj de Geneweb (problème du au fait que le Geneweb de geneanet lit l'ANSI/Windows 1252 par défaut comme de l'ISO 8859-1)

Cordialement
Thierry
 
Membre actif
ddalbiez":9r4fznx3 a dit:
Le CDIP n'a pas inscrit dans la liste courante des développements l'export gedcom au format UTF-8. La raison officielle est que je suis le seul demandeur. Donc, si les uns ou les autres sont intéressés, manifestez-vous auprès du CDIP.
Bonjour,
Je me joint à vous pour souhaiter que le CDIP ajoute enfin l'export UTF-8 à Geneatique.

Actuellement l'on peut saisir dans les notes des caractères qui ne sont pas exportables en ANSI (Windows 1252) ou ANSEL en GEDCOM avec Genéatique (exemple : les jeux Latin étendu A et suivants : cf Latin étendu A

Si l'UTF-8 était supporté, il n'y aurait pas perte ou transformation de caractères dans ce cas là. Actuellement Geneatique essaye de trouver le caractère le plus proche (ex : Ű --> U)

Si tous les membres de ce forum le souhaitent aussi sur ce fil, peut être que le CDIP bougera enfin.
peut être en Geneatique 2019 ?

Cordialement
Thierry
 
Membre actif
J'apporte mon soutien à l'export en UTF-8, nous devons être au moins 4 demandeurs. Est-ce que ce sera suffisant ?
 
Membre actif
AL1493":23pu77yq a dit:
J'apporte mon soutien à l'export en UTF-8, nous devons être au moins 4 demandeurs. Est-ce que ce sera suffisant ?
Avec plus de 2542 vues à cette heure, ils devraient au moins se dire que cela intéresse plus que 4 personnes…
:shock:
l'espoir faire vivre.

Thierry
 
Membre actif
Réponse officielle du CDIP après 2 ans:
"Le support technique fait des demandes au pole développement, mais il ne prend pas la décision de faire tel ou tel développement sur Généatique.
Nous sommes désolés de ce contre temps.
Votre demande de pouvoir exporter en UTF_8 a bien été transmise au pole développement, mais nous ne pouvons pas vous dire quand cette fonction sera mise en service."
 
Haut