• Bienvenue sur la nouvelle version du forum Guide de généalogie,

    Si vous avez du mal à vous connecter, faites une demande de réinitialisation de mot de passe : Réinitialiser mon mot de passe

Problême de caractére lors d'un import d'un ged en provenanc

Membre
Bonjour,
Je viens d'importer un gedcom de mon arbre qui était chez MyHeritage .....et à la lecture j'ai des surprises de caractéres.
Les caractéres spéciaux de la 1ére ligne de tabulation ont été modifiés lors de l'import ......exemple Françoise devient Françoise, Hélène devient Hélène, .....cela ne concerne que les caractères é, è, ç et à !!!!!!!
Est il possible de faire une manip qui me permette de régulariser ce bug ..... qui compte tenu que j'ai un peu plus de 14000 individus ....serait extrêmement longue et fastidieuse à faire cela Un part Un ..... parceque cela concerne les prénoms, les métiers et les communes ......
Merci de me donner vos idées pour régler ce problème .... sous word je sais faire cette modification à la volée ....... mais là je ne vois pas comment pratiquer !!!!!!!!
Très cordialement à toutes et tous :cry: :cry: :cry: :cry: :cry:
Guy Pat
 
Membre actif
Bonjour,
Le site MyHeritage ne génère que des gedcom encodés UTF-8.

Généatique ne le détecte pas automatiquement, le gedcom est correct (*) mais est encodé au format UTF-8 avec BOM (**).
Si on enlève l'entête BOM le HEADER GEDCOM et le jeu de caractère est automatiquement reconnu.

En présence d'une entête BOM UTF-8 avant la 1er ligne "0 HEAD", Geneatique devrait considérer qu'il s'agit d'un GEDCOM UTF-8

Vous aviez posé la question en 2019 (probleme-affichage-suite-import-t31531.html?hilit=BOM#p127908), la réponse est toujours la même :
Pour contourner le problème : A l'import Gedcom, sélectionner "Format des caractères utilisés" avec UTF-8.
en attendant une éventuelle correction du CDIP . Vous n'avez pas besoin d'utiliser Word...

Cordialement
Thierry
(*)
(3 octets 0xEF 0xBB 0xBF)
0 HEAD
1 GEDC
2 VERS 5.5.1
2 FORM LINEAGE-LINKED
1 CHAR UTF-8
1 LANG French
1 SOUR MYHERITAGE
2 NAME MyHeritage Family Tree Builder
...
(**) BOM = Byte Order Mark
Une suite d'octet en tête de fichier pour les fichiers contenant des caractères UNICODE. Cela permet de dire comment le fichier doit être lu. (ordre et manière dont sont codés les caractères)
 
Membre
Merci beaucoup de votre intervention ...... Etienne !!!!
Le CDIP est il au courant de ce blême ?????

Et lorsque l'import est dejà fait sans le correctif avez vous "une ficelle" pour régulariser ce désordre !!!!!!!
Au plaisir :mrgreen: :mrgreen: :mrgreen: :mrgreen:
 
Membre
Etienne ..... j'ai pratiqué comme indiqué sur l'import du ged , mais je ne vois aucune modification sur les points noirs abordés lors de ma question !!!!! j'ai pourtant bien coché UHT8 ..... Merci
 
Membre actif
jouviguy":3hhizxer a dit:
Etienne ..... j'ai pratiqué comme indiqué sur l'import du ged , mais je ne vois aucune modification sur les points noirs abordés lors de ma question !!!!! j'ai pourtant bien coché UHT8 ..... Merci
Bonjour Guy,
En procédant en cochant UTF-8 lors de l'import (*), je n'ai pas de problème
et
- il n'y a pas de moyen pour corriger un import déjà fait avec un mauvais jeu de caractères.
- j'ai signalé l'anomalie au CDIP, requête ##457199

Votre nouvelle généalogie, créée avec le nouvel import, devrait normalement être correcte
Si non, pouvez vous ouvrir votre gedcom avec le bloc-note est vérifier son codage :
ConvMH.png
Vous devriez avoir une ligne "1 CHAR UTF-8" au début du fichier et en faisant Enregistrer sous "UTF-8 avec nomenclature" (i.e. avec BOM)
Vous pouvez éventuellement réenregister au format UTF-8 pour éviter aussi le problème. (cela supprimera les 3 octets de BOM en début de fichier)

Sinon donner un exemple

Cordialement
Thierry
(*)ImportUTF8.png
 

gratuit

Haut