• Bienvenue sur la nouvelle version du forum Guide de généalogie,

    Si vous avez du mal à vous connecter, faites une demande de réinitialisation de mot de passe : Réinitialiser mon mot de passe

Le traitement des doublons après une fusion

Membre
Bonjour

Depuis ce matin j'ai entrepris de fusionner (par" Utilitaires / Fiches / Ajouter toutes les fiches d'un fichier...") deux bases comprenant respectivement 2002 et 50 fiches, mon intention étant d'éliminer ensuite les doublons. Or après élimination des individus en double j'en suis à présent à 2149 fiches. Afin d'éviter de faire encore croitre mon fichier j'aimerais vérifier comment procéder (obtenir un nombre compris entre 2002 et 2052 me ravirait !)

Dans ma première et ma seconde tentative j'ai demandé une fusion avec "noms de conjoints identiques" et "prénoms des conjoints identiques" ; mais fusionner 2 individus impliquant de fusionner leurs ascendants j'ai été amené à "corriger" certains patronymes. Est-ce cela qui a provoqué des problèmes ? Je n'en sais rien mais en tout cas :
- la fusion s'est achevée par un message "Violation d'accès à l'adresse 000243BB dans le module BORLNDMM.DLL . Lecture de l'adresse 2FD41268"
- et j'ai remarqué que certains patronymes que j'avais modifiés apparaissaient tout à la fin de la "Table des noms"

Dans ma tentative suivante j'ai pensé m'en tirer en passant par la création d'un Gedcom puis la création d'une nouvelle base. Mais lors de la création du Gedcom j'ai eu de nouveau le message de violation d'accès ; et dans la restauration je me suis retrouvé avec encore une cinquantaine de fiches supplémentaires.

Mes questions plus précises :
1) je n'ai pas fait de traitement préalable sur les fichiers à fusionner ni juste après la fusion et avant la recherche de doublons, aurais-je dû en faire ("corrections des noms" et "actualisation des équivalences entre noms par exemple") ?
2) lors de la création d'un Gedcom j'ai remarqué dans l'onglet "Options" un choix possible pour la rubrique "Apparitions des personnes citées". J'ai choisi la seconde option (les traiter comme des personnes à part entière de la généalogie), est-ce cela qui peut expliquer (en partie) la prolifération des fiches ?
3) Les options de "réparation" ou "restructuration" peuvent-elles m'aider ? (voir un sujet que je poste par ailleurs)

Avec mes remerciements. Cordialement

Pierre
 
Membre
Bonjour

jlturbe":30k4bs4a a dit:
pdebreu":30k4bs4a a dit:
D'accord, je ne peux plus voir les balises <CR> et <LF> qui marquent les fins de ligne, et dans l'opération "Rechercher et remplacer" je vais avoir du mal pour introduire un saut de ligne dans l'expression de remplacement ; si Notepad permet de le faire je vais surement l'utiliser.
Notepad ++ le permet
OK ça me donne un argument pour me lancer dans ce logiciel
predigny":30k4bs4a a dit:
Vous êtes "plongé" dans votre problème et votre question vous semble compréhensible mais même en relisant j'ai un peu de mal
Disons aussi que je suis un peu devant une bobine de fil et que je tire sur tout ce qui dépasse. Mais vous avez raison il faut que je trie mieux mes questions
predigny":30k4bs4a a dit:
Il est assez simple de lister ces conjoints créés mais sans aucune saisie ; il suffit de faire une recherche par critères en laissant vide le champ nom et prénom ; en tête de liste apparaîtront des nom-prénoms vides, avec éventuellement le nom du conjoint. Si il n'y a pas de conjoint il s'agit d'une fiche isolée vide. En double cliquant sur ces lignes, vous irez sur la fiche concernée et vous pourrez soit la compléter soit la supprimer.
Pour ces trois assertions, dans cet ordre :
- VRAI
- FAUX
- VRAI et FAUX

Dans ma base j'ai deux "conjoints créés sans aucune saisie" (associés aux patronymes BODDEELE et KERLEU) mais dans la liste le nom de leur conjoint n'apparait jamais
listeIndiv.jpg
Si on fait un double-click le résultat n'est pas forcément rassurant (graphique suivant, partie gauche), il m'a fallu activer la "fiche détaillée" (même graphique, partie droite) pour voir quelque chose - et encore je ne sais pas si ce n'est pas le fait que j'ai renseigné la source dans l'union qui l'a permis (à une de mes tentatives j'avais repéré un autre indice : l'onglet "recherche rapide" faisait ressortir les personnes "proches" ; mais ce n'est pas toujours le cas- je n'ai pas compris pourquoi)
IndFictif.jpg
Je vais pouvoir voir si après avoir fait ces manipulations j'arrive à fusionner mes fichiers sans plantage

Pierre
 
Membre expert
Modérateur
BétaTesteur Généatique
Ambassadeur Généatique
Dans l'image des trois résultats de Recherche, la première image donne deux fiches créées mais vides ; il faut les supprimer, sans plus d'état d'âme.
Les images 2 et 3 montrent un problème dans la base de donnée : Un conjoint qui simultanément existe et n'existe pas ; je croyais cela possible seulement en mécanique quantique ! Et puis cet enfant négatif ! Là aussi un anti-enfant sans doute.
Votre base doit être radioactive :lol:
Plus sérieusement il faut noter les infos contenues dans ces fiches et les supprimer ; puis les recréer.
 
Membre expert
BétaTesteur Généatique
Capture 1 :
- OK avec predigny. Fiches à supprimer
Capture 2 :
- Isabelle Claire BODDEELE ne devrait pas avoir de conjoint. Vérifier si la fiche du conjoint est une des fiches vides à supprimer.
- le prénom "&lt;sans nom&gt;" de BOLLENGIER correspond à <sans nom>. Il s'agit d'un enfant certainement mort-né. Perso, je leur attribue le prénom "anonyme". Ainsi pas de problème d'export/import gedcom. Fiche à modifier.
Capture 3 :
- Père de Marie Jeanne Barbe KERLEU. Fiche ne devrait pas exister. Soit suppression de la fiche, soit restructuration de la base. Pour se débarrasser de cette fiche.
- Je ne m'explique pas ce "frère/sœur négatif.

pdebreu":r639ill8 a dit:
liste sélective de personnes, événements, sources" je n'ai pas trouvé comment compter les unions où le mari est inconnu (ou a un nom à blanc...)
Quelqu'un peut-il me dépanner ? Merci
Recherche --> Autre recherche
Personne père vide et personne mère non vide

pm.jpg
Cela donne des résultats corrects si la fiche du père n'existe pas.
 
Membre
Bonjour

phicome":2ugjdflj a dit:
pdebreu":2ugjdflj a dit:
liste sélective de personnes, événements, sources" je n'ai pas trouvé comment compter les unions où le mari est inconnu (ou a un nom à blanc...)
Quelqu'un peut-il me dépanner ? Merci
Recherche --> Autre recherche
Personne père vide et personne mère non vide

Cela donne des résultats corrects si la fiche du père n'existe pas.
OK pour l'instant ce n'est pas clair mais je vois à quel endroit je dois chercher

predigny":2ugjdflj a dit:
Un conjoint qui simultanément existe et n'existe pas ; je croyais cela possible seulement en mécanique quantique !
Vous oubliez les romans de Gaston Leroux  :lol: :lol: : le Fantôme de l'Opéra mais surtout tous les Rouletabille ("a priori c'est incroyable mais il y a pourtant une explication rationnelle")

phicome":2ugjdflj a dit:
Capture 2 :
Isabelle Claire BODDEELE ne devrait pas avoir de conjoint. Vérifier si la fiche du conjoint est une des fiches vides à supprimer.
C'est justement parce qu'elle n'a pas de conjoint et que Généatique a ajouté un « mari fantôme » que je m'intéresse à elle : Isabelle Claire BODDEELE, mais aussi Constance KERLEU (la mère de Marie Jeanne Barbe), sont toutes deux associées aux deux fiches « à supprimer ». Toutes deux sont des mères d'enfants naturels, elles appartiennent à une même généalogie, créée sous Geneweb, et transférée dans Généatique via un Gedcom. Dans le Gedcom issu de Geneweb, les deux unions étaient du type « mère + fille », sans balise « HUSB ». C'est Généatique qui à la lecture de Gedcom a « créé » les deux enregistrements « fantômes », pour rétablir des familles "complètes" ( à savoir à chaque fois 2 enregistrements HUSB et WIFE présents chacun une fois, plus 0 à n enregistrements CHLD)

Les images dans ce post, mais aussi celles figurant ici (http://forum.guide-genealogie.com/recup-gedcom-venant-autres-logiciels-t23580.html#p90426), montrent pour chaque position d'une fiche dans le triangle (« mère », « fille », et « père-fantôme ») d'une part la manière dont elles apparaissent dans les listes, d'autre part pour chacune comment elles sont « perçues » depuis les deux autres fiches auxquelles elles sont associées. Or ces relations ne sont pas symétriques : depuis les filles ou les mères on voit des liens vers les « pères-fantômes », ces liens n'apparaissent pas (ou difficilement) dans l'autre sens.

phicome":2ugjdflj a dit:
Je ne m'explique pas ce "frère/sœur » négatif.
C'est la faute au(x) fantôme(s) :lol:  ! Ou, si on veut formuler cela autrement (à la manière d'un roman de Gaston Leroux bien sûr :wink: ) : les développeurs ont « oublié » qu'ils pouvaient y avoir des « fantômes » dans leurs données, et n'ont pas intégré dans les jeux d'essai leur présence possible... Le corollaire : si dans certaines circonstances les résultats sont du grand n'importe quoi, il paraît tout à fait plausible que dans d'autres cas les programmes plantent

predigny":2ugjdflj a dit:
Dans l'image des trois résultats de Recherche, la première image donne deux fiches créées mais vides ; il faut les supprimer, sans plus d'état d'âme.
Mouais... Qu'il faille les éliminer c'est tout à fait d'accord. Mais pour être certain de bien tout éradiquer je pense prudent d'éliminer tous les liens vers ces fiches fantômes, avant d'éliminer les fiches elles-même. Quant à une restructuration : oui après les avoir éliminés, pas pour les éliminer. Bref, une solution « ceinture et bretelles »

Le moins logique dans tout ça : c'est que manifestement Généatique 2015 admet des familles composées d'enfants et un seul parent ; et que lorsque le Gedcom venant de Geneweb présente des familles de ce genre l'interface rajoute des fantômes. Dans ce cas alors, comment Généatique interprète-t-il les Gedcom générés par lui-même ?

Pierre
 
Membre expert
BétaTesteur Généatique
pdebreu":yjd8ezid a dit:
Le moins logique dans tout ça : c'est que manifestement Généatique 2015 admet des familles composées d'enfants et un seul parent ; et que lorsque le Gedcom venant de Geneweb présente des familles de ce genre l'interface rajoute des fantômes. Dans ce cas alors, comment Généatique interprète-t-il les Gedcom générés par lui-même ?
Pourquoi cela serait-il le moins logique ? Je gère tous les enfants naturels de ma généalogie ainsi (une mère + enfant-s-). Si je me souviens bien, il faut être deux pour concevoir un enfant. Donc, dans ce cas, inutile de créer une fiche pour un père dont on ne sait strictement rien (la mère le connait-elle ?), mais qui existe nécessairement.
Quant à Geneweb, c'est lui qui rajoute des "pères inconnus" lors d'un import d'un gedcom fait par Généatique (par exemple). Cela explique que le nombre d'individus affiché par Geneweb et par Généatique soit différent. Je n'utilise pas de gedcom Geneweb, mais, peut-être que lors d'un export, ces fiches de "pères inconnus" ne sont pas correctement interprétées par Généatique.
Enfin, l'export gedcom de Généatique n'est pas parfait, loin de là. Cependant, je n'ai jamais rencontré de problème avec une famille mono-parentale. J'exporte régulièrement mon arbre, ou une partie, vers 3 logiciels différents.
 
Membre
phicome":mv311jdz a dit:
Quant à Geneweb, c'est lui qui rajoute des "pères inconnus" lors d'un import d'un gedcom fait par Généatique (par exemple)
Pas que je sache (en fait je n'ai pas fait la manipulation Généatique -> Généweb) et pour ce qui me concerne j'ai constaté exactement l'inverse.

Ceci est le gedcom issu de Geneweb...
Geneweb_couple.jpg
... et ceci celui généré par Généatique "presque immédiatement" avoir lu le fichier Gedcom
G2015_couple.jpg
phicome":mv311jdz a dit:
Cela explique que le nombre d'individus affiché par Geneweb et par Généatique soit différent.
Non ce n'est pas tout à fait cela, dans mon cas c'est le numéro de rang le plus élevé qui est différent. Geneweb datant d'une conception ancienne (il a été développé à l'INRIA) il est plausible que pour sa gestion interne le logiciel réserve de la mémoire pour noter les individus manquants ; mais à l'exportation dans un gedcom il les élimine (sans renuméroter pour autant les individus et les familles)

Pierre
 
Membre
phicome":2hpozt9r a dit:
Il n'y a aucun doute :
http://opensource.geneanet.org/projects/geneweb/wiki/Fr_Problem
Voir le paragraphe sur le nombre d'individus.
Dans GeneWeb, les parents sont toujours enregistrés en couple. S'il n'y a que le père ou que la mère dans le fichier GEDCOM, GeneWeb ajoute l'autre parent, en lui donnant un point d'interrogation comme prénom et comme nom. La différence est dûe à ces parents manquants (mais qui ont existé).
Oups... Il va falloir que je fasse la manoeuvre Généatique -> Geneweb -> Généatique (en scrutant le Gedcom) pour confirmer ma thèse du moment : s'il est vrai que Geneweb ajoute des individus pour ses travaux "en mémoire" il les élimine à nouveau quand il réécrit le gedcom

Mais je voudrais en revenir à un autre point abordé précédemment
phicome":2hpozt9r a dit:
pdebreu":2hpozt9r a dit:
liste sélective de personnes, événements, sources" je n'ai pas trouvé comment compter les unions où le mari est inconnu (ou a un nom à blanc...)
Quelqu'un peut-il me dépanner ? Merci
Recherche --> Autre recherche
Personne père vide et personne mère non vide

Cela donne des résultats corrects si la fiche du père n'existe pas.
Mais ça donne aussi la liste des enfants naturels si la fiche du père est une fiche fantôme :!: . Démonstration :

- la requête (que j'ai baptisée "enfant-naturel")
Ghostbuster_requete.jpg
- la liste reçue en réponse
Ghostbuster_liste.jpg
- et le résultat d'un double click sur une des personnes sélectionnées (dont fiche simple, graphique, parentèle et invite proposé quand on demande la "Suppression des liens et/ou de la fiche des personnes")
Ghostbuster_suppr_liens.jpg
Sur le plan logique rien à dire : "P.Nom vide" ne signifie pas (forcément ?) qu'il n'y a pas d'enregistrement père, il peut signifier tout aussi bien que le champ "Nom" situé sur l'enregistrement "Père" est "vide". Mais en revanche cette manoeuvre est géniale car elle me permet de corriger la base.

J'ai adopté la démarche suivante :
1) pour chacun des enfants naturels sélectionnés dans la liste :
- je me suis positionné sur l'enregistrement (la fille naturelle) et j'ai supprimé le lien avec le père
- je suis passé via le graphique et j'ai supprimé le lien avec le conjoint-fantôme
2) puis j'ai refait une liste de toutes mes fiches (requête avec Nom et Prénom "vide") et cette fois j'ai supprimé les fiches

A l'issue de cette démarche tout est rentré dans l'ordre - ce jour. Et je pense avoir compris pourquoi ma première fusion s'était traduite par un plantage : il se trouve que Marie Jeanne Barbe KERLEU est présente dans les deux fichiers que je voulais fusionner. Si dans l'une elle était enregistrée avec père inconnu, et dans l'autre avec un père fantôme, je ne serais pas surpris que le programme d'élimination des doublons ait eu un problème

Cordialement

Pierre
 

gratuit

Haut