• Bienvenue sur la nouvelle version du forum Guide de généalogie,

    Si vous avez du mal à vous connecter, faites une demande de réinitialisation de mot de passe : Réinitialiser mon mot de passe

Le traitement des doublons après une fusion

Membre
Bonjour

Depuis ce matin j'ai entrepris de fusionner (par" Utilitaires / Fiches / Ajouter toutes les fiches d'un fichier...") deux bases comprenant respectivement 2002 et 50 fiches, mon intention étant d'éliminer ensuite les doublons. Or après élimination des individus en double j'en suis à présent à 2149 fiches. Afin d'éviter de faire encore croitre mon fichier j'aimerais vérifier comment procéder (obtenir un nombre compris entre 2002 et 2052 me ravirait !)

Dans ma première et ma seconde tentative j'ai demandé une fusion avec "noms de conjoints identiques" et "prénoms des conjoints identiques" ; mais fusionner 2 individus impliquant de fusionner leurs ascendants j'ai été amené à "corriger" certains patronymes. Est-ce cela qui a provoqué des problèmes ? Je n'en sais rien mais en tout cas :
- la fusion s'est achevée par un message "Violation d'accès à l'adresse 000243BB dans le module BORLNDMM.DLL . Lecture de l'adresse 2FD41268"
- et j'ai remarqué que certains patronymes que j'avais modifiés apparaissaient tout à la fin de la "Table des noms"

Dans ma tentative suivante j'ai pensé m'en tirer en passant par la création d'un Gedcom puis la création d'une nouvelle base. Mais lors de la création du Gedcom j'ai eu de nouveau le message de violation d'accès ; et dans la restauration je me suis retrouvé avec encore une cinquantaine de fiches supplémentaires.

Mes questions plus précises :
1) je n'ai pas fait de traitement préalable sur les fichiers à fusionner ni juste après la fusion et avant la recherche de doublons, aurais-je dû en faire ("corrections des noms" et "actualisation des équivalences entre noms par exemple") ?
2) lors de la création d'un Gedcom j'ai remarqué dans l'onglet "Options" un choix possible pour la rubrique "Apparitions des personnes citées". J'ai choisi la seconde option (les traiter comme des personnes à part entière de la généalogie), est-ce cela qui peut expliquer (en partie) la prolifération des fiches ?
3) Les options de "réparation" ou "restructuration" peuvent-elles m'aider ? (voir un sujet que je poste par ailleurs)

Avec mes remerciements. Cordialement

Pierre
 
Moderateur
Avec un ajout de 50 fiches, vous devriez pouvoir fusionner ces deux généalogie sans avoir à faire la chasse aux doublons. En regardant cette généalogie de 50 personne il doit être facile de voir ce qui est "utile" et ce qui ne l'est pas et supprimer les personnes qui sont déjà sur la "grosse" généalogie. En suite, après l'ajout de toutes les fiches (moins de 50), il suffira de créer les quelques liens qui réuniront les deux parties.
La recherche des doublon est toujours une opération délicate. et même si vous la faite avant l'ajout des 50 fiches, vous trouverez sans doute des doublons. Souvent ces doublons n'en sont pas des vrais.
De toute façon il faut que les généalogies soient en bonne état (restructuration de niveau "avec réenregistrement classement et symétrie") et surtout, bien sauvegarder les deux (surtout la grosse) généalogies.
Je dois partir, on verra plus de détails demain si vous avez encore des problèmes.
 
Membre
Bonjour

predigny":2ozxyla5 a dit:
De toute façon il faut que les généalogies soient en bon état (restructuration de niveau "avec réenregistrement classement et symétrie")
Merci du conseil, je vais tenter cela. Je vous dirai si cela a marché.

predigny":2ozxyla5 a dit:
Avec un ajout de 50 fiches, vous devriez pouvoir fusionner ces deux généalogie sans avoir à faire la chasse aux doublons.
[...]
La recherche des doublons est toujours une opération délicate. et même si vous la faite avant l'ajout des 50 fiches, vous trouverez sans doute des doublons. Souvent ces doublons n'en sont pas des vrais.
En fait je suis dans un cas un peu différent du cas général :
- dans les parties du Nord et du Pas-de-Calais où se concentrent l'essentiel de mes recherches, le repérage des personnes citées dans les actes (notamment les parrains et marraines) est crucial dans la reconstitution des familles (le choix des parrains suit des règles majoritairement suivies par tous). Relever que dans la même paroisse à quelques années d'intervalles les parrains de 2 enfants s'appellent tous deux Jean Dupont signifient que les enfants sont des parents proches - sauf si les parrains sont des homonymes, mais dans ce cas ce sont ces derniers qui sont sans doute des parents très proches. Donc l'essentiel de mes recherches consiste à inférer que deux personnes n'en sont qu'une seule... ou pas.
- bien sûr ce raisonnement marche quand on travaille au sein d'une même paroisse, ou des paroisses proches, et dans ce cas une bonne part des doublons en sont des vrais. Voilà justement la raison pour laquelle je me trouve avec une vingtaine de bases "de travail" différentes, dont je cherche à présent à consolider des parties "utiles". Mon opération sur 50 fiches est donc un travail expérimental, avant des fusions de fichiers plus conséquents. Et j'ai besoin de "faire suivre" les personnes citées dans les actes au cours des fusions

Cordialement

Pierre
 
Membre actif
Quand je veux fusionner deux généalogies (souvent une petite à ajouter dans une grosse), je commence par faire une restructuration ,comme indiqué par Prédigny, des deux bases.
Je m'assure qu'il n'y a pas de doublon dans chacune des bases.
Ensuite, j'ouvre la petite généalogie et je recherche les doublons avec la grosse base. J'imprime la liste des doublons (un fichier texte suffit), et je regarde chaque doublon pour vérifier si c'est bien un doublon et je le note dans le fichier texte.
Après avoir importé la petite base dans la grosse, je fusionne les fiches qui doivent l'être (repérées à partir de mon fichier texte), mais pas par la recherche de doublon, mais par l'outil de recherche, ainsi, je maîtrise les fusions.
Effectivement, la fusion de deux personnes implique la fusion de tous leurs ancêtres, mais Généatique fusionne aussi des enfants (frères ou soeurs) qui ont le même prénom (et pas d'informations différentes bien sûr) sans demander confirmation.
 
Membre
Bonsoir

AL1493":2mf2k9vn a dit:
Effectivement, la fusion de deux personnes implique la fusion de tous leurs ancêtres, mais Généatique fusionne aussi des enfants (frères ou soeurs) qui ont le même prénom (et pas d'informations différentes bien sûr) sans demander confirmation.
Cela ne correspond pas tout à fait à mon cas, puisque mon opération de fusion se traduit par une croissance anormale du nombre d'individus, mais c'est effectivement important à savoir. Je vais surement suivre dorénavant votre procédure (je n'avais pas encore repéré la possibilité de rechercher des doublons entre plusieurs bases)

Merci beaucoup

Pierre
 
Moderateur
pdebreu":yol6vqzm a dit:
....mon opération de fusion se traduit par une croissance anormale du nombre d'individus,...
C'est sûr que 2002 + 50 doit donner une généalogie de 2052 personnes après l'ajout des fiches et moins de 2052 après fusion des doublons ; sauf... quand le système fait n'importe quoi ou que l'opérateur fait plusieurs fois l'ajout des fiches.
Pour le travail sur les parrains/marraines, j'ai assez souvent utilisé ces personnes citées pour améliorer la probabilité d'une filiation mais j'ai rarement pu avoir une certitude sauf quand le curé ajoute "son oncle", "son grand-père, ...", mais évidemment c'est dans les périodes où l'on manque le plus d'informations que les curés sont le moins bavards ! J'ai des actes de mariages qui font 5 mots : 1/8 Jean DUPONT épousa Marie MACHIN" ; Bonjour la filiation !
 
Membre
Bonjour

predigny":1fodj9y0 a dit:
Pour le travail sur les parrains/marraines, j'ai assez souvent utilisé ces personnes citées pour améliorer la probabilité d'une filiation mais j'ai rarement pu avoir une certitude sauf quand le curé ajoute "son oncle", "son grand-père, ...", mais évidemment c'est dans les périodes où l'on manque le plus d'informations que les curés sont le moins bavards ! J'ai des actes de mariages qui font 5 mots : 1/8 Jean DUPONT épousa Marie MACHIN" ; Bonjour la filiation !
Je suis trop bavard ! Je voulais juste commenter mon intérêt pour les fusions (j'en ai d'autres en préparation)

Sur le fonds de la question : comme on s'écarte me semble-t-il des sujets à aborder dans ce forum je dirais juste que pour mes recherches (à 60 km à l'ouest de Lille) l'exploitation des noms des parrains est un moyen assez efficace - et souvent le seul ; mais je me garderais bien de le préconiser ailleurs en France (à 80 km de là il n'est plus valable).

Quant à une mention aussi sibylline que "le parrain a été Jean Debreu homme veuf", replacée dans son contexte géographique, elle m'apprend qu'à cette date il y a 2 personnes (au moins) du même nom dans la paroisse (en fait le père et son fils) ; qu'on parle ici du père ; et que l'épouse de celui-ci est décédée bien que l'acte soit introuvable dans la commune.

predigny":1fodj9y0 a dit:
sauf... quand le système fait n'importe quoi ou que l'opérateur fait plusieurs fois l'ajout des fiches.
Bien sûr que je suis responsable ! D'où mon souci de mieux comprendre comment le logiciel interprète mes commandes, ce qui explique mon inscription à ce forum... qui pour l'instant correspond tout à fait à mes attentes :D

Cordialement

Pierre
 
Moderateur
pdebreu":6eg8686e a dit:
...Je suis trop bavard ! Je voulais juste commenter mon intérêt pour les fusions (j'en ai d'autres en préparation)...
Moi aussi, j'était complètement hors sujet, mais des fois ça fait du bien de parler d'autre chose que des problèmes de Généatique ! :lol:
 
Membre
Bonjour

predigny":2au87o5t a dit:
De toute façon il faut que les généalogies soient en bonne état (restructuration de niveau "avec réenregistrement classement et symétrie") et surtout, bien sauvegarder les deux (surtout la grosse) généalogies.
AL1493":2au87o5t a dit:
Quand je veux fusionner deux généalogies (souvent une petite à ajouter dans une grosse), je commence par faire une restructuration ,comme indiqué par Prédigny, des deux bases.
Je m'assure qu'il n'y a pas de doublon dans chacune des bases.
J'ai suivi vos conseils... et ça ne marche pas. La fusion "avec réenregistrement, classement et symétrie" se termine "avec succès", mais quand je veux faire une sauvegarde sur fichier Gedcom, patatras, j'ai de nouveau une violation d'accès et un plantage de Généatique

Dans mes diverses tentatives j'ai toutefois deux indices, venant de fichiers Gedcom issus de mes différentes bases :

1) sur ma "grosse base" j'ai des enregistrements suspects, par exemple
0 @I356@ INDI
1 NAME Marie Catherine/CUVELIER/
2 GIVN Marie Catherine
2 SURN CUVELIER,DECUYPER,CUYVELIER
1 xxx F (censuré !)
1 _DCT 01/01/2014 12:05
1 SIGN N
1 CHAN
2 DATE 25 NOV 2014
1 _REL
2 ASSO @I-358@
3 TYPE INDI
3 RELA GODM
La dernière fois que j'ai eu un plantage (une coupure d'électricité) j'ai eu la curiosité de regarder le Gedcom et j'ai repéré ce type de points communs avec le cas présent :
- des tags commençant par des blancs soulignés (_) : _DCT, _REL (contrairement à la majorité des cas)
- des réferences d'individus comme @I123@ (ou de familles comme @F45@) ou apparaissent autre chose que des chiffres (ici un trait d'union), et le non-respect de la numérotation séquentielle des individus d'une part, des familles d'autre part
- des dates correspondant au moment où le plantage est survenu
Comme une action aussi simple que relier un individu existant à une famille nécessite de faire une modification en double (ajouter pour l'individu un lien vers la famille et ajouter pour la famille un lien vers l'individu), et qu'on veut en plus pouvoir revenir en arrière, j'imagine que Généatique doit gérer des identifiants "provisoires"

2) Il y a un petit écart entre le nombre d'individus selon l'endroit où il est indiqué : il varie entre 2002 et "environ 2015". Ceci me laisse espérer qu'il n'y a qu'une dizaine d'enregistrements problèmatiques. Mais il y en aurait-il une centaine, je préférerais pouvoir récupérer les 1900 "bons" que tout resaisir.

Aussi à ce point de mon problème j'envisage deux pistes :
- la première est de tenter quand même une "réparation complète", le problème est de choisir la sauvegarde sur laquelle travailler, et de savoir quels normalisations faire (éviter qu'elles ne "mettent le souk") : tables d'équivalence des noms ? normalisation des lieux ? traiter les personnes citées comme des membres à part entière de la généalogie ?
- la seconde est de plonger dans les gedcom en traquant tous les indices d'anomalie (_DCT, @I-xxx) et n'éliminer "que" les individus concernés par cela, ou ceux pour lequel les liens individu -> famille et famille -> ne sont pas en cohérence. Si j'y arrive il me suffira de rajouter les "quelques" individus ou événements manquant. Là le problème est de peaufiner la liste de ce qu'il faut considérer comme anomalie, y compris dans des versions anciennes de Généatique (j'ai repéré un enregistrement "1 _DCD 18/10/2012", à l'époque j'utilisais sans doute Généatique 2006 !)

Si quelqu'un a des infos pouvant m'aider pour explorer ces deux pistes je suis preneur... Mais inutile de me traiter de fou et d'inconscient je le pense déjà à moitié

Bonne journée

Pierre
 
Moderateur
Je ne crois pas que votre plantage vient du gedcom d'origine. Si celui-ci a des problèmes il donnera simplement une généalogie incomplète ou fausse mais une généalogie ou il y aura refus de ce gedcom (fichier non valide).
De plus je ne comprends pas très bien pourquoi vous voulez faire une sauvegarde sous forme d'un gedcom ; ce n'est pas le moyen le meilleur (mais c'est mieux que rien). Si votre généalogie s'ouvre bien, est visible sur l'écran et se comporte de façon normale, le plantage vient plutôt de la fonction gedcom. Avez vous essayé de restaurer le modèle utilisé pour créer le gedcom (bouton en bas à droite de la fenêtre de l'export gedcom). Attention, après un "Restaurer" il faut généralement modifier le nom proposé pour le fichier .ged généré.
 
Membre
Bonjour

La raison pour laquelle je suis "habitué" au Gedcom, c'est que pendant longtemps je n'ai utilisé que Geneweb, et il m'a fallu convertir mes fichiers pour les utiliser avec Généatique. Comme j'ai pratiqué la saisie de programmes sur gros ordinateurs (Fortran, PL1, SAS), je suis peu sensible à la "convivialité" des dialogues. et surtout pour avoir suivi le débat BULL/IBM j'ai acquis une méfiance profonde à l'égard des solutions "propriétaires" . Ce sont les possibilités de la cartographie qui m'ont fait m'intéressent à Généatique.

Pour ce qui est de la base qui plante à présent, je l'utilise peu souvent mais depuis longtemps. Depuis octobre 2012 (dates les plus anciennes apparaissant dans les enregistrements 1 _DCT) j'y ai fait ces derniers mois des normalisations de noms de lieux (c'est une des grandes faiblesses de Geneweb de ne pas les gérer), mais également des ajouts d'individus. Par contre, originellement, il est vrai que la base vient d'un Gedcom créé par Geneweb

Il va falloir que je fouille dans mes archives (y compris dans le disque dur d'un ordinateur que je n'utilise plus) pour voir quand ces erreurs sont apparues. En parlant de cela voici 2 lignes trouvées dans la table des noms
Nom &gt
&lt sans
Et pourtant je consulte cette base sans problèmes (il est vrai que je n'ai jamais pensé à faire des recherches sur ces 2 noms :) )

Ce qui me parait le plus probable c'est que dans le passé tous les logiciels de Généalogie ont été assez laxixtes sur la lecture de fichiers Gedcom. Mais au fil des versions soit les programmeurs considèrent certaines propriétés comme assurées (et quand ce n'est pas le cas le système plante), soit ils mettent en place des contrôles supplémentaires pour les vérifier et des procédures automatiques censées les corriger (mais parfois le remède est un peu trop "automatique"). D'où mon appréhension à mettre en oeuvre des contrôles plus restrictifs

Pierre
 
Membre actif
Est-ce que ce sont des blancs soulignés ou des "underscore" ? pour le savoir, je pense qu'il suffit d'importer le fichier dans le bloc-note qui ne connaît sans doute pas le caractères soulignés, ou dans word et enregistrer une copie en texte et relire le résultat.
Si ce sont des "underscore", est-ce que ces tags ne sont pas des tags persos ?
Par contre, le tirets dans les numéros d'individus sont effectivement bizarre. D'où vient ce gedcom? de généatique ou d'une autre source ?
 
Membre
Bonjour

J'avance, j'avance... Je viens d'exhumer une version ancienne de ma généalogie et je refais pas à pas les manipulations, en scrutant à chaque fois les Gedcom
AL1493":y3k8oep1 a dit:
Est-ce que ce sont des blancs soulignés ou des "underscore" ? pour le savoir, je pense qu'il suffit d'importer le fichier dans le bloc-note qui ne connaît sans doute pas le caractères soulignés, ou dans word et enregistrer une copie en texte et relire le résultat.
D'une part par blanc souligné j'entends précisément underscore (en fait j'ai commencé à toucher à l'informatique à la période où il fallait proscrire les termes anglophones et les remplacer par des mots francophones - j'en ai gardé les termes d'alors :wink: ). Et d'autre part c'est bien avec Word (ou plutôt Open Office) que je travaille (en fait je change simplement le suffixe .ged en .txt)
AL1493":y3k8oep1 a dit:
Si ce sont des "underscore", est-ce que ces tags ne sont pas des tags persos ?
Si présisément. Dans les gedcom il y a des "tags" _DCT, _CHV, _REL qui ne sont pas dans la norme Gedcom 5.5 et que Généatique utilise (_DCT c'est pour noter la date où une fiche a été modifiée). Je ne sais pas s'ils existent dans une norme Gedcom plus récente, mais en tout cas ce ne sont pas des anomalies.
AL1493":y3k8oep1 a dit:
Par contre, le tirets dans les numéros d'individus sont effectivement bizarres. D'où vient ce gedcom? de généatique ou d'une autre source ?
Chaque fois que j'ai fait une importation de gedcom il s'agit de fichiers venant de Geneweb, et dans l'"exhumation d'une version ancienne de ma généalogie" à laquelle je fais allusion il n'y a pas ces tirets. C'est pourquoi une erreur venant de Geneweb est exclue (si c'était le cas cela se saurait, jusqu'à la fin de ce mois de novembre 2014 c'est Geneweb qu'utilise le site généanet).

La version "avec tirets" ne peut venir que de manipulations par Généatique (version 2013 ou peut-être 2006 si la version 2013 n'était pas encore commercialisée en octobre 2012). Et j'ai déjà repéré cette version avec tirets lors d'une coupure brutale de courant. Ce que je n'ai pas encore repéré, c'est le moment où ces tirets sont apparus (j'ai pour les dernières semaines plusieurs sauvegardes à examiner)

Cordialement

Pierre
 
Membre expert
Plusieurs choses :
- Ne jamais utiliser un traitement de texte type word pour gérer un gedcom. Il vous colle un tas de choses invisibles pour sa propre gestion. Il faut utiliser un éditeur comme Notepad++ gratuit, en français, et qui permet une foule de traitements.
- Les caractères que vous évoquez (&lt et &gt) sont des caractères d'échappement en html : &lt = less than = < (chevron ouvrant), &gt = greater than = > (chevron fermant). Si ces caractères apparaissent, c'est qu'il y a un problème d'encodage quelque part.
- Les balises (je préfère ce terme à tag) gedcom commençant par le caractère de soulignement "_xxx" sont toujours non standards. C'est à cela qu'on les reconnait. Celles que vous évoquez sont :
_DCT = Date de création = balise propriétaire de généatique
_CHV = Cohérence validée = idem
_REL = Relation = idem
 
Membre
Bonjour

OK pour les trois "balises" que j'ai repérées dans mon fichier Gedcom, y en-a-t-il d'autres classiques et utiles à connaitre ?
Et je n'avais pas identifié les caractères html, merci pour l'information
En revanche je ne suis pas tout à fait d'accord avec la première proposition, je pense pouvoir contourner le problème avec Word tant que les lignes restent courtes (bien inférieures aux 80 caractères des cartes perforées :wink: )
phicome":1n8gnm67 a dit:
- Ne jamais utiliser un traitement de texte type word pour gérer un gedcom. Il vous colle un tas de choses invisibles pour sa propre gestion. Il faut utiliser un éditeur comme Notepad++ gratuit, en français, et qui permet une foule de traitements.
- J'ai utilisé des logiciels du type Notepad dans le passé, je m'étais heurté à l'époque à une limitation mémoire. cette limite a-t-elle été sensiblement remontée depuis ?
- J'utilise Open Office pour "lire" le fichier Gedcom, et quand je le réécris c'est en format .txt, (même si le logiciel attire mon attention sur le fait que je vais "perdre" plein de choses précieuses :lol: ) . D'accord, je ne peux plus voir les balises <CR> et <LF> qui marquent les fins de ligne, et dans l'opération "Rechercher et remplacer" je vais avoir du mal pour introduire un saut de ligne dans l'expression de remplacement ; si Notepad permet de le faire je vais surement l'utiliser.

Mais... je compte dans un premier temps remplacer simplement "1 SOUR" par "1 NOTE" (lors de la création d'un fichier Gedcom, on a un paramètre "Style des notes" qui donne le choix entre "Intégrées aux notes" ou "dans des sections indépendantes" - et idem pour le "Style des sources" d'ailleurs - donc je pense que ça doit marcher)

En fait j'ai beaucoup progressé dans la compréhension du problème. J'ai déniché une personne de ma généalogie qui a "-1 frères et soeurs", résultat obtenu avec la version 1.1.5 que j'ai chargée ce matin, et Généatique manipule mon dossier sans broncher.

Photo à l'appui dans la soirée sur l'autre fil que j'ai ouvert sur le sujet

Pierre
 
Membre expert
Très vite :
Ne pas confondre Notepad, une daube fournie avec windows, qui existe depuis la nuit des temps et Notepad++ (les + sont importants) qui est pratiquement un EDI (Environnement de Développement Intégré) et qui permet de coder en html, en C, en JS, en..., et qui gère parfaitement les expressions régulières, utiles lors du bricolage d'un gedcom.
Perso j'ouvre un gedcom de 850 000 lignes sans aucun souci, simultanément avec d'autres applications (excel).
 
Membre
phicome":265db12w a dit:
Ne pas confondre Notepad, et Notepad++ (les + sont importants) qui est pratiquement un EDI (Environnement de Développement Intégré)
Effectivement j'ai confondu ! Javascript et C... ce n'est pas pour moi mais pour le reste ça peut me tenter

pdebreu":265db12w a dit:
J'ai déniché une personne de ma généalogie qui a "-1 frères et soeurs", résultat obtenu avec la version 1.1.5 que j'ai chargée ce matin, et Généatique manipule mon dossier sans broncher.

Photo à l'appui dans la soirée sur l'autre fil que j'ai ouvert sur le sujet
C'est fait, c'est ici : http://forum.guide-genealogie.com/viewtopic.php?f=1&t=23580&p=90420&e=90420

Bonne soirée

Pierre
 
Membre
Bonsoir

Je reviens à mon fil initial, car je pense avoir trouvé une piste pour résoudre mon problème ; mais il me manque encore une étape.

Ce que je constate :
- que ce soit dans le cas de mes individus venant de Geneweb via un Gedcom, ou dans le cas de familles créées avec "père inconnu", on voit apparaitre dans les graphiques des cadres blancs, associés à des "individus" comprenant un minimum d'information : champs tous à blanc y compris les champs nom et prénom, s e x e indéterminé ;
- toutefois il y a aussi des différences, que ce soit dans les champs "parentèles" des individus voisins de ces cases, ou quand on clique sur la case en question ou sur les cases voisines (ouverture de la boite de dialogue pour saisir le nom, changement de couleur des fiches...) ; il y a donc quelque part une autre variable qui n'est pas positionnée de la même manière

Ce que je pense être la solution :
- personnellement je gère des fichiers "à taille humaine"et aller rechercher tous les enfants naturels venant du Gedcom n'est pas une tâche insurmontable
- si dans chacun de ces cas je me positionne sur cet individu supprimer cet "individu père", si j'élimine d'abord tous ses liens avec les autres individus et si pour finir j'élimine cet individu père, je devrais pouvoir rétablir une situation identique à ce qu'elle aurait été si j'avais tout construit au sein de Généatique (au besoin j'élimine aussi momentanément le lien de l'enfant naturel avec sa mère, puis je le rétablis en fin d'opération)

Mon point de blocage est de retrouver mes individus à corriger :
- si par la commande "Statistiques..." j'essaie de faire un tableau quelconque, tel qu'une simple "Répartition H/F", sur l'ensemble le plus large possible ("Toute la généalogie", pas de suppression d'événements après 1900 etc), le tableau se fait sur une partie des enregistrements de la base ; ainsi sur une mini-base de 50 fiches, les tableaux statistiques ne portent jamais sur plus de 33 individus, et je ne vois pas quel critère a été utilisé pour faire cette restriction
- via la commande "Liste sélective de personnes, événements, sources" je n'ai pas trouvé comment compter les unions où le mari est inconnu (ou a un nom à blanc...)

Quelqu'un peut-il me dépanner ? Merci

Pierre
 
Moderateur
pdebreu":1vd5r6r2 a dit:
...Quelqu'un peut-il me dépanner ? Merci
...
Vous êtes "plongé" dans votre problème et votre question vous semble compréhensible mais même en relisant j'ai un peu de mal ... Je crois comprendre que vous rechercher les maris manquants ou fantômes ... ?
- Il faut déjà faire la différence entre "pas de conjoint (pas d'union)" et "case du conjoint en blanc". Dans le premier cas, quand vous cliquez sur la case en blanc, Généatique vous présente la fenêtre de création d'une union ; dans le second cas, l'union est déjà créée mais il n'y a aucun texte saisi pour ce conjoint. Il est assez simple de lister ces conjoints créés mais sans aucune saisie ; il suffit de faire une recherche par critères en laissant vide le champ nom et prénom ; en tête de liste apparaîtront des nom-prénoms vides, avec éventuellement le nom du conjoint. Si il n'y a pas de conjoint il s'agit d'une fiche isolée vide. En double cliquant sur ces lignes, vous irez sur la fiche concernée et vous pourrez soit la compléter soit la supprimer.
Donc déjà faire le point avec cette méthode. Si il y a beaucoup de fiches concernées, on essaiera de faire une liste sélective ne contenant que ces personnes.
Pour ce qui est de vos "généalogies à taille humaine", ce n'est pas sans risques car vous n'avez pas une vue globale de votre généalogie et cela risque de vous amener à faire des fusions qui sont toujours des exercices périlleux. Je préfère de beaucoup un seul fichier pour ma généalogie, sauf si la taille dépasse, disons, 100000 fiches, auquel cas j'envisagerais de séparer deux grosses branches qui semblent avoir très peu de fiches en commun.
 
Membre expert
pdebreu":3h04a2l9 a dit:
D'accord, je ne peux plus voir les balises <CR> et <LF> qui marquent les fins de ligne, et dans l'opération "Rechercher et remplacer" je vais avoir du mal pour introduire un saut de ligne dans l'expression de remplacement ; si Notepad permet de le faire je vais surement l'utiliser.
Notepad ++ le permet
 
Haut