• Bienvenue sur le forum de généalogie avec Généatique,

    Si vous avez du mal à vous connecter, faites une demande de réinitialisation de mot de passe : Réinitialiser mon mot de passe

Blocage de la recherche de doublons

La recherche de doublons sur mon gros fichier actif (plus de 700 000 personnes) se bloque toujours au même niveau, à 8001 index explorés sur plus d'un million d'entrées d'index explorées (1 074 925); la barre d'avancement est figée et la r'echerche arrêtée; voir capture de cet écran figé en pièce jointe.
J'espérais pourtant que cette erreur (déjà ancienne de plusieurs semaines) aurait disparu après la réparation de mon problème de marqueur (voir le fil de discussion/Marqueurs), suite à la suppression des deux fichiers 'corrompus" config.ema et undo.adb dans mon dossier (selon message de Morgan de ce jour à 9h45).
Y aurait-il encore queque fichier corrompu dans mon très gros dossier, ou bien ce blocage en recherche de doublon provient-il d'autre chose ?
 
Fichiers joints
  • écran recherche doublons anormal.JPG
    écran recherche doublons anormal.JPG
    158.7 KB · Affichages: 10
J'ai lancé avec succès une recherche de doublons avec 4 options de recherche simultanées soit les 3 précédentes qui fonctonnaient bien (1er prénom seulement, dates cohérentes sur un siècle, personnes modifiée après aôut 2018) plus l'option "avec un lieu en commun". La recherche a été très lente (durée totale pour 701 619 personnes et 1 075 884 entrées d'index explorées : plus de 19 heures !) et s'est terminée sur les résultats suivants: 113 "pages" (electroniques ) de résultats (soit environ 700 pages imprimables), avec un taux de doublons possibles à examiner enfin tombé à 0,8 % , soit 10 fois moins qu'avec l'essai précédent, ce qui prouve que le choix de l'option "même lieu" est bien discriminante. Pour autant, l'examen manuel détaillé (sur une vintaine de pages) des groupes de personnes proposées comme possibles doublons montre que l'on peut sans doute diviser encore par 10 ce taux de doublons , dès lors qu'on doit éliminer les faux doublons suivants encore subsistants: frères (ou soeurs) germains (de mêmes parents) dont l'un des deux est morts en bas-âge et dont le prénom est repris dans une naissance suivante; homonymes (cohérents en date et lieux) dont les parents sont différents; homonymes (cohérents en dates et lieux) ayant des conjoints différents avec des dates de naissance d'enfants se recouvrant, donc excluant qu'ils'agisse d'un remariage après veuvage.
De telle sorte que le taiux réel de vrais doublons dans mon gros fichier est probablement de l'ordre de (ou inférieur à) un pour mille seulement ..., ce qui ferait tout de mme quelques 500 vrais doublons, que je souhaiterait évidemment voir apparaître automatiquement par le processus de recherche de doublons de G 2026 Prestige... alors que ce processus continue (pour moi seul ? ou pour tout le monde ?) de bloquer lorsqu'on active l'une ou/et l'autre des options les plus discriminantes: même père, même mère, même conjoint;
Toujours donc dans l'attente d'une résolution de ce problème: est-il lié au fait que je n'utilise pas les équivalences de noms ni de prénoms dans mes préférences pour ma généalogie ??
La liste des résultats de la recherche de doublons ne peut pas actuellement (avec G 2026 Prestige v 2.0) être enregistrée par Généatique sauf à passer page par page par le traitement de texte de Généatique (via l'icône d'impression en haut à droite de l'afficahge de la page de résultats); lorsqu'on obtient plus d'une centaine de "pages" de résultats de doublons possibles, soit dans mon cas plus de mille pages imprimables (car une seule "page' " de résultats au format du processus de recherche de doublons apporte entre 6 et 25 pages imprimables), cette 'sauvegarde' de l'ensemble des résultats sde doublons possibles est pourtant fort souhaitable, voire indispensable, avant toute tentative de fusion d'un ou plusieurs vrais doublons, ce que je souhaite faire 'à tête reposée" à partir d'un tel fichier de sauvegarde des résultats, car ce processus processus est fort délicat et fort long si on le traite au fil de l'eau par le processus final de compariaison et fusion proposé par Généatique; en effet, après chaque fusion réalisée, Généatique recalcule toute la liste de résultats ainsi mise à jour à cause d'un seul dédoublonnage réalisé. Bref, je demande à CDIP de bien vouloir considérer (et développer) l'ajout d'une icône d'enregistrement (ou de sauveagarde) de l'esnsemble des résultats de la recherche des doublons, à côté de l'icône d'impression qui ne renvoie que la page en cours au traitement de textede Gébnéatique permettant l'enregistrement.
Merci pour vos réactions et commentaires
 
La liste des résultats de la recherche de doublons ne peut pas actuellement (avec G 2026 Prestige v 2.0) être enregistrée par Généatique sauf à passer page par page par le traitement de texte de Généatique (via l'icône d'impression en haut à droite de l'afficahge de la page de résultats); lorsqu'on obtient plus d'une centaine de "pages" de résultats de doublons possibles, soit dans mon cas plus de mille pages imprimables (car une seule "page' " de résultats au format du processus de recherche de doublons apporte entre 6 et 25 pages imprimables), cette 'sauvegarde' de l'ensemble des résultats sde doublons possibles est pourtant fort souhaitable, voire indispensable, avant toute tentative de fusion d'un ou plusieurs vrais doublons, ce que je souhaite faire 'à tête reposée" à partir d'un tel fichier de sauvegarde des résultats, car ce processus processus est fort délicat et fort long si on le traite au fil de l'eau par le processus final de compariaison et fusion proposé par Généatique; en effet, après chaque fusion réalisée, Généatique recalcule toute la liste de résultats ainsi mise à jour à cause d'un seul dédoublonnage réalisé. Bref, je demande à CDIP de bien vouloir considérer (et développer) l'ajout d'une icône d'enregistrement (ou de sauveagarde) de l'esnsemble des résultats de la recherche des doublons, à côté de l'icône d'impression qui ne renvoie que la page en cours au traitement de textede Gébnéatique permettant l'enregistrement.
Merci pour vos réactions et commentaires
J'ai réussi les essais de recherche de doublons avec l'option "même nom de conjoints" à condition d'y ajouter l'option "ayant pour nom UNTEL", ce qui restreint la reherche à un petit nombre de personnes (et doc d'entrées d'index beaucoup plus faible; mille à 3000 personnes seulement portant le même pom parmi les plus fréquents de mon dossier: BELLON ou BERENGER ou CHARIGNON, etc.); la recherche de doublons démarre assez lentement et souvent avec zero doublons pendant quelques minutes, puis se termine normalement au bout de 3 à 6 minutes , en affichant une seule page de résultats, comportant le plus souvent uniquement des faux doublons (parents différenets et/ou prénomdu conjont différent, et dates distantes de plusieurs décennies) et exceptionnellement un vrai doublon (à examiner de près avant une possible fusion).
Les anomalies citées comme "blocage" ou plantage apprent du logiciel sont donc peut-être dues à une combinatoire explosive sur les noms de personnes lorque la recherche porte sur l'ensemble du dossier ? bref, je ne m'explique toujours pas exactement pourquoi la recherche de doublons par Généatique 2026 se plante avec certaines options discriminantes (et bien sélectives) comme "même nom de conjoint" ou "même nom de père" ou "même nom de mère", lorqu'on ne restrient pas le nombre d'entrées d'index à explorer.
 

gratuit

Retour
Haut