• Bienvenue sur la nouvelle version du forum Guide de généalogie,

    Si vous avez du mal à vous connecter, faites une demande de réinitialisation de mot de passe : Réinitialiser mon mot de passe
  • Découvrez la nouvelle section du forum : Réalisations dans Généatique. Montrez et partagez vos créations d'arbres dans Généatique !
    Et participez au concours !

Recherche et comparaison de doublons.

Nouveau membre
Bonjour à toutes et tous,

Avez-vous une solution pour effectuer une recherche et comparaison de doublons plus rapidement ?

Notre ordinateur : Pentium4 3Ghz 512Mo DDR400Mhz
Notre logiciel : Geneatique 2006 (Le Meilleur) V.1.2.a

Notre base de données : 53525 personnes aujourd???hui.
(Nous effectuons une restructuration et mise à jour de table de duplication périodiquement)

Le problème rencontré : La recherche de doublons est lente et il est impossible de stopper l'exploration en cours de route pour exploiter le résultat déjà obtenu

Nous l???avons déjà utilisé et laissé fonctionner durant 72 heures, mais, vu la durée, nous avons voulu l???arrêter et exploiter la comparaison de doublons mais impossible d???arrêter l???exploration, nous avons dû arrêter le logiciel.

Ce jour, après quinze heures de recherche, 9900/99141 effectué ??? trois doublons trouvés ??? encore impossibilité d???arrêter l???exploration (ne réponds pas)

Avez-vous une solution, pour accélérer cette fonction d???une part, pour arrêter l???exploration en cours de route afin de comparer les doublons trouvés, d???autre part ?

Amitiés et restant à votre disposition,
 
Outre la taille de la base qui augmente le temps de recherche en progression géométrique sinon plus, les équivalences de noms/prénoms et aussi et surtout les choix du type 'Au moins un lieu commun', 'Recherche élargie ...', 'Rercherche phonétique ...', influent fortement sur les temps de recherche. Pour des bases de 20/30K personnes et au dessus c'est effectivement très long et donc il faut proscrire ces choix coûteux. Sans compter le temps de rafraichissement de la liste après un fusion. L'uc est très chargée, les accès au disque aussi, je pense que c'est normal.
Pour ma part avec les seuls choix 'premier prénom' et 'Même conjoint', il faut 10mn pour un base de 20k individus, une mem de 256Mo et un processeur à 600MHz, donc un vieux coucou!
Ma solution pour de grosses bases est de scinder alphabétiquement les recherches, en filtrant les noms comme A* ou DUPON* ou encore V*;W* et en n'optant pas pour ces choix contraignants, seuls 'premier prénom' et 'Même conjoint' sont utilisables. Mais il y a peut-être d'autres astuces ?
En ce qui concerne l'abandon le clic sur 'Arrêt de l'exploration', l'arrêt est rapide si j'utilise la méthode ci dessus et bien plus longue sinon (trop longue et on perd patience...), je pense que les fonctions recursirves de recherche en sont la cause.
 
Bonjour,

Comme le dit dfx, la recherche de doublons est forcément une opération longue à cause du parcours de la base à de nombreuses reprises.

Une recherche de doublons sur l'ensemble de la base n'est souvent pas utile car il y a beaucoup de recherches qui s'avèrent inutiles.

Pour accélérer il faut arriver à ne faire que les recherches utiles. Pour cela je passe par le dictionnaire de données et j'affiche la liste des patronymes avec leur fréquence. En classant sur la fréquence, on obtient les patronymes les plus utilisés, donc ceux sur lesquels on a le plus de risque d'avoir des doublons. Je faire ensuite des recherches sur un patronyme à la fois, ce qui est plus rapide.
On ne gagne peut-être pas en temps total pour arriver à rechercher tous les doublons mais cela semble moins monotone et peut se faire petit à petit.
Attention à faire des restructurations régulièrement, les fusions de doublons dé-structurent le dossier.

Cordialement

Michel P.
 
Bonjour,
Merci pour vos réponse. Je suis fort habitué à Généatique. Je constate seulement que je ne peux plus faire de recherches de doublons correctement.
Je fais bien attention de ne mettre qu'un patronyme, pas d'options suppléméntaires (A quoi servent elles alors ?), et malgré cela , quand il m'en a trouvé une centaine et que je cliques sur arréter, j'ai le sablier mais il continue ! Ma base est sans cesse restructurée, que faire vraiment ?
Il est vrai que mon patronyme comporte environ 5800 occurences et que quand je fais un choix sur la lettre A* je n'ai pas de problèmes, mais dans cette lettre j'ai peu de chances d'avoir des doublons...
A suivre avec d'autres idées de votre part.
Merci de votre attention
 
Bonjour à Tous,

La version 1.3 à venir dans quelques jours vous apportera plus de confort !
Encore un peu de patience ...
 

gratuit

Retour
Haut