Question de requête sur la plage du CSES : requêtes sur les salaires

Aug 18 2020

J'essaie de résoudre ce problème :https://cses.fi/problemset/task/1144/

Étant donné un tableau de jusqu'à 200000éléments, ma tâche consiste à traiter jusqu'à des 200000requêtes, qui me demandent soit de mettre à jour une seule valeur dans le tableau, soit de trouver le nombre d'éléments entre a et b qui se trouvent dans une plage donnée (par exemple, une requête demanderait combien d'éléments des indices 1à 5sont dans la plage [2, 3]).

Mon idée actuelle est d'utiliser d'abord la compression d'index sur les valeurs du tableau donné (puisque les valeurs peuvent aller jusqu'à 10^9, donc conserver un tableau d'occurrence simple dépasserait les limites de stockage), puis conserver un autre tableau contenant le nombre d'occurrences de chaque compressé Numéro. Ensuite, le traitement et la mise à jour des requêtes pourraient être effectués à l'aide d'un arbre de segments de somme.

Cependant, j'ai rencontré un problème en essayant de mettre en œuvre cette approche. J'ai réalisé que la mise à jour d'une seule valeur de tableau m'obligerait à changer le tableau compressé.

Par exemple, étant donné un array [1, 5, 3, 3, 2], je définirais une fonction de compression Ctelle que

C[1] = 0;
C[2] = 1;
C[3] = 2;
C[5] = 3;

Ensuite, le tableau d'occurrences serait [1, 1, 2, 1], et le traitement des requêtes de somme serait efficace. Cependant, si on me demandait de mettre à jour une valeur, par exemple, de changer le troisième élément en 4, cela déséquilibrerait tout. La fonction de compression devrait changer pour

C[1] = 0;
C[2] = 1;
C[3] = 2;
C[4] = 3;
C[5] = 4;

ce qui m'obligerait à reconstruire mon tableau d'occurrences, ce qui entraînerait un temps de mise à O(N)jour.

Étant donné que Npeut aller jusqu'à 200000, mon approche actuelle ne fonctionnera pas assez efficacement pour résoudre le problème, bien que je pense avoir la bonne idée avec la compression d'index. Quelqu'un peut-il s'il vous plaît me diriger dans la bonne direction avec ma méthode?

Réponses

6 Telescope Aug 18 2020 at 06:09

Vous avez eu la bonne idée d'utiliser la compression d'index - une excellente idée ! Comme Nc'est uniquement jusqu'à 200000, conserver un tableau d'occurrences nécessitera tout au plus des 200000éléments pour les valeurs initiales du tableau donné, au lieu d' 10^9indices de tableau.

Selon vous, le problème que vous rencontrez est lorsque vous rencontrez de nouvelles valeurs lors du traitement des requêtes. Tu as raison; cela déséquilibrerait le tableau d'occurrences et obligerait les mises à jour à s'exécuter à O(N)temps. La solution à ce problème est juste une petite modification de votre méthode actuelle.

Pour résoudre le problème de rencontrer de nouvelles valeurs, nous pouvons simplement nous assurer que nous ne rencontrerons jamais de nouvelles valeurs. Nous pouvons le faire en lisant toutes les requêtes avant de construire l'arborescence des segments de somme. Cela se traduira par un maximum de N + 2*Qvaleurs uniques, ou 600000dans le pire des cas, ce qui est suffisant pour construire un tableau d'occurrences avec la limite de stockage de 512 Mo du problème. Après cela, un arbre de segment de somme sera en mesure de répondre efficacement à ces requêtes.

Donc, en fin de compte, une stratégie pour résoudre ce problème serait d'entrer chaque nombre unique, puis de construire une fonction de compression d'index, puis d'utiliser un arbre de segments de somme pour traiter efficacement les requêtes de somme.

À l'avenir, rappelez-vous que dans ce genre de questions de type requête-réponse, il pourrait être utile de lire TOUTES les entrées avant le précalcul . Bonne chance avec votre programme.

3 JacobSteinebronn Aug 18 2020 at 01:41

Tout d'abord, considérez le naïf : pour chaque mise à jour, mettez à jour le tableau. Pour chaque requête, parcourez l'ensemble du tableau et recueillez votre réponse. La complexité de cette solution a des O(n)mises à jour, des O(n)requêtes. Pas bien.

Nous pouvons proposer une solution différente avec une complexité temporelle sans doute pire, mais cela nous donne un indice sur le résultat final. Maintenez le tableau source à tout moment, mais conservez également une carte de hachage de valeur-> fréquence. Ensuite, lorsque vous mettez à jour, décrémentez la fréquence à l'ancienne valeur et incrémentez-la à la nouvelle valeur. Maintenant, pour les requêtes, parcourez toutes les valeurs de cette plage de requêtes et additionnez-les pour votre réponse. Cela entraîne O(1)des mises à jour et des O(r-l)requêtes, nous avons donc d'excellentes mises à jour mais des requêtes affreuses. Cependant, ce résultat peut être amélioré si nous pouvons simplement accélérer ces requêtes ! Entrez dans l' arborescence des segments .

Traditionnellement, vous construisiez une arborescence de segments jusqu'à ses feuilles lors de la création. Cependant, nous aimerions théoriquement un arbre de segments allant de 0-10^9, donc il n'y a absolument aucun moyen de générer autant de mémoire (et nous perdrions du temps en le faisant). Cependant, que se passe-t-il si nous créons un arbre de segments, mais pour chaque nœud, ses enfants sont implicites s'ils n'ont jamais été utilisés. Autrement dit, ne créez pas de nœuds enfants s'ils ne contiennent pas d'éléments . Cette structure est nommée, à juste titre, l' arbre de segment implicite. L'idée ici est d'implémenter votre arborescence de segments comme d'habitude, sauf que vous ignorez la partie du constructeur où vous initialisez vos enfants gauche et droit. Désormais, lorsque vous devez vous plonger dans vos enfants en raison d'une requête de plage partielle, vérifiez s'ils existent et, s'ils n'existent pas, créez-les. Sinon, puisque vous n'avez jamais eu besoin de les créer, supposez que la somme des valeurs de ces nœuds est 0 !

La solution finale est la suivante : créez une arborescence de segments de la valeur maximale interrogeable (si vous n'avez pas à répondre de manière interactive, envisagez d'enregistrer et d'analyser vos requêtes pour trouver la valeur r maximale, mais vous n'êtes pas obligé de le faire). Remarque pour en faire une arborescence de segments implicite . Maintenez le tableau source après chaque mise à jour et faites également des mises à jour ponctuelles sur votre arbre qui sera O(log(max value)). Les requêtes sont des requêtes de plage d'arborescence de segments régulières, elles seront donc O(log(max value)). Et ça y est !

1 rootkonda Aug 18 2020 at 03:21

Vous pouvez utiliser une structure de données basée sur des règles, qui contient des méthodes utiles telles que order_of_key() - qui renvoie un nombre d'éléments inférieur au nombre donné. Nous pouvons appeler cela deux fois comme getcnt(b+1) - getcnt(a) - qui donne le nombre d'éléments entre la plage donnée. Pour plus d'informations à ce sujet - vous pouvez consulter -https://codeforces.com/blog/entry/11080et aussihttps://gcc.gnu.org/onlinedocs/libstdc++/manual/policy_data_structures.html