ProblÃ¨me MÃ©moire

sdesbure · June 24, 2009, 4:45pm

Bonjour,
je dÃ©veloppe une application qui rÃ©cupÃ¨re des infos d’un fichier XML
Dans le fichier, un rÃ©seau et des connexions sont dÃ©crits
Une connexion est composÃ©e d’un ou plusieurs chemins
Un chemin est composÃ© d’une ou plusieurs cross-connections.
Une cross-connexions est attachÃ© Ã un Ã©quipement.

J’ai mis en place une relation Has Many Through entre les connexions et
les Ã©quipements via les cross connexions.

J’ai une mÃ©thode qui calcule l’impact de la mise hors tension d’un
Ã©quipement. Selon le placement de la cross connexion dans le chemin, la
connexion sera plus ou moins impactÃ©e.

Au dÃ©marrage de mon appli, sans rien lancÃ© comme vue, j’utilise 72 Mo
RAM (avec ruby 1.8.7 entreprise edition x64 et webrick comme serveur et
en mode production).
J’utilise authlogic pour la gestion de l’identitÃ© et active scaffold
pour montrer les listes (sauf celle de l’accueil)
Afficher la page d’acceuil (contenu essentiellement statique sauf une
liste des des fichiers XML) me fait passer Ã 550Mo RAM !
AprÃ¨s ce calcul d’impact, je passe Ã 1Go Ram utilisÃ©e.
Quand je reviens sur ma page d’accueil, je passe Ã 1,5Go.
Re calcul d’impact, je repasse Ã 1,6Go.
En me baladant dans les diffÃ©rentes vue (rendues la plupart par Active
Scaffold), j’arrive sans problÃ¨me Ã 2,5Go de RAM utilisÃ©e.
De plus, l’affichage des pages se fait assez lentement (une page avec
trÃ¨s peu de donnÃ©es met 20s Ã s’afficher alors que les logs parlent
d’1,4s…)

J’ai pas mal de before_filter pour authlogic, pensez vous que cela peut
jouer ?

Merci d’avance si vous avez des idÃ©es/conseils Ã me donner

PS : j’ai essayÃ© d’utiliser bleak_house mais il ne marche qu’avec ruby
1.8.6 et j’ai ruby 1.9 ou jruby ou ruby 1.8.7…

sdesbure · June 24, 2009, 11:22pm

Bonjour Sylvain,

Une page qui met 20 secondes à s’afficher, je regarde direct :

si j’ai bien mes “add_index” sur toutes mes clés étrangères dans
mes migrations
si je fais bien mes “include” quand je manipule mes ActiveRecord

Ceci dit, dans les logs en environnement de dév, un oubli d’include
saute aux yeux.

S’il s’agit vraiment d’un problème de volumétrie, je cherche d’abord à
dénormaliser mes relations : stocker un raccourci sur un modèle, ce
qui oblige à synchroniser cette donnée (via des callbacks). Dans ton
cas, si j’ai bien lu, un équipement n’appartient qu’à une seule
connexion. On peut songer y coller un “connection_id”.

En ultime recours, je fais mes requêtes à la main…

Enfin, je te conseille d’opter pour autre chose que Webrick (je n’ai
pas de benchmarks sous la main pour appuyer ce que je pense de
Webrick…). Personnellement, j’utilise Mongrel pour le dév, Phusion
Passenger (aka mod_rails) pour la prod.

Julien

On 24 juin, 16:45, Sylvain D. [email protected]

sdesbure · June 25, 2009, 9:03am

Bonjour Julien et merci pour ta rÃ©ponse,
mes commentaires dans le texte :

Meshak wrote:

Bonjour Sylvain,

Une page qui met 20 secondes ï¿½ s’afficher, je regarde direct :

surtout sur les 20 secondes, j’ai rien dans le log sur les 18 premiÃ¨res
(que la RAM et le proc qui s’affole). Par contre j’ai virÃ© les requÃªtes
SQL du Log

si j’ai bien mes “add_index” sur toutes mes clï¿½s ï¿½trangï¿½res dans
mes migrations

Oui Ã§a c’est fait (avec des contraintes de clefs car je suis sous
PostgreSQL)

si je fais bien mes “include” quand je manipule mes ActiveRecord

euh lÃ je suis pas sur de comprendre le “include”

Ceci dit, dans les logs en environnement de dï¿½v, un oubli d’include
saute aux yeux.

S’il s’agit vraiment d’un problï¿½me de volumï¿½trie, je cherche d’abord ï¿½
dï¿½normaliser mes relations : stocker un raccourci sur un modï¿½le, ce
qui oblige ï¿½ synchroniser cette donnï¿½e (via des callbacks). Dans ton
cas, si j’ai bien lu, un ï¿½quipement n’appartient qu’ï¿½ une seule
connexion. On peut songer y coller un “connection_id”.

malheureusement l’Ã©quipement peut appartenir Ã plusieurs connexions donc
c’est bien une relation many-to-many

En ultime recours, je fais mes requï¿½tes ï¿½ la main…

Enfin, je te conseille d’opter pour autre chose que Webrick (je n’ai
pas de benchmarks sous la main pour appuyer ce que je pense de
Webrick…). Personnellement, j’utilise Mongrel pour le dï¿½v, Phusion
Passenger (aka mod_rails) pour la prod.

j’ai utilisÃ© Webrick en exemple car j’avais testÃ© sous nginx + thin +
ruby 1.9.1 et nginx + “mod_rails” + ruby ee 1.8.7 et j’avais les mÃªmes
rÃ©sultats

Julien

On 24 juin, 16:45, Sylvain D. [email protected]

En voulant utiliser ruby-prof, j’ai par mÃ©garde dÃ©truit ma base. En la
recrÃ©ant et en ajoutant des fichiers, mon utilisation mÃ©moire est bien
moindre (je dÃ©passe pas le Go aprÃ¨s pas mal de manip…) et les temps de
rÃ©ponses ne dÃ©passe pas les 5secondes. J’ai regardÃ© les logs SQL de la
partie developement et hormis le fait que je fasse un update Ã chaque
fois sur les Users (ce qui posait peut Ãªtre problÃ¨me), je vois pas…
C’est vraiment bizarre.

sdesbure · June 25, 2009, 9:14am

Sylvain D. a Ã©crit :

si je fais bien mes “include” quand je manipule mes ActiveRecord

euh lÃ je suis pas sur de comprendre le “include”

Il s’agit de mettre en place du eager loading. Imagine que tu as un
modÃ¨le category avec n products. Tu as une vue ou tu liste tes
catÃ©gories avec les produits associÃ©s.

Dans ta vue tu vas faire un appel genre category.products.
Sans include pour chaque catÃ©gorie tu vas faire une requÃªte SQL pour
rÃ©cupÃ©rer les produits, ce qui est lourd et lent.

Au lieu de Ã§a tu peux le faire en amont dans ton contrÃ´leur avec un:
Category.find(:all, :include => :products)

–
Martin C. || fuse
http://www.noremember.org

sdesbure · June 25, 2009, 9:54am

Martin C. wrote:

Sylvain D. a Ã©crit :

si je fais bien mes “include” quand je manipule mes ActiveRecord

euh lÃ je suis pas sur de comprendre le “include”

Il s’agit de mettre en place du eager loading. Imagine que tu as un
modÃ¨le category avec n products. Tu as une vue ou tu liste tes
catÃ©gories avec les produits associÃ©s.

Dans ta vue tu vas faire un appel genre category.products.
Sans include pour chaque catÃ©gorie tu vas faire une requÃªte SQL pour
rÃ©cupÃ©rer les produits, ce qui est lourd et lent.

Au lieu de Ã§a tu peux le faire en amont dans ton contrÃ´leur avec un:
Category.find(:all, :include => :products)

–
Martin C. || fuse
http://www.noremember.org

Ouh lÃ j’Ã©tais pas rÃ©veillÃ© ce matin ;-). J’ai bien utilisÃ© les include
pour faire du eager loading quand j’en avais besoin.
Mais comme dit au dessus, depuis que la base est fraiche et reloadÃ©e
avec de nouvelles valeurs, il ne me semble plus avoir ce genre de
problÃ¨me…

sdesbure · June 25, 2009, 9:17am

2009/6/25 Sylvain D. [email protected]

si je fais bien mes “include” quand je manipule mes ActiveRecord

euh lÃ je suis pas sur de comprendre le “include”

Il parle des include ActiveRecord lors des diffÃ©rents select (find) [1]
avec
jointures: ces includes te permettent de faire du prefetch et donc
d’Ã©conomiser des requÃªtes et donc du temps de fetch lorsque tu
rÃ©utilises
ces rÃ©sultats.

Sinon Meshak va se faire fouetter en arrivant au bureau: avant de
dÃ©normaliser, ou pire de faire du SQL Ã la main, il faut optimiser avec
les
moyens d’active record, aka: les named_scope! Les named_scope, c’est la
vie
(Ã§a permet d’optimiser tes requÃªtes via ActiveRecord en agrÃ©geant les
contraintes les unes aux autres: la grande force, c’est que Ã§a reste une
seule requÃªte SQL en backend, quel que soit le nombre de named_scope que
tu
combines. De plus tu gardes toute la sÃ©mantique de ta requÃªte dans ton
code:
c’est juste dÃ©licieux! )

[1] find (ActiveRecord::Base) - APIdock (8Ã¨me sur les
params)

sdesbure · June 25, 2009, 10:09am

moyens d’active record, aka: les named_scope! Les named_scope, c’est la
vie
(Ã§a permet d’optimiser tes requÃªtes via ActiveRecord en agrÃ©geant les
contraintes les unes aux autres: la grande force, c’est que Ã§a reste une
seule requÃªte SQL en backend,
Ca optimise rien du tout, Ã§a permet d’Ãªtre un peu plus dry tout au plus,
jusqu’Ã ce que tu te rendes compte que chaque named_scope n’est utilisÃ©
que par une seule mÃ©thode

sdesbure · June 25, 2009, 9:57am

ook? ook! wrote:

Sinon Meshak va se faire fouetter en arrivant au bureau: avant de
dÃ©normaliser, ou pire de faire du SQL Ã la main, il faut optimiser avec
les
moyens d’active record, aka: les named_scope! Les named_scope, c’est la
vie
(Ã§a permet d’optimiser tes requÃªtes via ActiveRecord en agrÃ©geant les
contraintes les unes aux autres: la grande force, c’est que Ã§a reste une
seule requÃªte SQL en backend, quel que soit le nombre de named_scope que
tu
combines. De plus tu gardes toute la sÃ©mantique de ta requÃªte dans ton
code:
c’est juste dÃ©licieux! )

je connaissais pas et Ã§a a l’air super interressant !

Merci !

sdesbure · June 25, 2009, 10:49am

Bon j’ai fait deux trois tests pour essayer de comprendre mon problÃ¨me

L’affichage de ma page index (en requÃªte SQL, un select * d’un table (8
lignes), rÃ©cupÃ©ration de l’utilisateur pour authlogic, mise Ã jour des
infos de l’utilisateur, rÃ©cupÃ©ration de son groupe) prend 16s (en dev
pour pouvoir regarder ce qui se passe au niveau SQL et espÃ©rer savoir
par oÃ¹ je passe…)

Le select * de la table se fait au bout de 4s
le select / update user + groupe se fait 2s aprÃ¨s
Puis il ne se passe ‘rien’ (rien dans les logs) pendant 9s jusqu’Ã
l’affichage dans les logs de “Processing AspenTopoFilesController#index”
qui me dit
“Completed in 1140ms (View: 131, DB: 2071)”

J’ai mis des “puts” dans mon code pour voir et la fin du rendu de la vue
se fait en gros au mÃªme moment que le dernier select.
J’ai donc 4s de trou au dÃ©part et 9s de trou Ã l’arrivÃ©e ou je sais pas
ce qu’il se passe (avec ruby EE, il faut doubler ces temps…)

Au niveau plugin, j’utilise active scaffold (pas dans cette page),
authlogic, piggy_back (pas pour cette page), memory_test_fix (pour les
tests) et render_component (toujours pas pour cette page)

Quelqu’un aurait une idÃ©e pour avoir plus de dÃ©bug?

sdesbure · June 25, 2009, 10:54am

2009/6/25 Fernando P. [email protected]

moyens d’active record, aka: les named_scope! Les named_scope, c’est la
vie
(Ã§a permet d’optimiser tes requÃªtes via ActiveRecord en agrÃ©geant les
contraintes les unes aux autres: la grande force, c’est que Ã§a reste une
seule requÃªte SQL en backend,
Ca optimise rien du tout, Ã§a permet d’Ãªtre un peu plus dry tout au plus,
jusqu’Ã ce que tu te rendes compte que chaque named_scope n’est utilisÃ©
que par une seule mÃ©thode

C’est sÃ»r que si tu les utilises pas ou mal, Ã§a ne risque pas
d’amÃ©liorer
tes performancesâ€¦ Pour ma part, passer de 8 requÃªtes qui cumulent 3s
d’exÃ©cution en une seule de 120ms, y’a pas photo!

sdesbure · June 25, 2009, 11:01am

Le select * de la table se fait au bout de 4s
le select / update user + groupe se fait 2s aprÃ¨s
Puis il ne se passe ‘rien’ (rien dans les logs) pendant 9s jusqu’Ã
l’affichage dans les logs de “Processing AspenTopoFilesController#index”
qui me dit
“Completed in 1140ms (View: 131, DB: 2071)”

Sur quel OS es-tu ? Si c’et Linux (et OSX je suppose ?) lance un “top”
sur
une nouvelle fenÃªtre, tu verras quels sont les process qui tournent
pendant
ce temps lÃ .

gUI

–
Pour la santÃ© de votre ordinateur, prÃ©fÃ©rez les logiciels libres.
Lire son mail : http://www.mozilla-europe.org/fr/products/thunderbird/
Browser le web : http://www.mozilla-europe.org/fr/products/firefox/
Suite bureautique : http://fr.openoffice.org/

sdesbure · June 25, 2009, 11:05am

C’est sÃ»r que si tu les utilises pas ou mal, Ã§a ne risque pas
d’amÃ©liorer
tes performancesâ€¦ Pour ma part, passer de 8 requÃªtes qui cumulent 3s
d’exÃ©cution en une seule de 120ms, y’a pas photo!

Ca n’a rien mais alors rien Ã voir du tout avec les named scoped. Tu es
passÃ© du :include (qui fait une requÃªte par table ou un inner join dans
le cas le plus imple) Ã du :joins qui fait des jointures donc une seule
requÃªte.

sdesbure · June 25, 2009, 11:12am

Guillaume B. wrote:

Sur quel OS es-tu ? Si c’et Linux (et OSX je suppose ?) lance un “top”
sur
une nouvelle fenÃªtre, tu verras quels sont les process qui tournent
pendant
ce temps lÃ .

gUI

je suis sous Linux et j’avais un Top en //
C’est le script rails qui prend 100% du temps quasiment tout le long

sdesbure · June 25, 2009, 11:20am

C’est le script rails qui prend 100% du temps quasiment tout le long

Si c’est 100% de CPU, c’est pas un pb d’IO, donc pas de manque de RAM ni
d’attente de la BdD…

A la limite je verrais bien un bout de code pourri (style grosse
boucle)…

gUI

–
Pour la santÃ© de votre ordinateur, prÃ©fÃ©rez les logiciels libres.
Lire son mail : http://www.mozilla-europe.org/fr/products/thunderbird/
Browser le web : http://www.mozilla-europe.org/fr/products/firefox/
Suite bureautique : http://fr.openoffice.org/

sdesbure · June 25, 2009, 12:05pm

Ca existe pas un outil qui donne le chemin par ou on passe ?

Je connais trÃ¨s peu, mais il doit bien y avoir des outils de profiling
capable de te donner le temps passÃ© dans chaque controleur, action…

gUI

–
Pour la santÃ© de votre ordinateur, prÃ©fÃ©rez les logiciels libres.
Lire son mail : http://www.mozilla-europe.org/fr/products/thunderbird/
Browser le web : http://www.mozilla-europe.org/fr/products/firefox/
Suite bureautique : http://fr.openoffice.org/

sdesbure · June 25, 2009, 11:30am

Guillaume B. wrote:

C’est le script rails qui prend 100% du temps quasiment tout le long

Si c’est 100% de CPU, c’est pas un pb d’IO, donc pas de manque de RAM ni
d’attente de la BdD…

A la limite je verrais bien un bout de code pourri (style grosse
boucle)…

gUI

–
Pour la santÃ© de votre ordinateur, prÃ©fÃ©rez les logiciels libres.
Lire son mail : http://www.mozilla-europe.org/fr/products/thunderbird/
Browser le web : http://www.mozilla-europe.org/fr/products/firefox/
Suite bureautique : http://fr.openoffice.org/

Ben j’aimerais bien mais je la vois pas la boucle
Ca existe pas un outil qui donne le chemin par ou on passe ?

sdesbure · June 25, 2009, 1:13pm

Fabien J. wrote:

Ton parsing XML, tu as regardÃ© en le lanÃ§ant sÃ©paremment (console ou
autre)
si son execution est rapide ?
Les 2 choses que je vois possibles dans ton cas : un parsing XML trop
long
ou une instanciation de trop d’objets ActiveRecord.

Dans les outils de profiling, je ne sais pas si ruby-prof est encore
compatible avec les derniÃ¨res versions de rails, mais c’est un trÃ¨s bon
outil pour ton cas.

–
http://fabien.jakimowicz.com

Mon Parsing XML n’est lancÃ© qu’une fois de temps en temps (quand je crÃ©e
un onjet “fichierXMLM”). Autrement il n’est pas lancÃ©.

sdesbure · June 25, 2009, 2:42pm

Le 25 juin 09 à 10:49, Sylvain D. a écrit :

Le select * de la table se fait au bout de 4s
le select / update user + groupe se fait 2s après
Puis il ne se passe ‘rien’ (rien dans les logs) pendant 9s jusqu’à
l’affichage dans les logs de “Processing
AspenTopoFilesController#index”
qui me dit
“Completed in 1140ms (View: 131, DB: 2071)”

Vu le temps de réponse de ta requête, il doit y avoir un nombre de
ligne incroyable. Sachant que pour chaque ligne 1 objet est créer. Ca
peux expliquer le temps de création des objets après lecture de ta BDD.

–
Cyril M.

sdesbure · June 25, 2009, 12:48pm

2009/6/25 Sylvain D. [email protected]

gUI

Ton parsing XML, tu as regardÃ© en le lanÃ§ant sÃ©paremment (console ou
autre)
si son execution est rapide ?
Les 2 choses que je vois possibles dans ton cas : un parsing XML trop
long
ou une instanciation de trop d’objets ActiveRecord.

Dans les outils de profiling, je ne sais pas si ruby-prof est encore
compatible avec les derniÃ¨res versions de rails, mais c’est un trÃ¨s bon
outil pour ton cas.

–
http://fabien.jakimowicz.com

sdesbure · June 25, 2009, 2:46pm

Sylvain D. wrote:

J’ai essayÃ© ruby-prof sur ruby ee, Ã§a a l’air de marcher mais pas encore
comme je voudrais, il faut que je regarde

%self total self wait child calls name
22.73 0.10 0.10 0.00 0.00 5061
Pathname#chop_basename
6.82 0.14 0.03 0.00 0.11 912
Pathname#cleanpath_aggressive
2.27 0.01 0.01 0.00 0.00 2048 String#sub
2.27 0.15 0.01 0.00 0.14 912 Pathname#cleanpath
2.27 0.01 0.01 0.00 0.00 400
Rack::Lint::Assertion#assert
2.27 0.04 0.01 0.00 0.03 417 Array#each
2.27 0.01 0.01 0.00 0.00 1824
Pathname#initialize
2.27 0.01 0.01 0.00 0.00 87 Kernel#hash
2.27 0.01 0.01 0.00 0.00 680 Enumerable#any?
2.27 0.18 0.01 0.00 0.17 434 String#gsub
2.27 0.21 0.01 0.00 0.20 3
ActionView::Template#render_template
2.27 0.01 0.01 0.00 0.00 11651 String#==
2.27 0.04 0.01 0.00 0.03 1901 Class#new

Par contre le test dure 51 seconde et il trouve un process time de
440ms…