[IGIRTC-91] CREAM v. 1.14.1 - certificazione Created: 24/Jul/12 Updated: 28/Sep/12 Due: 03/Sep/12 Resolved: 28/Sep/12 |
|
Status: | Closed |
Project: | IGI-MW - Release-Testing-Certification |
Component/s: | None |
Affects Version/s: | None |
Fix Version/s: | None |
Security Level: | Public (Visbile by non-authn users.) |
Type: | Task | Priority: | Major |
Reporter: | Doina Cristina Duma | Assignee: | Sara Bertocco [X] (Inactive) |
Resolution: | Fixed | Votes: | 0 |
Labels: | IGI-Testing | ||
Remaining Estimate: | 2 weeks | ||
Time Spent: | Not Specified | ||
Original Estimate: | 2 weeks |
Description |
CREAM v. 1.14.1 certificazione (EMI 2) task: repositories da usare - vedi info in: https://wiki.italiangrid.it/twiki/bin/view/IGIRelease/IGITestCert#Certification_Repositories creare twiki con report test & certificazione in: Pre-Certification report: |
Comments |
Comment by Doina Cristina Duma [ 28/Sep/12 ] |
rilasciato con EMI 2 Update 3 (25.09.2012) |
Comment by Lisa Zangrando [ 05/Sep/12 ] |
ho controllato e vanno bene. |
Comment by Doina Cristina Duma [ 05/Sep/12 ] |
Lisa, dal nostro punto di vista consideriamo certificata la versione 1.14.1 potresti guardare i test report attacati al task savannah, e i link menzionati li? |
Comment by Doina Cristina Duma [ 04/Sep/12 ] |
Se in realtaà i test vanno - per adesso va bene cosi. Quando abbiamo tempo sarebbe da provare l'ultima versione. |
Comment by Sara Bertocco [X] (Inactive) [ 04/Sep/12 ] |
Sto usando una versione vecchia (patchata per l'autenticazione) cream_test-1.7-1 mentre e` uscita la 1.8 che comunque dovrebbe avere l'autenticazione con le chiavi e qualche test in piu`. |
Comment by Doina Cristina Duma [ 04/Sep/12 ] |
regression - vuole dire la regression testsuite non è stata usata? |
Comment by Doina Cristina Duma [ 04/Sep/12 ] |
avevo visto che i greci hanno rilasciato una nuova versione della testsuite - stai usando quella? |
Comment by Sara Bertocco [X] (Inactive) [ 04/Sep/12 ] |
Ho fatto il test a mano e sembra andare, ci deve essere qualche problema su come sono gestiti degli sleep. Penso si possa mettere certified, io non ho trovato altri errori. Non sono ancora fatti i regression test. |
Comment by Doina Cristina Duma [ 04/Sep/12 ] |
non vedo commenti di Sergio spiegando il mottivo dell'esclusione di quei test Possiamo considerare..."certificato"? |
Comment by Sara Bertocco [X] (Inactive) [ 04/Sep/12 ] |
Per quanto riguarda i functionality tests vedo che Sergio per pbs ha |
Comment by Doina Cristina Duma [ 03/Sep/12 ] |
ho attacato i reports al task, ma ancora non ho messo Certified. domani sentiamoci per vedere se si puo o no dichiarare certified. |
Comment by Lisa Zangrando [ 03/Sep/12 ] |
va bene, grazie. |
Comment by Doina Cristina Duma [ 03/Sep/12 ] |
Oggi compilo i report per mettere in certified. La sett scorsa abbiamo detto che verifichiamo l'update su una versione - per PBS gia' fatta su SL5, basta cosi. Intanto stasera attachero i report neccessari (Lisa, metto in certified anche se mancano pezzi fino a domani, ci saranno dei link per quello che manca ancora) |
Comment by Danilo Nicola Dongiovanni [ 03/Sep/12 ] |
io avevo segnato ste amcchine da creare. cert-45.cnaf.infn.it SL 6 Epel EMI CREAM PBS 2.0.0 TBD CREAM EMI2 |
Comment by Sara Bertocco [X] (Inactive) [ 03/Sep/12 ] |
All'inizio si era detto: |
Comment by Sara Bertocco [X] (Inactive) [ 03/Sep/12 ] |
Provo a riassumere le cose da fare. Cristina se vedi altro fammi sapere.
Per i bug da fissare sono ancora da verificare su LSF: |
Comment by Doina Cristina Duma [ 31/Aug/12 ] |
grazie mille! Grazie di nuovo e buone ferie! |
Comment by Sergio Traldi [X] (Inactive) [ 31/Aug/12 ] |
Ciao Cristina e Sara, Ho fatto tutti i regression anche quello del DB modificando momentaneamente i file sul cream-30 che stao certificando, ora lo ho ripristinato, ma come si puo' vedere ha funzionato. La password messa per i grant che ho scritto omit e' quella nel file services/glite-creamce di cream-20, utente glite. Non ho preparato i 2 documenti di certification e testing, ma basta solo riempirli, tutto il resto e' stato fatto.
Qui c'e' tutto quello fatto: Se avete problemi o urgenze chiamatemi e vedo di collegarmi, per dettagli non scritti. |
Comment by Lisa Zangrando [ 30/Aug/12 ] |
perfetto! grazie, |
Comment by Doina Cristina Duma [ 30/Aug/12 ] |
ok! grazie, allora andiamo avanti con il resto. Per i conformance tests - l'errore sulla validazione delle info Glue 2.. non è un vero errore. l"information.publication" è un valore "inventato":
get_capabilities = echo information.publication per cui metteremo nel report un commento del tipo "fake error caused by the use of an invented value by the developers of the glite-info-provider-service, not yet present in the Glue2 specifications" |
Comment by Lisa Zangrando [ 30/Aug/12 ] |
Ciao Cristina, abbiamo verificato il fix del bug #95480 usando lo stesso test e CE della Sara (vedi sopra) e funziona. [dorigoa@cream-51 ~]$ glite-wms-job-status https://wmslb01.grid.hep.ph.ic.ac.uk:9000/7qWEPr3xUMiyz3gSfrqsGA ======================= glite-wms-job-status Success ===================== Status info for the Job : https://wmslb01.grid.hep.ph.ic.ac.uk:9000/7qWEPr3xUMiyz3gSfrqsGA
[dorigoa@cream-51 ~]$ glite-wms-job-output --list-only https://wmslb01.grid.hep.ph.ic.ac.uk:9000/7qWEPr3xUMiyz3gSfrqsGA Connecting to the service https://wms01.grid.hep.ph.ic.ac.uk:7443/glite_wms_wmproxy_server ================================================================================ JOB GET OUTPUT OUTCOME JobId: https://wmslb01.grid.hep.ph.ic.ac.uk:9000/7qWEPr3xUMiyz3gSfrqsGA
[dorigoa@cream-51 ~]$ glite-wms-job-output --dir . https://wmslb01.grid.hep.ph.ic.ac.uk:9000/7qWEPr3xUMiyz3gSfrqsGA Connecting to the service https://wms01.grid.hep.ph.ic.ac.uk:7443/glite_wms_wmproxy_server ================================================================================ JOB GET OUTPUT OUTCOME Output sandbox files for the job: ================================================================================ [dorigoa@cream-51 ~]$ ll /home/dorigoa/dorigoa_7qWEPr3xUMiyz3gSfrqsGA |
Comment by Lisa Zangrando [ 29/Aug/12 ] |
confermo, le istruzioni di Sergio sono corrette e risolvono il problema. |
Comment by Sergio Traldi [X] (Inactive) [ 29/Aug/12 ] |
Si l'idea la ho ed e' questa. e riprovare se funziona bene sei a cavallo se non funziona dopo aver fatto quello: entra in cream-17 ti chiede di restartare il lim solo sul master e dici di no A quel punto dovrebbe funzionare il tutto. |
Comment by Sergio Traldi [X] (Inactive) [ 29/Aug/12 ] |
Per Cream developers: Nelle descrizioni dei regression sarebbe bene specificare meglio cosa fare per tutti i bug. Mi spiego meglio. Dice di creare un pool account OK Pero' se invece che fare la certificazione io la fa Danilo e Fabio, credo loro si trovino in difficolta' a interpretare lanciare dei comandi assincroni jobStart e jobCancel. Quindi chiederei di specificare meglio il da farsi se dal CE o dalla UI e come avete fatto voi a precertificarlo. Ciao |
Comment by Lisa Zangrando [ 29/Aug/12 ] |
Ho seguito le istruzioni di Sergio ed applicate a cream-18 ma non funzionano come sperato. I job sottomessi da cream-18 vanno in running e poi done-failed con la solita "reason=127". Invece una sleep sottomessa manualmente dalla stessa macchina funziona. La cosa strana e' che non vengono nemmeno restituiti i due file relativi allo stdout e stderr del job. E' come se LSF non riuscisse a gestire il trasferimento di file. Ciao e grazie, |
Comment by Sergio Traldi [X] (Inactive) [ 29/Aug/12 ] |
Link utile a tutti: |
Comment by Doina Cristina Duma [ 29/Aug/12 ] |
il pb è che ci sono troppe "sconosciute" - provando verificare l'errore che avevi Lisa ha visto che non funziona più LSF. Da quando.... non si sa. |
Comment by Sara Bertocco [X] (Inactive) [ 29/Aug/12 ] |
Ma se il problema fosse stato quello come ha fatto il job ad andare in done-ok? Se c'e` il problema dell'/etc/resolv.conf mal configurato i job falliscono. Verificate un po' se adesso il fix va, oppure verifico io quando torno. Poi il mio commento e` del 9 agosto, prima dell'update del DNS. |
Comment by Doina Cristina Duma [ 29/Aug/12 ] |
quindi - il pb è che le macchine cream-* non hanno ben configurate e mi sembrava che era una cosa che da tempo mi ricordavo che abbiamo dicusso:
Ho modificato il /etc/resolv.conf della cream-17 che non risolveva i pn.pd per cui non esportava le directory di lsf ai prod-wn-001/2/3. Adesso Job <701072>, User <tst01>, Project <default>, Command </bin/sleep 60> Summary of time in seconds spent in various states by Wed Aug 29 11:29:18 Consgilo caldamente di aleineare tutte le macchine dal punto di vista rete. |
Comment by Doina Cristina Duma [ 29/Aug/12 ] |
non penso serve spostare niente, ma capire meglio. |
Comment by Lisa Zangrando [ 29/Aug/12 ] |
Ciao Cristina, grazie per le informazioni. grazie, |
Comment by Doina Cristina Duma [ 28/Aug/12 ] |
per LSF, quello che riesco vedere à: Job <701064>, User <tst01>, Project <default>, Status <EXIT>, Queue <cert>, Com SCHEDULING PARAMETERS: ce sembra essere un pb con la macchina. dal punto di vista LSF sembrerebbe andare: |
Comment by Doina Cristina Duma [ 28/Aug/12 ] |
Ciao Lisa, hai visto il commento con i problemi riscontrati da Sara? Grazie, |
Comment by Doina Cristina Duma [ 28/Aug/12 ] |
ok, continua con quello che è rimasto, grazie. |
Comment by Sergio Traldi [X] (Inactive) [ 28/Aug/12 ] |
Eccomi, |
Comment by Doina Cristina Duma [ 27/Aug/12 ] |
qual'è lo stato della certificazione? |
Comment by Sara Bertocco [X] (Inactive) [ 09/Aug/12 ] |
A me il fix non funziona. Lo avete provato solo su pbs o anche su lsf? (non so se si usa codice differente). [root@cream-20 ~]# grep SANDBOX_TRANSFER_METHOD /etc/glite-ce-cream/cream-config.xml Lanciato un job: ; ; [bertocco@cream-12 task31337]$ cat bug95480.jdl ; [bertocco@cream-12 task31337]$ glite-wms-job-status https://wmslb01.grid.hep.ph.ic.ac.uk:9000/HhAI6eJU6zcSBAiVqRSBIA ======================= glite-wms-job-status Success ===================== Status info for the Job : https://wmslb01.grid.hep.ph.ic.ac.uk:9000/HhAI6eJU6zcSBAiVqRSBIA
[bertocco@cream-12 task31337]$ glite-wms-job-output https://wmslb01.grid.hep.ph.ic.ac.uk:9000/HhAI6eJU6zcSBAiVqRSBIA Connecting to the service https://wms01.grid.hep.ph.ic.ac.uk:7443/glite_wms_wmproxy_server ================================================================================ JOB GET OUTPUT OUTCOME No output files to be retrieved for the job: ================================================================================ |
Comment by Lisa Zangrando [ 08/Aug/12 ] |
Ciao Sara, |
Comment by Sara Bertocco [X] (Inactive) [ 08/Aug/12 ] |
Il messaggio che ricevo dal wms e`: Connecting to the service https://wms01.grid.hep.ph.ic.ac.uk:7443/glite_wms_wmproxy_server ================================================================================ JOB GET OUTPUT OUTCOME No output files to be retrieved for the job: ================================================================================ |
Comment by Sara Bertocco [X] (Inactive) [ 08/Aug/12 ] |
Per cert-41 non c'e` il certificato host, sanctorum mi dice: Per i test di update e configure-update non mi pare siano ancora state decise le macchine perche` aspettiamo il parere di Danilo sull'uso di quelle del testbed giusto? Ho iniziato i test dei bug attaccati alla patch su SL5. ; |
Comment by Sara Bertocco [X] (Inactive) [ 07/Aug/12 ] |
Per gli unit test c'e` il link alla versione 1.14.0 perche` glite-ce-common-java cui si riferiscono non e` cambiato in questa versione. |
Comment by Sergio Traldi [X] (Inactive) [ 03/Aug/12 ] |
Ciao, PARTE COMUNE Ci sono gia' tutti i log da me prodotti. |
Comment by Doina Cristina Duma [ 31/Jul/12 ] |
test install a PD test update a CNAF - verificare esistenza 4 macchine (2SL5, 2SL6 + qualche WN per torque) con Danilo |
Comment by Doina Cristina Duma [ 31/Jul/12 ] |
|
Comment by Doina Cristina Duma [ 31/Jul/12 ] |
allora - direi che possiamo cominciare anche la certificazione del CREAM 1.14.1 - per l'Update di Settembre
|