compute error minirosetta v 1.40

Výskum a vývoj nových algoritmov a metód pre predpovedanie proteínových štruktúr z proteínových reťazcov

Moderátor: Moderátori

Badyho
Príspevky: 4
Dátum registrácie: Št Nov 13, 2008 1:08 pm

compute error minirosetta v 1.40

Príspevok od používateľa Badyho »

Od 6.11.2008(od spustenia minirosetty v 1.40) dochadza v rosette k tymto chybam:
1. Vypocet sa po 90 percentach spomali a procesorovy casstupa, prubeh v percentach stupa po 0.001 v priebehu 10-20 sekund, dokonci za sa zastavi okolo 10 minut.
2. spracovavanu ulohu dokonci az po 7 a viac hodinach
3. ulohu samo zrusi

vo vsetkych tychto pripadoch s najvacsou pravdepodobnostou uvidite vo svojich vysledkoch computer error

nieje to chyba vo vasom pocitaci. Podla fora rosetty:
http://boinc.bakerlab.org/rosetta/forum ... hp?id=4474
je tento problem vsade.(na tomto fore mozete hlasit problemy-ak viete anglicky)
Admini rosetty o tomto probleme uz vedia staci len cakat kedy to opravia.

Podla ludi ktory pisali na toto forum ak sa objavy to, ze sa po 90 percentach spomali alebo zastavi vypocet, mozete nechat bezat vypocet dalej ale vo vysledkoch vam pravdepodobne ukaze computer erorr alebo ak zrusite ulohu prevezme ju iny comp a ten s najvacsou pravdepodobnostou zahlasi computer erorr.

takze ostava len cakat kym to rosetta opravy.
Používateľov profilový obrázok
Duro Kotulic Bunta
Príspevky: 1906
Dátum registrácie: St Feb 07, 2007 3:00 pm
Bydlisko: Stupava
Kontaktovať používateľa:

Re: compute error minirosetta v 1.40

Príspevok od používateľa Duro Kotulic Bunta »

Vitaj na fore Badyho a vdaka za uzitocne informacie...
It is by logic that we prove, but by intuition that we discover. [J.H. Poincaré, mathematician]
A man who knows how to be alone is never lonely. [Osho]
Badyho
Príspevky: 4
Dátum registrácie: Št Nov 13, 2008 1:08 pm

Re: compute error minirosetta v 1.40

Príspevok od používateľa Badyho »

A novinky:

podla toho isteho fora je problem v tom, ze minirosetta v 1.40 pozaduje viac fyzickej pamete a na virtualnu pamet skoro neberie ohlad. Takze cim viac pamete fyzickej moze pouzit rosetta tym skor dokonci ulohu.

Neviem kde sa to v boinc manageru presne nastavuje ale vsimol som si, ze v menu nastaveni/predvolby/vyuziti procesoru/use at most: ak som tam mal 90 percent pracoval procesor na jednej ulohe, ak som to znizil na 80 percent vtedy zacal moj 2 jadrovy procesor pracovat aj na druhej ulohe.(ak viete ako a kde sa to presne nastavuje poucim sa-problem je, ze verzia ktoru mam nieje prelozena kompletne a takisto niesom odbornik na pocitace)(a mam Windows Vista)

Tak ci tak v 1.40 pozaduje viac casu a viac vyuzitia pamete, a hlavne ulohy, ktore maju v nazve:jacob, sarel, alebo cislo 4704. Su to velmi zlozite proteiny preto vsetkeho viac(to som sa docital).
Dalej rosetta zacala pracovat na tom aby bol minimalny cas spracovania ulohy 3 hodiny a maximalny 6 hodiny. Takze treba pocitat s tym, ze vypocty rosetty sa pravdepodobne predlzia. Cim lepsi model molekuly tym viac casu a viac vykonu procesora.(to je pravdepodobne ich odpoved na to, ze niektore pocitace spracovavali minirosettu 1.40 aj 15 hodin-snazia sa to optimalizovat-asi)
Používateľov profilový obrázok
mbs
Príspevky: 155
Dátum registrácie: Po Jún 23, 2008 11:15 am
Bydlisko: Dolný Ohaj

Re: compute error minirosetta v 1.40

Príspevok od používateľa mbs »

Ahoj,

k nastaveniu procesora sa vyjadrit neviem; ja mam 100% - ked nepracujem, nech maka - 24" iMac s C2D CPU E8235 @2.80GHz, 4GB RAM, MacOS 10.5.5.
Dalej mam nastavene Leave in memory while suspended, Switch between applications every: 60 minutes.
V Rosette mam Target CPU run time: 1 day.

Ale co som spozoroval a mi vadi:
- nereaguje na suspend (Rosetta nie je jediny projekt)
po "virtualnom" suspend mi vlastne bezia 3 az 4 ulohy naraz; ked ju chce manager znovu aktivovat, tak nereaguje (message timeout), takze ju zabije a spusti znova. Ked to urobi privelakrat, uloha predcasne konci (too many exits).
- chyby vo vypoctoch
ERROR: NANs occured in hbonding!
ERROR:: Exit from: src/core/scoring/hbonds/hbonds_geom.cc line: 763
...nuz a ked mi skape vypocet po >50000 sekundach, tak sa mi to nepaci... Takze momentalne ma Rosetta suspend... :-/
Badyho
Príspevky: 4
Dátum registrácie: Št Nov 13, 2008 1:08 pm

Re: compute error minirosetta v 1.40

Príspevok od používateľa Badyho »

Zdar,

k nastaveniu procesora sa vyjadrit neviem; ja mam 100% - ked nepracujem, nech maka - 24" iMac s C2D CPU E8235 @2.80GHz, 4GB RAM, MacOS 10.5.5.
Dalej mam nastavene Leave in memory while suspended, Switch between applications every: 60 minutes.
V Rosette mam Target CPU run time: 1 day.

100 percent neriesi nic zniz to na 70.(use at most...procesoroveho casu) Target CPU time znamena, ze ked po 1 dni-24 hodinach(od obdrzania ulohy) pocitac nedokonci ulohu uz v spracovavani pokracovat nebude a ta uloha bude priradena inemu pocitacu. Riesenie: Target CPU neobmedzuj. Nebudu tvojmu pocitacu pridelovane ulohy, ktore su narocne na cas alebo na vykon.Na ulohu ktoru dostane tvoj comp,bude minimalne 14 dni.

Ale co som spozoroval a mi vadi:
- nereaguje na suspend (Rosetta nie je jediny projekt)
po "virtualnom" suspend mi vlastne bezia 3 az 4 ulohy naraz; ked ju chce manager znovu aktivovat, tak nereaguje (message timeout), takze ju zabije a spusti znova. Ked to urobi privelakrat, uloha predcasne konci (too many exits).
Ked si ju suspendoval, preco ju chces znovu spustit? Ale problem je, ze ked suspendujes nieco tak vacsinou to trva viac ako 24 hodin kym to server napr. rosetty spracuje, ak ked to chces obnovit pocitaj s minimalne 24 hodinamy. Tieto veci nejde ukoncit v jednej minute.

- chyby vo vypoctoch
ERROR: NANs occured in hbonding!
ERROR:: Exit from: src/core/scoring/hbonds/hbonds_geom.cc line: 763
...nuz a ked mi skape vypocet po >50000 sekundach, tak sa mi to nepaci... Takze momentalne ma Rosetta suspend... :-/

Chyby vo vypoctoch:
Precitaj si moj prvy prispevok, tie chyby niesu! v tvojom compe, chyby su v rosette - spustili novu verziu(1.40) a tu nemali poriadne vyladenu. Vsimol som si, ze nieco s tym uz urobily pretoze na mojom compe sa uz neobjavili tieto chyby.
Používateľov profilový obrázok
mbs
Príspevky: 155
Dátum registrácie: Po Jún 23, 2008 11:15 am
Bydlisko: Dolný Ohaj

Re: compute error minirosetta v 1.40

Príspevok od používateľa mbs »

Badyho napísal:100 percent neriesi nic zniz to na 70.(use at most...procesoroveho casu)
Badyho,
mam na to troska iny nazor.
"Processor usage: Use at most" je prave pre obmedzenie vyuzitia procesora - povolujem mu "zabit" masinu na 100%, cize ho neobmedzujem.
Ked ho obmedzim na 70%, tak vypocty potrvaju dlhsie (ale klesne teplota CPU - na to je to urcene, AFAIK).
Badyho napísal:Target CPU time znamena, ze ked po 1 dni-24 hodinach(od obdrzania ulohy) pocitac nedokonci ulohu uz v spracovavani pokracovat nebude a ta uloha bude priradena inemu pocitacu. Riesenie: Target CPU neobmedzuj. Nebudu tvojmu pocitacu pridelovane ulohy, ktore su narocne na cas alebo na vykon.Na ulohu ktoru dostane tvoj comp,bude minimalne 14 dni.
"Target CPU time" znamena "kolko casu chcem, aby jednotlivu ulohu pocital". Takze ja chcem, aby dana uloha bezala 24 hodin (CPU). Nema to nic spolocne s casom odoslania ci deadline, ale iba s "dlzkou" WU (nie fyzickou, ale mnozstvom vypoctov). BTW, to je prave to, co ohlasili, ze idu zmenit (default 6, minimum 3, IIRC).
A neda sa neobmedzit "Target CPU", pouzivam maximum (24 hodin); infite run time [chvalabohu] neimplementovali. ;-)
A myslim ze deadline je 10 dni, nie 14.
Badyho napísal:Ked si ju suspendoval, preco ju chces znovu spustit? Ale problem je, ze ked suspendujes nieco tak vacsinou to trva viac ako 24 hodin kym to server napr. rosetty spracuje, ak ked to chces obnovit pocitaj s minimalne 24 hodinamy. Tieto veci nejde ukoncit v jednej minute.
Rosetta nie je jediny projekt na danej masine, takze sa uplatni nastavenie "Switch between applications every" a podiely jednotlivych projektov ("Resource share").
IOW, suspend urobi boinc manager, nie ja manualne, a minirosetta 1.40 na to zvysoka ... a bezi si dalej.
Takze potom mi bezia trebars dve ulohy Einstein a dve ulohy Rosetta.
A ked ju nasledne boinc manager chce zasa pustit dalej, tak minirosetta 1.40 ignoruje "resume" message a tak ju mily manager zabije (ved neodpoveda, tak co uz) a spusti znova...
Badyho napísal:Precitaj si moj prvy prispevok, tie chyby niesu! v tvojom compe, chyby su v rosette - spustili novu verziu(1.40) a tu nemali poriadne vyladenu.
Ale ved ja presne o tom pisem - o verzii 1.40 - je buggy a nemam ju rad, pockam na lepsiu...
Badyho napísal:Vsimol som si, ze nieco s tym uz urobily pretoze na mojom compe sa uz neobjavili tieto chyby.
Ja som si zasa nevsimol, ze by vypustili verziu 1.41, takze pokojne pockam...


Viem, ze sa neviem vyjadrovat (kockaty programator), takze ma pripadne niekto opravte (ak sa mylim), alebo to skuste napisat zrozumitelne po slovensky, nie mojou pocitacovou hatlaninou... :(
gabberattack
Príspevky: 1315
Dátum registrácie: Ut Feb 06, 2007 1:35 am
Bydlisko: Mooresville, NC
Kontaktovať používateľa:

Re: compute error minirosetta v 1.40

Príspevok od používateľa gabberattack »

Mne tiez hadze nejake chyby na vsetkych masinach, ktore mam - a je ich dost. :-) Neriesil som to zatial - chybnych skonci asi 5% jednotiek, takze az taka velka strata to nie je a az to dufam skoro poriesia, updatne sa verzia sama na vsetkych masinach. MBS pise spravne definiciu nastaveni - target CPU time je cas urceny na vypocet jednej jednotky masinou - rataju sa mozne konfiguracie a cim dlhsi je target CPU time, tym viac kalkulacii pre danu jednotku sa spravi. Povedzme, ze masina X za 3 hodiny vypocita 2 mozne konfiguracie bielkoviny. Po tych 3 hodinach moze odoslat vysledky spat na server, alebo pocita dalej a hlada lepsiu konfiguraciu (ak je target CPU time nastaveny na viac ako 3 hodiny) a potom odosle viac moznych konfiguracii. Ja som dal target CPU u seba na 3 hodiny, lebo mam dost vela slabsich masin (alebo vykonnych masin s obmedzenym Processor usage na 35% - vacsinou notebooky aby sa nehriali), ktore sa pripajaju raz az dvakrat do tyzdna, takze by pri dlhsom target CPU mohli zmeskat deadline.
-gabberattack-
Keep The Panic!

...a Windows Vista
padá na Mesiaci
6x pomalšie!
Badyho
Príspevky: 4
Dátum registrácie: Št Nov 13, 2008 1:08 pm

Re: compute error minirosetta v 1.40

Príspevok od používateľa Badyho »

No viem, ze nic neviem. Ked sa objavily problemy s rosetou na strankach boinc.sk NIC, na tomto fore NIC a tak som sa pokusil informovat ludi ktorym to robilo takisto problemy o dovodoch preco. Hladal som a hladal a nasiel som to v anglićtine. A nie vsetci vedia anglicky a tak som sa pokusil prelozit v com je problem. Ako som napisal niesom odbornik na pocitace, pisal som co robi moj notas. Tak diky za poucenie, pokusim sa nastavit moj system podla toho.
A ked uz o tom tak vela viete a mate prehlad tak by ste mohli o problemoch informovat a nie cakat na niekoho ineho.
gabberattack
Príspevky: 1315
Dátum registrácie: Ut Feb 06, 2007 1:35 am
Bydlisko: Mooresville, NC
Kontaktovať používateľa:

Re: compute error minirosetta v 1.40

Príspevok od používateľa gabberattack »

Badyho napísal:No viem, ze nic neviem. Ked sa objavily problemy s rosetou na strankach boinc.sk NIC, na tomto fore NIC a tak som sa pokusil informovat ludi ktorym to robilo takisto problemy o dovodoch preco. Hladal som a hladal a nasiel som to v anglićtine. A nie vsetci vedia anglicky a tak som sa pokusil prelozit v com je problem. Ako som napisal niesom odbornik na pocitace, pisal som co robi moj notas. Tak diky za poucenie, pokusim sa nastavit moj system podla toho.
A ked uz o tom tak vela viete a mate prehlad tak by ste mohli o problemoch informovat a nie cakat na niekoho ineho.
Ja osobne som vdacny za info od Teba - klesol mi vykon a tak uz viem preco. Rosetta je znama tym, ze rychlo uvolnuje nove verzie - preto som reagoval tak, ze som vlastne nespravil nic a cakam na novu verziu.
Akonahle zistis dalsie novinky, postni ich sem, ja napriklad nemam vzdy cas vyhladavat novinky a na to nase forum je. Za kazdy takyto post patri vdaka - dufam preto, ze budes nadalej aktivny.
-gabberattack-
Keep The Panic!

...a Windows Vista
padá na Mesiaci
6x pomalšie!
Napísať odpoveď